GitHub项目
2025-12-22
GitHub项目
0
请注意,本文编写于 163 天前,最后修改于 162 天前,其中某些信息可能已经过时。

目录

Open-AutoGLM:开源手机智能助理框架
开源项目亮点
全流程自动化体验
懒人版快速安装
项目介绍
模型下载地址
环境准备
1. Python 环境
2. ADB (Android Debug Bridge)
3. Android 7.0+ 的设备或模拟器,并启用 开发者模式 和 USB 调试
4. 安装 ADB Keyboard(用于文本输入)
部署准备工作
1. 安装依赖
2. 配置 ADB
3. 启动模型服务
选项 A: 使用第三方模型服务
选项 B: 自行部署模型
4. 检查模型部署
使用 AutoGLM
命令行
Python API
远程调试
配置远程调试
在手机端开启无线调试
在电脑端使用标准 ADB 命令
设备管理命令
Python API 远程连接
远程连接问题排查
配置
自定义SYSTEM PROMPT
环境变量
模型配置
Agent 配置
Verbose 模式输出
支持的应用
可用操作
自定义回调
示例
二次开发
配置开发环境
运行测试
完整项目结构
常见问题
设备未找到
能打开应用,但无法点击
文本输入不工作
截图失败(黑屏)
windows 编码异常问题
交互模式非TTY环境无法使用
引用
自动化部署指南(面向 AI)
项目概述
部署前置检查
硬件环境
手机端配置
模型服务确认(二选一)
部署流程
阶段一:环境准备
阶段二:安装 Agent
阶段三:配置模型服务
阶段四:验证部署
异常处理
部署要点
命令速查

Open-AutoGLM:开源手机智能助理框架

开源项目亮点

Open-AutoGLM 是一个专为移动端设计的智能助理框架,它基于 AutoGLM 构建,能够多模态理解手机屏幕内容,并通过自动化操作实现用户意图。只需一句自然语言命令,系统便能分析当前界面、规划操作路径,并模拟人类点击、滑动、输入等行为,高效完成任务。

全流程自动化体验

系统通过 Android Debug Bridge (ADB) 控制设备,配合视觉语言模型进行界面感知,再结合任务规划模块,完整执行从识别到点击的每一个步骤。支持 WiFi 网络远程调试,让你随时随地控制设备,开发者亦可通过 API 接入,快速构建智能操作场景。

项目仓库地址:GitHub https://github.com/zai-org/Open-AutoGLM 更多内容参考项目地址

懒人版快速安装

你可以使用Claude Code,配置 GLM Coding Plan 后,输入以下提示词,快速部署本项目。

访问文档,为我安装 AutoGLM https://raw.githubusercontent.com/zai-org/Open-AutoGLM/refs/heads/main/README.md

项目介绍

Phone Agent 是一个基于 AutoGLM 构建的手机端智能助理框架,它能够以多模态方式理解手机屏幕内容,并通过自动化操作帮助用户完成任务。系统通过 ADB(Android Debug Bridge)来控制设备,以视觉语言模型进行屏幕感知,再结合智能规划能力生成并执行操作流程。用户只需用自然语言描述需求,如“打开小红书搜索美食”,Phone Agent 即可自动解析意图、理解当前界面、规划下一步动作并完成整个流程。系统还内置敏感操作确认机制,并支持在登录或验证码场景下进行人工接管。同时,它提供远程 ADB 调试能力,可通过 WiFi 或网络连接设备,实现灵活的远程控制与开发。

⚠️ 本项目仅供研究和学习使用。严禁用于非法获取信息、干扰系统或任何违法活动。请仔细审阅 使用条款

模型下载地址

ModelDownload Links
AutoGLM-Phone-9B🤗 Hugging Face
🤖 ModelScope
AutoGLM-Phone-9B-Multilingual🤗 Hugging Face
🤖 ModelScope

其中,AutoGLM-Phone-9B 是针对中文手机应用优化的模型,而 AutoGLM-Phone-9B-Multilingual 支持英语场景,适用于包含英文等其他语言内容的应用。

环境准备

1. Python 环境

建议使用 Python 3.10 及以上版本。

2. ADB (Android Debug Bridge)

  1. 下载官方 ADB 安装包,并解压到自定义路径
  2. 配置环境变量
  • MacOS 配置方法:在 Terminal 或者任何命令行工具里

    bash
    # 假设解压后的目录为 ~/Downlaods/platform-tools。如果不是请自行调整命令。 export PATH=${PATH}:~/Downloads/platform-tools
  • Windows 配置方法:可参考 第三方教程 进行配置。

3. Android 7.0+ 的设备或模拟器,并启用 开发者模式USB 调试

  1. 开发者模式启用:通常启用方法是,找到 设置-关于手机-版本号 然后连续快速点击 10 次左右,直到弹出弹窗显示“开发者模式已启用”。不同手机会有些许差别,如果找不到,可以上网搜索一下教程。
  2. USB 调试启用:启用开发者模式之后,会出现 设置-开发者选项-USB 调试,勾选启用
  3. 部分机型在设置开发者选项以后, 可能需要重启设备才能生效. 可以测试一下: 将手机用USB数据线连接到电脑后, adb devices 查看是否有设备信息, 如果没有说明连接失败.

请务必仔细检查相关权限

4. 安装 ADB Keyboard(用于文本输入)

下载 安装包 并在对应的安卓设备中进行安装。 注意,安装完成后还需要到 设置-输入法 或者 设置-键盘列表 中启用 ADB Keyboard 才能生效(或使用命令adb shell ime enable com.android.adbkeyboard/.AdbIMEHow-to-use)

部署准备工作

1. 安装依赖

bash
pip install -r requirements.txt pip install -e .

2. 配置 ADB

确认 USB数据线具有数据传输功能, 而不是仅有充电功能

确保已安装 ADB 并使用 USB数据线 连接设备:

bash
# 检查已连接的设备 adb devices # 输出结果应显示你的设备,如: # List of devices attached # emulator-5554 device

3. 启动模型服务

你可以选择自行部署模型服务,或使用第三方模型服务商。

选项 A: 使用第三方模型服务

如果你不想自行部署模型,可以使用以下已部署我们模型的第三方服务:

1. 智谱 BigModel

2. ModelScope(魔搭社区)

使用第三方服务的示例:

bash
# 使用智谱 BigModel python main.py --base-url https://open.bigmodel.cn/api/paas/v4 --model "autoglm-phone" --apikey "your-bigmodel-api-key" "打开美团搜索附近的火锅店" # 使用 ModelScope python main.py --base-url https://api-inference.modelscope.cn/v1 --model "ZhipuAI/AutoGLM-Phone-9B" --apikey "your-modelscope-api-key" "打开美团搜索附近的火锅店"

选项 B: 自行部署模型

如果你希望在本地或自己的服务器上部署模型:

  1. 按照 requirements.txtFor Model Deployment 章节自行安装推理引擎框架。

对于SGLang, 除了使用pip安装,你也可以使用官方docker:

shell
docker pull lmsysorg/sglang:v0.5.6.post1

进入容器,执行

pip install nvidia-cudnn-cu12==9.16.0.29

对于 vLLM,除了使用pip 安装,你也可以使用官方docker:

shell
docker pull vllm/vllm-openai:v0.12.0

进入容器,执行

pip install -U transformers --pre

注意: 上述步骤出现的关于 transformers 的依赖冲突可以忽略。

  1. 在对应容器或者实体机中(非容器安装)下载模型,通过 SGlang / vLLM 启动,得到 OpenAI 格式服务。这里提供一个 vLLM部署方案,请严格遵循我们提供的启动参数:
  • vLLM:
shell
python3 -m vllm.entrypoints.openai.api_server \ --served-model-name autoglm-phone-9b \ --allowed-local-media-path / \ --mm-encoder-tp-mode data \ --mm_processor_cache_type shm \ --mm_processor_kwargs "{\"max_pixels\":5000000}" \ --max-model-len 25480 \ --chat-template-content-format string \ --limit-mm-per-prompt "{\"image\":10}" \ --model zai-org/AutoGLM-Phone-9B \ --port 8000
  • SGLang:
shell
python3 -m sglang.launch_server --model-path zai-org/AutoGLM-Phone-9B \ --served-model-name autoglm-phone-9b \ --context-length 25480 \ --mm-enable-dp-encoder \ --mm-process-config '{"image":{"max_pixels":5000000}}' \ --port 8000
  • 该模型结构与 GLM-4.1V-9B-Thinking 相同, 关于模型部署的详细内容,你也以查看 GLM-V 获取模型部署和使用指南。

  • 运行成功后,将可以通过 http://localhost:8000/v1 访问模型服务。 如果您在远程服务器部署模型, 使用该服务器的IP访问模型.

4. 检查模型部署

模型服务启动后,可以使用检查脚本验证部署是否成功:

bash
python scripts/check_deployment_cn.py --base-url http://你的IP:你的端口/v1 --model 模型名称

脚本将发送测试请求并展示模型的推理结果,你可以根据输出判断模型部署是否正常工作。

基于给定的任务, 预期输出如下。如果思维链长度很短, 或者出现了乱码, 很可能是模型部署失败, 请仔细检查文档要求的配置和依赖。

<think>用户想要比较这个洗发水在京东和淘宝上的价格,然后选择最便宜的平台下单。当前在小红书app上,显示的是一个关于LUMMI MOOD洗发水的帖子。 我需要: 1. 先启动京东app,搜索这个洗发水 2. 查看京东的价格 3. 再启动淘宝app,搜索这个洗发水 4. 查看淘宝的价格 5. 比较价格后,选择最便宜的京东或淘宝下单 首先,我需要从当前的小红书界面退出,然后启动京东app。</think> <answer>do(action="Launch", app="京东")

参数说明:

  • --base-url: 模型服务地址(根据实际部署地址修改)
  • --model: 模型名称
  • --messages-file: 可选,指定自定义测试消息文件(默认使用 scripts/sample_messages.json)

使用 AutoGLM

命令行

根据你部署的模型, 设置 --base-url--model 参数. 例如:

bash
# 交互模式 python main.py --base-url http://localhost:8000/v1 --model "autoglm-phone-9b" # 指定模型端点 python main.py --base-url http://localhost:8000/v1 "打开美团搜索附近的火锅店" # 使用 API Key 进行认证 python main.py --apikey sk-xxxxx # 使用英文 system prompt python main.py --lang en --base-url http://localhost:8000/v1 "Open Chrome browser" # 列出支持的应用 python main.py --list-apps

Python API

python
from phone_agent import PhoneAgent from phone_agent.model import ModelConfig # Configure model model_config = ModelConfig( base_url="http://localhost:8000/v1", model_name="autoglm-phone-9b", ) # 创建 Agent agent = PhoneAgent(model_config=model_config) # 执行任务 result = agent.run("打开淘宝搜索无线耳机") print(result)

远程调试

Phone Agent 支持通过 WiFi/网络进行远程 ADB 调试,无需 USB 连接即可控制设备。

配置远程调试

在手机端开启无线调试

确保手机和电脑在同一个WiFi中,如图所示

{8DD6ED7E-FEC8-4AD7-A0C4-2267EF1E22D2}.png

在电脑端使用标准 ADB 命令

bash
# 通过 WiFi 连接, 改成手机显示的 IP 地址和端口 adb connect 192.168.1.100:5555 # 验证连接 adb devices # 应显示:192.168.1.100:5555 device

设备管理命令

bash
# 列出所有已连接设备 adb devices # 连接远程设备 adb connect 192.168.1.100:5555 # 断开指定设备 adb disconnect 192.168.1.100:5555 # 指定设备执行任务 python main.py --device-id 192.168.1.100:5555 --base-url http://localhost:8000/v1 --model "autoglm-phone-9b" "打开抖音刷视频"

Python API 远程连接

python
from phone_agent.adb import ADBConnection, list_devices # 创建连接管理器 conn = ADBConnection() # 连接远程设备 success, message = conn.connect("192.168.1.100:5555") print(f"连接状态: {message}") # 列出已连接设备 devices = list_devices() for device in devices: print(f"{device.device_id} - {device.connection_type.value}") # 在 USB 设备上启用 TCP/IP success, message = conn.enable_tcpip(5555) ip = conn.get_device_ip() print(f"设备 IP: {ip}") # 断开连接 conn.disconnect("192.168.1.100:5555")

远程连接问题排查

连接被拒绝:

  • 确保设备和电脑在同一网络
  • 检查防火墙是否阻止 5555 端口
  • 确认已启用 TCP/IP 模式:adb tcpip 5555

连接断开:

  • WiFi 可能断开了,使用 --connect 重新连接
  • 部分设备重启后会禁用 TCP/IP,需要通过 USB 重新启用

多设备:

  • 使用 --device-id 指定要使用的设备
  • 或使用 --list-devices 查看所有已连接设备

配置

自定义SYSTEM PROMPT

系统提供中英文两套 prompt,通过 --lang 参数切换:

  • --lang cn - 中文 prompt(默认),配置文件:phone_agent/config/prompts_zh.py
  • --lang en - 英文 prompt,配置文件:phone_agent/config/prompts_en.py

可以直接修改对应的配置文件来增强模型在特定领域的能力,或通过注入 app 名称禁用某些 app。

环境变量

变量描述默认值
PHONE_AGENT_BASE_URL模型 API 地址http://localhost:8000/v1
PHONE_AGENT_MODEL模型名称autoglm-phone-9b
PHONE_AGENT_API_KEY模型认证 API KeyEMPTY
PHONE_AGENT_MAX_STEPS每个任务最大步数100
PHONE_AGENT_DEVICE_IDADB 设备 ID(自动检测)
PHONE_AGENT_LANG语言 (cnen)cn

模型配置

python
from phone_agent.model import ModelConfig config = ModelConfig( base_url="http://localhost:8000/v1", api_key="EMPTY", # API 密钥(如需要) model_name="autoglm-phone-9b", # 模型名称 max_tokens=3000, # 最大输出 token 数 temperature=0.1, # 采样温度 frequency_penalty=0.2, # 频率惩罚 )

Agent 配置

python
from phone_agent.agent import AgentConfig config = AgentConfig( max_steps=100, # 每个任务最大步数 device_id=None, # ADB 设备 ID(None 为自动检测) lang="cn", # 语言选择:cn(中文)或 en(英文) verbose=True, # 打印调试信息(包括思考过程和执行动作) )

Verbose 模式输出

verbose=True 时,Agent 会在每一步输出详细信息:

================================================== 💭 思考过程: -------------------------------------------------- 当前在系统桌面,需要先启动小红书应用 -------------------------------------------------- 🎯 执行动作: { "_metadata": "do", "action": "Launch", "app": "小红书" } ================================================== ... (执行动作后继续下一步) ================================================== 💭 思考过程: -------------------------------------------------- 小红书已打开,现在需要点击搜索框 -------------------------------------------------- 🎯 执行动作: { "_metadata": "do", "action": "Tap", "element": [500, 100] } ================================================== 🎉 ================================================ ✅ 任务完成: 已成功搜索美食攻略 ==================================================

这样可以清楚地看到 AI 的推理过程和每一步的具体操作。

支持的应用

Phone Agent 支持 50+ 款主流中文应用:

分类应用
社交通讯微信、QQ、微博
电商购物淘宝、京东、拼多多
美食外卖美团、饿了么、肯德基
出行旅游携程、12306、滴滴出行
视频娱乐bilibili、抖音、爱奇艺
音乐音频网易云音乐、QQ音乐、喜马拉雅
生活服务大众点评、高德地图、百度地图
内容社区小红书、知乎、豆瓣

运行 python main.py --list-apps 查看完整列表。

可用操作

Agent 可以执行以下操作:

操作描述
Launch启动应用
Tap点击指定坐标
Type输入文本
Swipe滑动屏幕
Back返回上一页
Home返回桌面
Long Press长按
Double Tap双击
Wait等待页面加载
Take_over请求人工接管(登录/验证码等)

自定义回调

处理敏感操作确认和人工接管:

python
def my_confirmation(message: str) -> bool: """敏感操作确认回调""" return input(f"确认执行 {message}?(y/n): ").lower() == "y" def my_takeover(message: str) -> None: """人工接管回调""" print(f"请手动完成: {message}") input("完成后按回车继续...") agent = PhoneAgent( confirmation_callback=my_confirmation, takeover_callback=my_takeover, )

示例

查看 examples/ 目录获取更多使用示例:

  • basic_usage.py - 基础任务执行
  • 单步调试模式
  • 批量任务执行
  • 自定义回调

二次开发

配置开发环境

二次开发需要使用开发依赖:

bash
pip install -e ".[dev]"

运行测试

bash
pytest tests/

完整项目结构

phone_agent/ ├── __init__.py # 包导出 ├── agent.py # PhoneAgent 主类 ├── adb/ # ADB 工具 │ ├── connection.py # 远程/本地连接管理 │ ├── screenshot.py # 屏幕截图 │ ├── input.py # 文本输入 (ADB Keyboard) │ └── device.py # 设备控制 (点击、滑动等) ├── actions/ # 操作处理 │ └── handler.py # 操作执行器 ├── config/ # 配置 │ ├── apps.py # 支持的应用映射 │ ├── prompts_zh.py # 中文系统提示词 │ └── prompts_en.py # 英文系统提示词 └── model/ # AI 模型客户端 └── client.py # OpenAI 兼容客户端

常见问题

我们列举了一些常见的问题,以及对应的解决方案:

设备未找到

尝试通过重启 ADB 服务来解决:

bash
adb kill-server adb start-server adb devices

如果仍然无法识别,请检查:

  1. USB 调试是否已开启
  2. 数据线是否支持数据传输(部分数据线仅支持充电)
  3. 手机上弹出的授权框是否已点击「允许」
  4. 尝试更换 USB 接口或数据线

能打开应用,但无法点击

部分机型需要同时开启两个调试选项才能正常使用:

  • USB 调试
  • USB 调试(安全设置)

请在 设置 → 开发者选项 中检查这两个选项是否都已启用。

文本输入不工作

  1. 确保设备已安装 ADB Keyboard
  2. 在设置 > 系统 > 语言和输入法 > 虚拟键盘 中启用
  3. Agent 会在需要输入时自动切换到 ADB Keyboard

截图失败(黑屏)

这通常意味着应用正在显示敏感页面(支付、密码、银行类应用)。Agent 会自动检测并请求人工接管。

windows 编码异常问题

报错信息形如 UnicodeEncodeError gbk code

解决办法: 在运行代码的命令前面加上环境变量: PYTHONIOENCODING=utf-8

交互模式非TTY环境无法使用

报错形如: EOF when reading a line

解决办法: 使用非交互模式直接指定任务, 或者切换到 TTY 模式的终端应用.

引用

如果你觉得我们的工作有帮助,请引用以下论文:

bibtex
@article{liu2024autoglm, title={Autoglm: Autonomous foundation agents for guis}, author={Liu, Xiao and Qin, Bo and Liang, Dongzhu and Dong, Guang and Lai, Hanyu and Zhang, Hanchen and Zhao, Hanlin and Iong, Iat Long and Sun, Jiadai and Wang, Jiaqi and others}, journal={arXiv preprint arXiv:2411.00820}, year={2024} } @article{xu2025mobilerl, title={MobileRL: Online Agentic Reinforcement Learning for Mobile GUI Agents}, author={Xu, Yifan and Liu, Xiao and Liu, Xinghan and Fu, Jiaqi and Zhang, Hanchen and Jing, Bohao and Zhang, Shudan and Wang, Yuting and Zhao, Wenyi and Dong, Yuxiao}, journal={arXiv preprint arXiv:2509.18119}, year={2025} }

自动化部署指南(面向 AI)

本章节专为 AI 助手(如 Claude Code)设计,用于自动化部署 Open-AutoGLM。

如果你是人类读者,可以跳过本章节,按照上面的文档操作即可。


项目概述

Open-AutoGLM 是一个手机 Agent 框架:

  • 输入:用户的自然语言指令(如"打开微信发消息给张三")
  • 输出:自动操作用户的安卓手机完成任务
  • 原理:截图 → 视觉模型理解界面 → 输出点击坐标 → ADB 执行操作 → 循环

架构分为两部分:

  1. Agent 代码(本仓库):运行在用户电脑上,负责调用模型、解析动作、控制手机
  2. 视觉模型服务:可以是远程 API,也可以本地部署

部署前置检查

在开始部署前,请逐项向用户确认以下内容:

硬件环境

  • 用户有一台安卓手机(Android 7.0+)
  • 用户有一根支持数据传输的 USB 数据线(不是仅充电线)
  • 手机和电脑可以通过数据线连接

手机端配置

  • 手机已开启「开发者模式」(设置 → 关于手机 → 连续点击版本号 7 次)
  • 手机已开启「USB 调试」(设置 → 开发者选项 → USB 调试)
  • 部分机型需要同时开启「USB 调试(安全设置)」
  • 手机已安装 ADB Keyboard 应用(下载地址:https://github.com/senzhk/ADBKeyBoard/blob/master/ADBKeyboard.apk)
  • ADB Keyboard 已在系统设置中启用(设置 → 语言和输入法 → 启用 ADB Keyboard)

模型服务确认(二选一)

请明确询问用户:你是否已有可用的 AutoGLM 模型服务?

  • 选项 A:使用已部署的模型服务(推荐)

    • 用户提供模型服务的 URL(如 http://xxx.xxx.xxx.xxx:8000/v1)
    • 无需本地 GPU,无需下载模型
    • 直接使用该 URL 作为 --base-url 参数
  • 选项 B:本地部署模型(高配置要求)

    • 需要 NVIDIA GPU(建议 24GB+ 显存)
    • 需要安装 vLLM 或 SGLang
    • 需要下载约 20GB 的模型文件
    • 如果用户是新手或不确定,强烈建议选择选项 A

部署流程

阶段一:环境准备

bash
# 1. 安装 ADB 工具 # MacOS: brew install android-platform-tools # 或手动下载:https://developer.android.com/tools/releases/platform-tools # Windows: 下载后解压,添加到 PATH 环境变量 # 2. 验证 ADB 安装 adb version # 应输出版本信息 # 3. 连接手机并验证 # 用数据线连接手机,手机上点击「允许 USB 调试」 adb devices # 应输出设备列表,如: # List of devices attached # XXXXXXXX device

如果 adb devices 显示空列表或 unauthorized:

  1. 检查手机上是否弹出授权框,点击「允许」
  2. 检查 USB 调试是否开启
  3. 尝试更换数据线或 USB 接口
  4. 执行 adb kill-server && adb start-server 后重试

阶段二:安装 Agent

bash
# 1. 克隆仓库(如果还没有克隆) git clone https://github.com/zai-org/Open-AutoGLM.git cd Open-AutoGLM # 2. 创建虚拟环境(推荐) python -m venv venv source venv/bin/activate # Windows: venv\Scripts\activate # 3. 安装依赖 pip install -r requirements.txt pip install -e .

注意:不需要 clone 模型仓库,模型通过 API 调用。

阶段三:配置模型服务

如果用户选择选项 A(使用已部署的模型):

你可以使用以下第三方模型服务:

  1. 智谱 BigModel

  2. ModelScope(魔搭社区)

使用示例:

bash
# 使用智谱 BigModel python main.py --base-url https://open.bigmodel.cn/api/paas/v4 --model "autoglm-phone" --apikey "your-bigmodel-api-key" "打开美团搜索附近的火锅店" # 使用 ModelScope python main.py --base-url https://api-inference.modelscope.cn/v1 --model "ZhipuAI/AutoGLM-Phone-9B" --apikey "your-modelscope-api-key" "打开美团搜索附近的火锅店"

或者直接使用用户提供的其他模型服务 URL,跳过本地模型部署步骤。

如果用户选择选项 B(本地部署模型):

bash
# 1. 安装 vLLM pip install vllm # 2. 启动模型服务(会自动下载模型,约 20GB) python3 -m vllm.entrypoints.openai.api_server \ --served-model-name autoglm-phone-9b \ --allowed-local-media-path / \ --mm-encoder-tp-mode data \ --mm_processor_cache_type shm \ --mm_processor_kwargs "{\"max_pixels\":5000000}" \ --max-model-len 25480 \ --chat-template-content-format string \ --limit-mm-per-prompt "{\"image\":10}" \ --model zai-org/AutoGLM-Phone-9B \ --port 8000 # 模型服务 URL 为:http://localhost:8000/v1

阶段四:验证部署

bash
# 在 Open-AutoGLM 目录下执行 # 将 {MODEL_URL} 替换为实际的模型服务地址 python main.py --base-url {MODEL_URL} --model "autoglm-phone-9b" "打开微信,对文件传输助手发送消息:部署成功"

预期结果:

  • 手机自动打开微信
  • 自动搜索「文件传输助手」
  • 自动发送消息「部署成功」

异常处理

错误现象可能原因解决方案
adb devices 无输出USB 调试未开启或数据线问题检查开发者选项,更换数据线
adb devices 显示 unauthorized手机未授权手机上点击「允许 USB 调试」
能打开应用但无法点击缺少安全调试权限开启「USB 调试(安全设置)」
中文输入变成乱码或无输入ADB Keyboard 未启用在系统设置中启用 ADB Keyboard
截图返回黑屏敏感页面(支付/银行)正常现象,系统会自动处理
连接模型服务失败URL 错误或服务未启动检查 URL,确认服务正在运行
ModuleNotFoundError依赖未安装执行 pip install -r requirements.txt

部署要点

  1. 优先确认手机连接:在安装任何代码之前,先确保 adb devices 能看到设备
  2. 不要跳过 ADB Keyboard:没有它,中文输入会失败
  3. 模型服务是外部依赖:Agent 代码本身不包含模型,需要单独的模型服务
  4. 遇到权限问题先检查手机设置:大部分问题都是手机端配置不完整
  5. 部署完成后用简单任务测试:建议用「打开微信发消息给文件传输助手」作为验收标准

命令速查

bash
# 检查 ADB 连接 adb devices # 重启 ADB 服务 adb kill-server && adb start-server # 安装依赖 pip install -r requirements.txt && pip install -e . # 运行 Agent(交互模式) python main.py --base-url {MODEL_URL} --model "autoglm-phone-9b" # 运行 Agent(单次任务) python main.py --base-url {MODEL_URL} --model "autoglm-phone-9b" "你的任务描述" # 查看支持的应用列表 python main.py --list-apps

部署完成的标志:手机能自动执行用户的自然语言指令。

如果对你有用的话,可以打赏哦
打赏
ali pay
wechat pay

本文作者:猪聪聪

联系邮箱::[email protected]

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!