核心内容摘要
《法国空姐1987法版》:一次穿越时空的优雅邂逅
手把手教你在Windows跑通Open-AutoGLM项目
这不是科幻是今天就能用上的手机AI助手你有没有想过让手机自己“看懂”屏幕、“想明白”你要做什么再“动手”完成不是靠预设脚本而是像真人一样理解你的自然语言指令——比如“打开小红书搜美食攻略”它就能自动截图分析界面、识别图标、点击搜索框、输入文字、点下搜索按钮一气呵成。
Open-AutoGLM 就是这样一个真实存在的项目。
它不是概念演示而是智谱AI开源的、可本地部署的手机端AI Agent框架。
核心能力很实在看视觉理解 想智能规划 动ADB操控。
整个过程不依赖云端处理敏感界面所有推理和操作都在你自己的电脑上完成隐私有保障。
这篇文章专为 Windows 用户设计不假设你有Linux经验不堆砌术语不跳过任何一个可能卡住的细节。
从下载第一个安装包开始到手机自动打开设置应用全程手把手。
哪怕你只用过微信和浏览器也能照着做下来。
我们不讲“多模态架构”或“端到端强化学习”只讲“点哪里”“输什么”“看到什么就说明成功了”。
准备工作三件套配齐少一个都跑不起来别急着敲代码。
在Windows上跑通Open-AutoGLM真正卡住人的往往不是模型而是这三样基础环境Python、ADB工具、手机调试权限。
我们一项一项来每一步都告诉你为什么需要它以及怎么验证它真的装好了。
1 安装Python
10或更高版本这是所有Python项目的地基。
低于
10版本后续某些依赖会直接报错所以请务必确认版本。
操作步骤打开浏览器访问 https://www.python.org/downloads/找到最新版的Windows installer (64-bit)点击下载双击运行安装程序在弹出的窗口里最关键一步勾选最下面的Add Python to PATH把Python加到系统路径然后点击Install Now等待安装完成点击Close验证是否成功按下Win R键输入cmd回车打开命令提示符输入python --version回车如果看到类似Python
3.
1
9的输出说明安装成功如果提示python 不是内部或外部命令说明PATH没加对重新安装并确保勾选了那个选项
2 配置ADB工具手机和电脑之间的“遥控器”ADBAndroid Debug Bridge是安卓开发的基石也是Open-AutoGLM控制手机的唯一通道。
它就像一个万能遥控器能让你的电脑向手机发送“点击这里”“滑动一下”“输入文字”的指令。
操作步骤访问 https://developer.android.com/tools/releases/platform-tools找到Windows版本的platform-tools-latest-windows.zip下载解压解压后你会得到一个文件夹里面全是.exe文件。
记住这个文件夹的完整路径比如D:\tools\platform-tools配置系统环境变量让CMD随时认得ADB按下Win R输入sysdm.cpl回车点击高级标签页再点环境变量(N)...在下方系统变量(S)区域找到并双击Path点击新建(N)把刚才记下的路径如D:\tools\platform-tools粘贴进去点击确定保存所有窗口验证是否成功关闭当前的CMD窗口重新打开一个新的CMD窗口这步很重要否则PATH不生效输入adb version回车如果看到类似Android Debug Bridge version
1.
41的输出说明ADB已就位如果提示adb 不是内部或外部命令请检查路径是否复制正确以及是否重启了CMD
3 手机端设置开启“被遥控”的权限你的手机默认是“锁着门”的必须手动打开几道门电脑才能进来控制它。
操作步骤按顺序缺一不可开启开发者模式打开手机设置→关于手机→ 连续快速点击版本号或软件信息里的版本号7次直到屏幕弹出“您现在处于开发者模式”的提示。
开启USB调试返回设置→系统或更多设置→开发者选项→ 找到USB调试把它打开。
如果找不到“开发者选项”请确认上一步是否真的开启了。
安装ADB Keyboard关键Open-AutoGLM要帮你在手机上输入中文但普通输入法无法被远程调用。
ADB Keyboard是一个特殊的输入法专为此设计。
下载ADBKeyboard.apk可在GitHub搜索ADBKeyboard找到官方仓库或直接搜索下载将APK文件传到手机用数据线或微信传输在手机上点击安装如果提示“禁止安装未知来源应用”请在设置→安全中开启“未知来源”安装完成后进入设置→系统→语言和输入法→虚拟键盘→ 找到ADB Keyboard并启用它最后一步在输入法列表中将ADB Keyboard设为默认输入法做完这三步你的手机就准备好接受AI的指挥了。
部署核心下载代码、装好模型、启动服务现在硬件和基础软件都准备好了。
接下来是真正的“大脑”部分把AI模型和控制程序装到你的电脑上。
1 下载Open-AutoGLM控制端代码这是你本地电脑上运行的“指挥中心”它负责接收你的指令、调用云端模型、再把AI生成的操作命令发给手机。
操作步骤打开CMD确保是新的能识别adb的那个依次执行以下命令git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM pip install -r requirements.txt pip install -e .第一行git clone会从GitHub下载全部代码需要几分钟请耐心等待pip install -r requirements.txt会自动安装所有Python依赖pip install -e .是以“开发模式”安装本项目让它能被系统全局调用
常见问题如果提示git不是命令请先下载安装Git for Windowshttps://git-scm.com/download/win安装时一路默认即可。
2 下载并启动AI模型服务Open-AutoGLM本身不包含大模型它需要连接一个运行着AutoGLM-Phone-9B模型的服务。
这个模型约18GB是理解屏幕和规划动作的核心。
国内用户推荐速度快在CMD中执行git clone https://www.modelscope.cn/ZhipuAI/AutoGLM-Phone-9B.git启动模型服务vLLM确保你已安装vLLMpip install vllm在CMD中进入你刚下载的模型文件夹如AutoGLM-Phone-9B然后执行python -m vllm.entrypoints.openai.api_server --served-model-name autoglm-phone-9b --port 8000 --model .看到屏幕上滚动出现Uvicorn running on http://
0.
0.
0:8000字样说明模型服务已成功启动此时你的电脑上就有一个AI“大脑”在8000端口待命了
3 连接手机USB线一插即刻联通这是最关键的一步也是最容易出错的一步。
请严格按顺序操作用数据线将手机连接到电脑手机屏幕会立刻弹出一个提示“允许USB调试吗”务必点击允许在CMD中执行adb devices如果看到类似ABC123456789 device的输出一串字母数字device说明连接成功如果显示unauthorized请检查手机是否点了“允许”如果显示空列表检查数据线是否支持数据传输有些充电线不行或换一个USB接口
第一次运行让AI帮你打开“设置”应用万事俱备现在来执行第一个任务。
我们选择最简单的指令“打开设置”。
它不涉及输入文字不涉及网络请求纯粹测试“看-想-动”的闭环是否通畅。
操作步骤确保模型服务上一步的CMD窗口仍在运行在另一个CMD窗口中进入Open-AutoGLM文件夹执行以下命令请将你的设备ID替换为你在adb devices命令中看到的那一串字母数字python main.py --device-id 你的设备ID --base-url http://localhost:8000/v1 --model autoglm-phone-9b 打开设置例如python main.py --device-id ABC123456789 --base-url http://localhost:8000/v1 --model autoglm-phone-9b 打开设置你将看到什么程序会先打印出类似 思考过程: 当前在桌面需要打开设置应用的文字然后是执行动作: {action: Launch, app: 设置}。
几乎同时你的手机屏幕上设置应用就会自动打开了。
如果一切顺利恭喜你你已经成功跑通了Open-AutoGLM的全链路。
这不是Demo而是真实的、可复用的能力。
实用技巧与避坑指南让AI更听话、更稳定跑通只是开始。
在实际使用中你会发现一些小技巧能让体验大幅提升而避开几个常见坑能省下你半天的排查时间。
1 提升成功率的三个实操技巧保持手机屏幕常亮且解锁AI需要实时截图分析界面。
如果屏幕熄灭或锁屏它就“看不见”了。
建议在开发者选项中开启不锁定屏幕或保持唤醒状态。
用更具体的指令“打开抖音”比“刷抖音”更明确“搜索‘数码测评’”比“找点好玩的”更可靠。
AI擅长执行清晰、无歧义的命令。
首次使用从简单任务开始先试“打开微信”“返回桌面”“打开相机”再逐步尝试“搜索并关注某博主”这类多步骤任务。
熟悉它的能力边界比追求一步到位更重要。
2 Windows用户专属避坑清单问题现象根本原因一招解决main.py报错ModuleNotFoundError: No module named phone_agentpip install -e .没执行成功或没在Open-AutoGLM目录下执行重新进入项目根目录再执行pip install -e .adb devices显示offlineADB服务进程卡死在CMD中执行adb kill-server然后adb start-server模型服务启动时报错CUDA out of memory显存不足尤其显卡12GB启动命令末尾加上--device cpu强制用CPU运行速度慢但能跑AI能识别界面但点击无效ADB Keyboard未设为默认输入法或手机系统限制了辅助功能进入手机设置→辅助功能→无障碍确保Open-AutoGLM或相关服务已开启
进阶玩法不只是“打开APP”还能批量自动化当你熟悉了基础操作Open-AutoGLM的潜力才真正展现出来。
它不是一个单次任务工具而是一个可以写脚本、做批量、甚至集成进你工作流的自动化引擎。
1 命令行进阶用参数定制你的AI助手main.py支持丰富的命令行参数让你不用改代码就能调整行为--max-steps 50限制AI最多执行50步操作防止它陷入死循环--timeout 30每个操作步骤最长等待30秒超时自动放弃--list-apps列出当前AI已知的所有APP名称方便你精准调用--verbose开启详细日志看到每一步的截图分析和决策依据适合调试
2 Python API把AI变成你脚本里的一个函数对于有编程基础的用户直接调用Python API比命令行更灵活。
你可以把它嵌入到任何Python项目中。
一个真实可用的示例from phone_agent import PhoneAgent from phone_agent.model import ModelConfig # 配置你的AI大脑 model_config ModelConfig( base_urlhttp://localhost:8000/v1, model_nameautoglm-phone-9b, ) # 创建一个AI助手实例 agent PhoneAgent(model_configmodel_config) # 一句话让它干活 result agent.run(打开美团搜索‘附近评分最高的火锅店’) print(任务完成结果是, result)把这个代码保存为my_task.py在CMD中运行python my_task.py效果和命令行完全一样但你可以轻松把它改成循环执行10次或者根据上一个任务的结果决定下一个任务。
7.
总结你刚刚掌握了一项未来技能回顾一下你已经完成了在Windows上配置了Python和ADB两大基础环境成功下载并启动了18GB的多模态AI模型服务让手机通过USB线与电脑建立了稳定、可信任的连接执行了第一条自然语言指令并亲眼看到手机自动响应掌握了提升成功率的技巧和解决
常见问题的方法这不仅仅是学会了一个工具。
你亲手搭建了一个“AI手机助理”的最小可行系统。
它的价值在于它把过去需要写几十行自动化脚本、或者依赖特定APP API才能完成的任务简化成了“一句话”。
下一步你可以尝试让它帮你每天早上8点自动打开天气APP截图发到微信家庭群批量给通讯录里标记为“客户”的人发送一条定制化的节日祝福在淘宝上监控某款商品的价格一旦降到目标价就自动下单技术本身没有魔法但当它能精准理解你的意图并可靠地执行你的想法时那种掌控感就是最真实的未来。