Published on

2026-第二周

Authors

该周报主要为各个地方内容的汇总整理

技术

工具

Open-AutoGLM

Open-AutoGLM 是一个基于 AutoGLM 模型构建的手机端智能助理框架,能够通过多模态理解手机屏幕内容并自动化执行用户指令。它支持 Android、HarmonyOS 和 iOS 设备,通过 ADB/HDC 控制设备,结合视觉语言模型进行屏幕感知与操作规划,实现“用自然语言控制手机”的功能。项目提供模型部署指南、环境配置说明及多种使用方式,适用于研究、学习和自动化任务场景。

  • 📱 项目定位:基于 AutoGLM 的手机端智能助理框架,支持通过自然语言指令自动化操作手机。
  • 🔗 设备支持:兼容 Android、HarmonyOS 和 iOS 系统,需配置 ADB(Android)或 HDC(鸿蒙)等调试工具。
  • 🧠 核心能力:利用多模态模型理解屏幕内容,自动规划并执行点击、输入、滑动等操作以完成任务。
  • ⚙️ 环境准备:需要 Python 3.10+、开发者模式、USB 调试权限,Android 设备需额外安装 ADB Keyboard 输入法。
  • 🌐 模型服务:可选择自行部署模型(通过 vLLM/SGLang)或使用第三方服务(如智谱 BigModel、ModelScope)。
  • 🚀 使用方式:支持命令行交互、Python API 调用,并提供远程调试(WiFi 连接)和多设备管理功能。
  • 📂 应用覆盖:支持 50+ 款 Android 应用和 60+ 款鸿蒙原生应用,涵盖社交、购物、娱乐等常见类别。
  • ⚠️ 注意事项:仅供研究学习使用,需遵守使用条款;部署时需注意设备连接、权限配置及模型服务可用性。

更新

设计

AI

其他

程序员对待 AI 有两种态度:一种以结果为导向,渴望通过 AI 更快拿到结果;另一种以过程为导向,他们从工程本身获得意义,对于被剥夺这种体验感到不满。

-- Ben Werdmuller