工具
omx 有两类工具:模型直接调用的基础工具,和作为子智能体在廉价模型上自主运行的智能体工具。
基础工具
由主模型直接调用。每次调用的输入和输出都会加入对话上下文。
| 工具 | 描述 |
|---|---|
| Bash | 运行 Shell 命令。适用于构建、安装、CLI 工具和系统任务。支持通过 BashOutput 获取后台任务输出。 |
| Read | 读取文件内容并显示行号。支持 offset 和 limit 参数浏览大文件。也可读取图片和 PDF。 |
| Edit | 精确替换文本。提供要查找的确切文本和替换内容。 |
| Write | 将内容写入文件,自动创建父目录。支持 createOnly 模式防止覆 盖。 |
| Glob | 按模式查找文件。标准 glob 语法,支持 gitignore。结果上限 100 个。 |
| Grep | 使用正则表达式搜索文件内容。返回匹配项及文件路径和行号。 |
| WebSearch | 搜索网络以获取最新信息。 |
| WebFetch | 获取 URL 内容并将 HTML 转换为干净的 Markdown。 |
| Skill | 加载技能以获取特定领域任务的详细指导。 |
智能体工具
智能体工具以子智能体方式在 Agent 模型(通常是更便宜的模型)上运行。它们的中间工具调用、文件内容和推理过程不会进入你的主上下文。你只会收到简洁的答案;中间工作不会出现在对话中。
| 工具 | 描述 |
|---|---|
| Agent_Explore | 概览项目架构。映射目录布局、关键文件和代码库组织方式。 |
| Agent_Glance | 一次预览多个文件。读取文件和目录,为每个文件返回简要摘要。 |
| Agent_Search | 搜索代码库以回答特定问题。从项目各处返回有针对性的代码片段。 |
智能体工具工作原理
当主模型调用 Agent_Search("会话持久化是怎么工作的?") 时:
- 在 Agent 模型上启动一个子智能体
- 子智能体可以使用基础工具(Glob、Grep、Read、Bash)
- 它会进行必要的工具调用来找到答案
- 只有最终的简洁结果返回到主对话
- 所有中间工作被丢弃
这意味着单次智能体工具调用可能内部执行 5-10 次基础工具调用,但你的主上下文只增长最终答案的大小。
Agent 模型
Agent 模型与主模型分开配置。在菜单的 Manage your model list 中设置。如果未设置,主模型也用于智能体工作。
为了节省成本,可以将贵价推理模型(如 Claude Opus)作为主模型,廉价快速模型(如 GLM-4)作为 Agent 模型。