编程笔记

lifelong learning & practice makes perfect

终端AI利器:两款效率神器助你码力十足

OpenAI Codex CLI

  • 轻量级的编码代理,可以在终端中运行。
  • 为已经习惯在终端中工作的开发者提供 ChatGPT 级别的推理能力,并结合实际运行代码、操作文件和迭代的能力。
  • 理解你的代码,编辑文件,运行命令,并在解决方案上进行迭代,所有这些都无需离开终端。
  • 与你的文件进行交互,安全地运行 shell 命令,并与版本控制无缝集成。
  • 在项目上下文中,通过 Markdown 文件接受额外的指令和指导。这些文件可以放置在:
    • ~/.codex/AGENTS.md (个人全局指导)
    • 仓库根目录的 AGENTS.md (共享项目说明)
    • 当前工作目录的 AGENTS.md (子文件夹/功能的具体说明)

使用

快速入门

全局安装:

1
npm install -g @openai/codex

接下来,将 OpenAI API 密钥设置为环境变量:

1
export OPENAI_API_KEY="your-api-key-here"

注意: 此命令仅为当前终端会话设置密钥。您可以将 export 行添加到 shell 的配置文件(例如 ~/.zshrc),但我们建议为会话设置。提示: 您还可以将 API 密钥放入项目根目录下的 .env 文件中:

1
OPENAI_API_KEY=your-api-key-here

CLI 将自动从 .env 加载变量(通过 dotenv/config)。

以交互方式运行

效果

1
codex

或者,使用提示作为输入运行(可以选择以 Full Auto 模式运行):

1
codex "explain this codebase to me"
1
codex --approval-mode full-auto "create the fanciest todo-list app"

就是这样 - Codex 将搭建一个文件,在沙盒中运行它,安装任何缺少的依赖项,并向您展示实时结果。批准更改后,它们将被提交到您的工作目录。

优点:

  • 零设置:只需提供 OpenAI API 密钥即可工作。

  • 内存和项目文档:可以合并来自多个 AGENTS.md 文件的项目特定指令和上下文。

  • 安全模型:通过 --approval-mode 标志提供透明的用户控制,用于控制文件写入/补丁和 shell/Bash 命令的执行。提供 suggest (默认,最安全),auto-editfull-auto 模式。

  • 非交互/CI 模式:可以在管道中以 headless 方式运行。.

  • 多模式 支持传入屏幕截图或图表以实现功能 ✨

  • 完全开源,因此您可以查看并贡献其开发方式!

与其他 OpenAI Codex 概念的区分

  • OpenAI Codex (2021):OpenAI 在 2021 年发布的一个 AI 系统,旨在从自然语言提示生成代码。它是原始 GitHub Copilot 使用的模型。这个原始的 Codex 模型已于 2023 年 3 月弃用,与 CLI 工具不同。
  • OpenAI Codex (最新产品):这是一个云端的软件工程代理。你可以指定一个 prompt,代理会在其自身的环境中工作,并在 8-10 分钟后返回一个 diff。它类似于 GitHub 的 Copilot Workspace 项目,但包含一个完整的代码解释器风格的环境,允许它构建和运行代码并执行测试。

sigoden/aichat

全功能 LLM 命令行工具,集成了多种功能和平台支持,方便用户在终端中使用各种 LLM 模型进行聊天、RAG 等操作

效果

  • 一体化的 LLM CLI 工具:集成了 Shell 助手、Chat-REPL 模式、RAG (检索增强生成)、AI 工具和代理等多种功能。
  • 多平台支持:支持多个 AI 平台,包括 OpenAI (GPT-3.5/GPT-4), Gemini, Claude, Mistral, LocalAI, Ollama, VertexAI, Ernie, Qianwen 等。
  • 多种模式:支持命令模式和交互模式 (Chat-REPL)。
  • 多模态支持:支持多模态模型 (vision),可以使用自然语言执行命令。
  • Shell 集成:与 Shell 集成,方便在终端中使用。
  • RAG 功能:具备检索增强生成能力,可以从文档中检索相关信息并生成回答。
  • 语法高亮:支持 Markdown 和代码块中的 200 多种语言的语法高亮。
  • 会话管理:支持保存消息/会话,可以存储/导出聊天消息。
  • 流式输出:支持流式/非流式输出。
  • 代理支持:具有代理功能。
  • 主题:具有深色/浅色主题。
  • 本地服务器:包含一个轻量级的内置 HTTP 服务器,方便部署。

优点:

  • 终端启动速度快,资源占用少:与浏览器相比,终端启动更快并且需要的资源更少。
  • Rust 编写,单可执行文件,跨平台:采用 Rust 编写,生成单个可执行文件,具有良好的跨平台性。
  • 方便易用:可以直接在终端中使用,无需打开浏览器。
  • 高度集成:集成了多种 LLM 平台和功能,使用方便。
  • 可扩展性:可以通过修改个人接口进行二次开发,例如自定义 Google API。

Agent

aichat同样支持构建agent并在仓库llm-fuctions提供了工具,通过使用 Bash,JavaScript 和 Python 等熟悉的语言毫不费力地构建强大的 LLM 工具和代理。支持MCP和function-call。

效果

参考

欢迎关注我的其它发布渠道

Related Issues not found

Please contact @yiGmMk to initialize the comment