Home 科技 OpenAI 發布了有關其 AI 編碼代理如何工作的技術細節

OpenAI 發布了有關其 AI 編碼代理如何工作的技術細節

14

值得注意的是,OpenAI 和 Anthropic 開源 CLI 客戶端都可以在 GitHub 上進行編碼,允許開發人員直接檢查實現情況,而他們對 ChatGPT 或 Claude Web 界面則不能這樣做。

戒指內部的官方外觀

Bolin 的帖子重點介紹了他所說的“代理循環”,即組織用戶、AI 模型以及模型調用以執行編碼工作的軟件工具之間交互的底層邏輯。

正如我們在 12 月所寫的,每個人工智能代理的核心都是一個循環。代理接受用戶的輸入並為表單準備文本提示。然後,該表單生成一個響應,該響應要么為用戶生成最終答案,要么請求工具調用(例如運行 shell 命令或讀取文件)。如果表單請求工具調用,代理將執行它,將輸出附加到原始提示,然後再次查詢表單。重複此過程,直到表單停止請求小部件並為用戶生成幫助消息。

這個迭代過程必須從某個地方開始,Pauline 的帖子揭示了 Codex 如何創建發送到 OpenAI 的 Response API(處理模型推理)的初始向量。路由器由多個組件構建,每個組件都有一個確定其優先級的特定角色:系統、開發人員、用戶或幫助者。

指令字段要么來自用戶定義的配置文件,要么來自使用命令行界面(CLI)編譯的核心指令。 “工具”字段定義表單可以調用的功能,包括 shell 命令、佈局工具、Web 搜索功能以及表單上下文協議 (MCP) 服務器提供的任何自定義工具。輸入字段包含一系列描述沙箱權限的項目、可選的開發人員說明、環境上下文(例如當前工作目錄)以及最後發送給用戶的實際消息。


發布日期: 2026-01-26 23:05:00

來源連結: arstechnica.com

LEAVE A REPLY

Please enter your comment!
Please enter your name here