OpenAI 發布了有關其 AI 編碼代理如何工作的技術細節

27 1 月 2026

值得注意的是，OpenAI 和 Anthropic 開源 CLI 客戶端都可以在 GitHub 上進行編碼，允許開發人員直接檢查實現情況，而他們對 ChatGPT 或 Claude Web 界面則不能這樣做。

戒指內部的官方外觀

Bolin 的帖子重點介紹了他所說的“代理循環”，即組織用戶、AI 模型以及模型調用以執行編碼工作的軟件工具之間交互的底層邏輯。

正如我們在 12 月所寫的，每個人工智能代理的核心都是一個循環。代理接受用戶的輸入並為表單準備文本提示。然後，該表單生成一個響應，該響應要么為用戶生成最終答案，要么請求工具調用（例如運行 shell 命令或讀取文件）。如果表單請求工具調用，代理將執行它，將輸出附加到原始提示，然後再次查詢表單。重複此過程，直到表單停止請求小部件並為用戶生成幫助消息。

這個迭代過程必須從某個地方開始，Pauline 的帖子揭示了 Codex 如何創建發送到 OpenAI 的 Response API（處理模型推理）的初始向量。路由器由多個組件構建，每個組件都有一個確定其優先級的特定角色：系統、開發人員、用戶或幫助者。

指令字段要么來自用戶定義的配置文件，要么來自使用命令行界面（CLI）編譯的核心指令。 “工具”字段定義表單可以調用的功能，包括 shell 命令、佈局工具、Web 搜索功能以及表單上下文協議 (MCP) 服務器提供的任何自定義工具。輸入字段包含一系列描述沙箱權限的項目、可選的開發人員說明、環境上下文（例如當前工作目錄）以及最後發送給用戶的實際消息。

發布日期: 2026-01-26 23:05:00

來源連結: arstechnica.com

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

OpenAI 發布了有關其 AI 編碼代理如何工作的技術細節

戒指內部的官方外觀

LEAVE A REPLY Cancel reply

近期文章

在查理·柯克（Charlie Kirk）的社交媒體帖子之後，加利福尼亞餐廳的工作人員被槍殺。

Listen Up: Headphone & Earbud Deals for July From Apple, Beats,...

The Best Science Fiction and Fantasy Movies on Netflix

Breaking down Trump’s big gift to the AI industry

Liquid Glass, Live Translation, and All the Other Important New iOS26...

Page Bucer-Kam贏得了Aceis，以106分爆炸以贏得翅膀

OpenAI prepares to launch GPT-5 in August

所有類別