滚球中国官方网站入口为什么完整的AI Agent不存在？Claude Code源码背后的五大设想形而上学与息争

发布日期：2026-05-09 05:45 来源：未知作者：admin 浏览次数：

当 AI 编程用具进化为能自主引申任务的智能体，架构层面的设想采纳不再只关乎性能，更关乎安全、可控性与可执续性。MBZUAI VILA Lab 邻接 UCL 以 Anthropic 的 Claude Code 源码为案例，系统分析了出产级 AI 智能体的设想空间。

这篇著述在 X 上也引起了平庸的柔顺和推敲：

来自 MBZUAI VILA Lab 的连接团队发布了一项新连接，以 Anthropic 的 Claude Code 源码为案例，对出产级 AI 智能体 ( Agent ) 的架构设想空间作念了系统分析。论文尝试探讨一个问题：构建一个出产级 AI 智能体，需要回答哪些设想问题？

Claude Code 是刻下一代 AI 编程用具的代表：在终局里输入一句"帮我劝诱 auth.test.ts 里失败的测试"，它会我方汇注荆棘文、运筹帷幄门径、调用用具、引申敕令、查验结尾，反复迭代直到觉得任务完成 [ 7 ] 。围绕它的源码解读著述一经有不少，但大皆聚焦在"怎样达成"的层面。

这篇论文的切入点不同：

它起火意于描写达成细节，而是尝试从源码和官方文档中反推出驱动统共这个词架构的设想形而上学与设想原则，分析权限、荆棘文经管、可扩展性、子智能体等重要子系统的设想采纳。同期通过与近期备受柔顺的开源智能体系统 OpenClaw 的对比，展示一样的设想问题在不同部署场景下可能导向不同的谜底。

连接步调

论文的分析基于以下几类信息开首：Claude Code v2.1.88 的 TypeScript 源码、Anthropic 官方发布的博客和居品文档，以及社区的逆向工程分析论说。

不雅察一：五条设想形而上学塑造了架构，但它们之间存在矛盾

论文莫得上来就讲工夫细节，而是先追问了一个更底层的问题：这个系统为什么要设想成这么？通过概述 Anthropic 官方文档、源码和干系尊府，论文记忆出五条驱动架构，以东说念主类价值不雅为导向的设想形而上学：

东说念主类有蓄意巨擘

东说念主类要能随时看到、批准或否决智能体的操作

安全、隐秘与数据保护

即使东说念主类不留意，系统也要能我方保护用户过甚代码和数据

可靠引申

智能体作念的事要和东说念主类念念的一致，永劫候运转也不可走偏

才调放大

系统要让东说念主类能作念到往日作念不到的事

荆棘文顺应性

系统要能顺应用户的具体神志、用具、习尚，并随使用时候冉冉改善

在此基础上，论文从官方文档和社别离析中记忆出十三条设想原则 ( Design Principles ) ，举例"拒却优先 ( Deny-First ) "、"渐进式信任 ( Graduated Trust ) "、"纵深退让 ( Defense in Depth ) "、"最金莲手架、最大操作 Harness ( Minimal Scaffolding， Maximal Operational Harness ) "等。

但论文发现，这些设想形而上学之间存在部分矛盾。举例：

东说念主类有蓄意巨擘 vs. 安全

凭证 Anthropic 的分析 [ 1 ] ，用户批准了约 93% 的权限弹窗，闲居的审批点击导致用户对授权内容的留意力下落。因此安全不可彻底依赖东说念主类审批，系统需要有我方的驻防机制。

安全 vs. 才调

严格的安全查验会带来性能代价。安全连接机构 Adversa.ai [ 2 ] 发现，当一条敕令包含 50 个以上子敕令时，若是逐条作念拒却功令查验会导致界面冻结。于是系统采纳保执反映速率，退化为单条审批，毁掉了逐条查验。这说明在性能压力下，多层安全退让可能被动让位于可用性。

可扩展性 vs. 安全

丰富的扩展才调会扩大挫折面。Check Point Research 的安全连接 [ 3 ] 发现，Hooks 和 MCP 扩展在信任对话弹出之前就会加载，这个时序窗口被已泄漏的安全间隙 ( CVE-2025-59536、CVE-2026-21852 ) 所应用。扩展性越强，提前加载的代码越多，可被挫折的窗口也就越大 ( 这些间隙已在泄漏后数周内劝诱 ) 。

这些矛盾更像是同期追求多条设想形而上学所带来的采取，而非设想缺点；雷同的量度在其他智能体系统中也可能出现。

不雅察二："最金莲手架、最大操作 Harness "

△ 图 1：Claude Code 的高层系统结构

系统由七个功能组件组成：用户、接口层、智能体轮回、权限系统、用具、景象与执久化、引申环境。

这里的"脚手架" ( Scaffolding ) 是指不停和携带模子有蓄意的运筹帷幄框架，"操作 Harness "则是围绕模子运转的基础设施。对源码的分析走漏，Claude Code 的绝大部分代码是确定性基础设施 ( 权限查验、用具路由、荆棘文经管、诞妄规复 ) ，AI 有蓄意逻辑只占约 1.6%。中枢的智能体轮回 ( Agentic Loop ) 是一个执续迭代的过程：调用模子、获取用具调用申请、引申、返回结尾，直到模子罢手申请。

在智能体工程鸿沟，存在不同的设想取向。一些框架 ( 如 LangGraph [ 8 ] ) 将有蓄意逻辑编码为显式的景象图，而 Claude Code 采纳了另一条路：不硬性功令模子的有蓄意旅途，而是给模子较大的有蓄意目田度，同期用确定性代码保险安全引申。

论文的分析指出，跟着前沿模子在编码才调上趋同，围绕模子的操作 Harness 的质料可能成为居品各异化的重要成分。

用户申请引申历程

△ 图 2：智能体轮回的多轮迭代过程。

用户输入经过荆棘文安装干涉轮回：模子产出用具调用申请，由权限系统判定，允许则引申，拒却则把反馈返回模子重试；遭遇荆棘文压力时会触发压缩。轮回执续直到模子不再申请用具，输出最终报酬给用户；用户链接对话则再次干涉新一轮轮回

上头两节推敲了"为什么这么设想"，接下来看"具体怎样运转"。论文用一个"运转示例"串起各个架构层级：假定输入"帮我劝诱 auth.test.ts 里失败的测试"，系统会先组织荆棘文 ( 加载 CLAUDE.md 神志提醒、对话历史、用具界说、git 景象等 ) ，然后在每轮模子调用前引申荆棘文压缩管说念。在调用模子之前，权限系统一经通过用具预过滤移除了被退却的用具。模子在可见的用具范围内决定要调用哪些用具后，权限系统再次判断具体操作是否允许引申。通过后用具引申，结尾喂回模子，干涉下一轮轮回。子智能体交付亦然通过 Agent 用具在这个轮回中触发的。

这个轮回触及以下几个重要的架构层面：

1. 权限机制

△ 图 3：权限系统的有蓄意结构。

每次用具调用皆要经过权限系统的判定，滚球官网系统内置多层安全机制，最闭幕尾分为三种：允许则放行引申，拒却则顺利返回，推敲则交由用户或自动分类器裁决。

系统设想了七层落寞的安全机制，包括用具预过滤、拒却优先功令、权限模式、ML 分类器 ( Auto-Mode Classifier ) 、沙箱窒碍、规复会话时不接纳旧权限，以及 Hooks 阻拦。并非每次操作皆会触发一起七层。举例，ML 分类器仅在 auto mode 开启时告成，沙箱仅针对 Shell 敕令且需全局启用，Hooks 阻拦则取决于用户是否设立了相应的 Hook。但在适用的层上，任何一层皆不错单独否决操作 ( 不外论文也指出，在性能压力下这些层可能分享失败模式 ) 。

2. 荆棘文经管

跟着对话股东，荆棘文窗口 ( Context Window ) 里的内容络续延迟。为了不超出 token 预算，系统设想了五层荆棘文压缩 ( Context Compaction ) ：预算编著 ( 恒久告成 ) 、历史修剪 ( Snip ) 、微压缩 ( Microcompact ) 、荆棘文折叠 ( Context Collapse ) 、自动纲领 ( Auto-Compact，默许开启 ) 。其中历史修剪和荆棘文折叠受 feature flag 适度，不一定在统共版块中皆启用。这五层在每轮模子调用前规矩评估，各层落寞判断是否需要触发，从轻量编著到模子生成纲领，压缩力度逐层递加。

3. 可扩展性

模子能用的用具不仅仅内置的那些。Claude Code 提供了四种主要的扩展机制：MCP 劳动器崇拜接入外部用具和资源，妙技 ( Skills ) 崇拜注入鸿沟提醒，Hooks 提供掩盖用具调用、会话人命周期、荆棘文经管等多个维度的事件阻拦点，插件 ( Plugin ) 则是一个打包分发阵势，不错将上述机制以及敕令、智能体界说等多种组件系结为可安装的扩展包。不同机制对荆棘文窗口的消费不同，开发者不错凭证场景采纳相宜的扩展阵势。

4. 子智能体的交付与编排

模子不错通过调用 Agent 用具派出子智能体 ( Subagent ) 去完成子任务。系统内置了多种子智能体类型 ( 如专注探索的 Explore、专注运筹帷幄的 Plan 等 ) ，也扶助用户自界说。子智能体默许在落寞的荆棘文窗口中责任，窒碍模式包括进度内窒碍 ( 默许，分享文献系统但荆棘文落寞 ) 、git worktree 窒碍 ( 取得落寞的文献系统副本 ) 等。完成后只把最终答返回回给父智能体。在 agent teams 场景中，系统通过文献锁机制来调解多个智能体之间的任务分拨。

不雅察三：与 OpenClaw 的对比：一样的设想问题，不同的解答

论文不单分析了 Claude Code，还和近期在开源社区飞快走红的智能体系统 OpenClaw [ 6 ] 作念了六个维度的对比。OpenClaw 是一个个东说念主助手网关，扶助 WhatsApp、Telegram、Slack 等多种平台接入。两个系统濒临统一组设想问题，给出了权臣不同的谜底：

Claude Code 对每次用具调用作念逐操作安全评估，OpenClaw 作念领域级打听适度

Claude Code 的智能体轮回是系统的中心，OpenClaw 的智能体轮回仅仅网关里的一个组件

Claude Code 的扩展修改的是单个荆棘文窗口，OpenClaw 的插件扩展的是统共这个词网关的才调面

两者还能组合使用：OpenClaw 不错通过 ACP ( Agent Client Protocol，智能体客户端公约 ) 把 Claude Code 算作外部编程 Harness 接入。这说理智能体的设想空间不是浅易的非此即彼，而是一个不错分层组合的结构，网关级系统和任务级 Harness 不错重叠使用。

不雅察四：对经久出产力与代码质料的潜在影响

除了架构层面的分析，论文还从另一个角度凝视了智能体系统：AI 智能体带来的出产力进步是否如感知中那样果然？是否会在代码质料和经久可珍重性上付出代价？

论文在推敲中援用了多项针对同类 AI 编程用具的连接：

一项对 16 名资深开发者、246 个任务的立时对照本质 [ 4 ] 发现，使用 AI 用具的组本色完成速率慢了 19%，但自我感知却快了 20%

对 807 个代码仓库的因果分析 [ 5 ] 发现，使用 Cursor 后代码复杂度飞腾了 40.7%

论文指出，将来的智能体系统不错将这个"可执续性缺口"纳入系统设想的考量，而不仅仅算作过后评估的目的。

六个通达的将来办法

论文梳理了六个有待进一步连接的办法：

1. 静默失败与可不雅测性、评估之间的差距：智能体的主要失败模式不是崩溃，而是在无东说念主察觉的情况下产出诞妄结尾。怎样弥合可不雅测性和本色评估之间的差距？

2. 记念执久化与东说念主机经久调解：怎样让智能体与用户之间的责任关系灵验、庄重地逾越屡次对话执续蓄积？

3.Harness 领域的演化：智能体在那里运转、何时活动、操作什么对象、与谁调解，这四个维度皆在快速扩展。

4. 时候跨度的扩展：智能体能否从单次对话级别扩展到执续数天乃至数周的科研级任务？

5. 治理与监管：跟着 EU AI Act 等法例告成，智能体架构需要提供哪些审计与透明度接口？

6. 对东说念主类经久才调的影响：上述可执续性问题能否从过后评估目的进步为系统设想办法？

对 AI 开发者和连接者的启示

第一，论文提供了一种从设想形而上学起程分析智能体架构的视角，将具体的达成采纳追忆到背后的设想形而上学和设想原则，而不是停留在"怎样达成的"层面。

第二，论文展示了智能体设想中多种价值之间的量度：安全与结尾、东说念主类适度与自动化、可扩展性与安全性之间常常存在采取，清爽这些量度有助于作念出更清晰的架构有蓄意。

第三，论文指出了刻下智能体系统尚未惩办好的几类问题，如跨会话记念、静默失败检测、治理合规等，为将来的连接和开发提供了办法。

第四，论文还柔顺了一个工夫以外的问题：智能体带来的短期结尾进步是否果然？是否会在代码质料和经久可珍重性上付出代价？

写在临了

AI 智能体仍处在快速演进中。这篇论文以 Claude Code 为切入点，但愿为智能体架构的设想推敲提供一些可参考的不雅察。

代码和完整论文已开源，宥恕柔顺！

GitHub 神志主页：https://github.com/VILA-Lab/Dive-into-Claude-Code

论文下载：https://arxiv.org/abs/2604.14228

代码与数据：https://github.com/VILA-Lab/Dive-into-Claude-Code

References

[ 1 ] Anthropic. Claude Code Auto Mode: A Safer Way to Skip Permissions. https://www.anthropic.com/engineering/claude-code-auto-mode

[ 2 ] Adversa.ai. Critical Claude Code Vulnerability: Deny Rules Silently Bypassed Because Security Checks Cost Too Many Tokens. https://adversa.ai/blog/claude-code-security-bypass-deny-rules-disabled/

[ 3 ] Donenfeld， A. & Vanunu， O. Caught in the Hook: RCE and API Token Exfiltration Through Claude Code Project Files. Check Point Research. https://research.checkpoint.com/2026/rce-and-api-token-exfiltration-through-claude-code-project-files-cve-2025-59536/

[ 4 ] Becker， J. et al. Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity. arXiv:2507.09089. https://arxiv.org/abs/2507.09089

[ 5 ] He， H. et al. Speed at the Cost of Quality: How Cursor AI Increases Short-Term Velocity and Long-Term Complexity in Open-Source Projects. arXiv:2511.04427. https://arxiv.org/abs/2511.04427

[ 6 ] Steinberger， P. & OpenClaw Contributors. OpenClaw: Personal AI Assistant. https://github.com/openclaw/openclaw

[ 7 ] Anthropic. How Claude Code Works. https://code.claude.com/docs/en/how-claude-code-works

[ 8 ] LangChain， Inc. LangGraph: Build Resilient Language Agents as Graphs. https://github.com/langchain-ai/langgraph

一键三连「点赞」「转发」「小心心」

宥恕在挑剔区留住你的念念法！

— 完 —

咱们正在招聘别称眼疾手快、柔顺 AI 的学术编著实习生 � �

感风趣的小伙伴宥恕柔顺 � � 了解确定