Agent
共 8 篇文章-
Hermes Agent Masterclass
你需要了解和自定义 Hermes Agent 的一切
-
5. How to really stop your agents from making the same mistakes
LangChain 已经融资 1.6 亿美元。三年开发,估值十亿美元。他们的测试平台 LangSmith 确实非常成熟:轨迹评估、轨迹转数据集管道、LLM 作为评判者、回归测试套件、工具的单元测试框架。他们拥有这些组件。功劳归功于他们。
-
4. Imagine if naked people were stupider. It turns out, naked models actually are.
抱歉,不是那种裸体模特。但你现在感受到的失望?那正是 Kyle Kingsbury 对 LLM 的感受。
-
6. Meta-Meta-Prompting: The Secret to Making AI Agents Work
大家一直问我,为什么我晚上还要熬夜 coding 到凌晨 2 点。我有一份正经工作,而且是份大工作——作为 Y Combinator 的 CEO,我们每年帮助数千名创业者实现梦想,打造真正有收入、快速增长的初创公司。
-
3. On the LOC controversy
或者:当我提到我最近出货了多少行代码,以及实际数字到底说明了什么时,发生了什么。
-
7. The AI Agent Complexity Ratchet: Why 90% Test Coverage Is Required
过去一年,我一直在用 AI 进行编码。不只是简单提示(prompting)——而是真正构建软件。我有两个开源项目:GStack,它让 AI 编码代理变得更强大;GBrain,它能把你阅读和编写的一切内容转化为 AI 可搜索的知识库。两者加起来,大约有 97 万行代码和 665 个测试文件。几乎所有代码都是在我的指导下,由 Claude Code 和 Codex 完成的(大多数时候同时运行 15 个
-
2. Resolvers: The Routing Table for Intelligence
在《薄 Harness,胖 Skills》中,我介绍了构建真正有效的 Agent 系统的五个核心定义。Skills 获得了最多的关注,人们收藏了“Skill-as-method-call”模式、Diarization 概念以及薄 Harness 架构。很好,这些确实很重要。
-
1. Thin Harness, Fat Skills
Steve Yegge 说,使用 AI 编码代理的人“比今天使用 Cursor 和聊天的人生产力高 10x 到 100x,大致相当于 2005 年 Googlers 的 1000x 生产力。”