Agent

共 8 篇文章

Hermes Agent Masterclass
May 18, 2026
你需要了解和自定义 Hermes Agent 的一切
5. How to really stop your agents from making the same mistakes
May 17, 2026
LangChain 已经融资 1.6 亿美元。三年开发，估值十亿美元。他们的测试平台 LangSmith 确实非常成熟：轨迹评估、轨迹转数据集管道、LLM 作为评判者、回归测试套件、工具的单元测试框架。他们拥有这些组件。功劳归功于他们。
4. Imagine if naked people were stupider. It turns out, naked models actually are.
May 17, 2026
抱歉，不是那种裸体模特。但你现在感受到的失望？那正是 Kyle Kingsbury 对 LLM 的感受。
6. Meta-Meta-Prompting: The Secret to Making AI Agents Work
May 17, 2026
大家一直问我，为什么我晚上还要熬夜 coding 到凌晨 2 点。我有一份正经工作，而且是份大工作——作为 Y Combinator 的 CEO，我们每年帮助数千名创业者实现梦想，打造真正有收入、快速增长的初创公司。
3. On the LOC controversy
May 17, 2026
或者：当我提到我最近出货了多少行代码，以及实际数字到底说明了什么时，发生了什么。
7. The AI Agent Complexity Ratchet: Why 90% Test Coverage Is Required
May 17, 2026
过去一年，我一直在用 AI 进行编码。不只是简单提示（prompting）——而是真正构建软件。我有两个开源项目：GStack，它让 AI 编码代理变得更强大；GBrain，它能把你阅读和编写的一切内容转化为 AI 可搜索的知识库。两者加起来，大约有 97 万行代码和 665 个测试文件。几乎所有代码都是在我的指导下，由 Claude Code 和 Codex 完成的（大多数时候同时运行 15 个
2. Resolvers: The Routing Table for Intelligence
May 16, 2026
在《薄 Harness，胖 Skills》中，我介绍了构建真正有效的 Agent 系统的五个核心定义。Skills 获得了最多的关注，人们收藏了“Skill-as-method-call”模式、Diarization 概念以及薄 Harness 架构。很好，这些确实很重要。
1. Thin Harness, Fat Skills
May 16, 2026
Steve Yegge 说，使用 AI 编码代理的人“比今天使用 Cursor 和聊天的人生产力高 10x 到 100x，大致相当于 2005 年 Googlers 的 1000x 生产力。”