企业AI的框架与真实经验。
一篇新论文展示了通过知识复利实现84.6%的token节省。核心洞察:token应该是资本投资,不是消耗品。
一篇新论文展示了代理在不更新模型的情况下自我改进。但更大的洞察是大多数企业没有利用的完整优化面。
一篇新论文测试了何时应该将多代理系统压缩为单个代理。答案是反直觉的:这不取决于任务,而取决于指标。
当你的Copilot代理发送邮件时,它使用的是你的身份。你的凭证。你的权限。Microsoft的Agent 365直到2026年12月才会解决这个问题。
Jensen Huang告诉Lex Fridman他认为AGI已经实现了。同一周,ARC-AGI-3发布。人类得分100%。最强前沿AI得分0.26%。两者都是对的。
AVO论文给了一个编程代理CUDA文档和Blackwell B200规格的访问权限。它在7天内产出40个内核版本——性能超过cuDNN 3.5%,超过FlashAttention-4 10.5%。
Andrej Karpathy从去年12月起就没敲过一行代码了。他把每天的时间都花在向代理「表达意志」上。瓶颈变了。
如果代理运行时是Linux,那运行时就是商品。每家企业都会跑同一个。价值向上迁移——到智能层。
他们的新「自研」模型是Kimi K2.5——一个来自Moonshot AI的开源权重模型,经过RL微调。一个开发者24小时内就发现了。互联网称之为丑闻。
Midjourney跑的是自己拥有的模型。他们的推理成本每季度都在下降。你的企业跑的是Claude和GPT。你的成本随用量上升。你的护城河是零。
Donald Knuth,在世最受尊敬的计算机科学家,被Claude解决了一个他研究数周的开放问题而震惊。意义远超数学本身。
Andy Grove写下了管理学中最重要的一句话。2026年,这个等式悄然改变了。你的组织现在包括AI代理。
我们刚给了一个AI代理对staging环境的无限制CLI访问权限。安全团队是从Slack告警中得知的——而不是治理审查。
你已经部署了AI。它能用。但它没有复利效应。那不是第三阶段,那是第二阶段——而大多数企业卡在了这里。
我们为了替代外包劳动力而构建的技术,即将比外包劳动力更贵。一个Gartner预测,应该让每个企业AI买家警醒。
2024年,我们构建了拖拽式的代理构建器。2026年,开发者直接描述他们想要什么。配置界面的时代只持续了18个月。
关于领导力,有一个教训贯穿了我的整个职业生涯。领导力不是做一件事,而是打造一个团队。
2026年Anthropic做的所有事:200亿美元年化收入、iOS排名第一、五角大楼合同。Anthropic如何赢下这一局——以及前方的风险。
我在LinkedIn上发表文章,并在构建的过程中更新这个网站。