文章

企业AI的框架与真实经验。


为什么你的AI成本随使用量上升,而他们的在下降

一篇新论文展示了通过知识复利实现84.6%的token节省。核心洞察:token应该是资本投资,不是消耗品。

4 min · 2026年4月

大多数人认为改进AI代理意味着重新训练模型。这只是四个杠杆之一。

一篇新论文展示了代理在不更新模型的情况下自我改进。但更大的洞察是大多数企业没有利用的完整优化面。

4 min · 2026年4月

你跑5个代理是因为任务需要5个,还是因为你就是这么设计的?

一篇新论文测试了何时应该将多代理系统压缩为单个代理。答案是反直觉的:这不取决于任务,而取决于指标。

4 min · 2026年4月

你的AI代理正在以你的身份行动。这不是比喻。

当你的Copilot代理发送邮件时,它使用的是你的身份。你的凭证。你的权限。Microsoft的Agent 365直到2026年12月才会解决这个问题。

4 min · 2026年4月

Jensen说AGI到了。基准测试说0.26%。

Jensen Huang告诉Lex Fridman他认为AGI已经实现了。同一周,ARC-AGI-3发布。人类得分100%。最强前沿AI得分0.26%。两者都是对的。

3 min · 2026年3月

一个AI代理刚刚在优化NVIDIA自家GPU上击败了NVIDIA自己的工程师

AVO论文给了一个编程代理CUDA文档和Blackwell B200规格的访问权限。它在7天内产出40个内核版本——性能超过cuDNN 3.5%,超过FlashAttention-4 10.5%。

4 min · 2026年3月

你不再是工程师了。你是导演。

Andrej Karpathy从去年12月起就没敲过一行代码了。他把每天的时间都花在向代理「表达意志」上。瓶颈变了。

3 min · 2026年3月

Jensen把OpenClaw比作Linux。没人在谈论这意味着什么。

如果代理运行时是Linux,那运行时就是商品。每家企业都会跑同一个。价值向上迁移——到智能层。

3 min · 2026年3月

Cursor被抓了。我把它当作战略指南来读。

他们的新「自研」模型是Kimi K2.5——一个来自Moonshot AI的开源权重模型,经过RL微调。一个开发者24小时内就发现了。互联网称之为丑闻。

2 min · 2026年3月

你的AI账单在增长。你的AI护城河没有。

Midjourney跑的是自己拥有的模型。他们的推理成本每季度都在下降。你的企业跑的是Claude和GPT。你的成本随用量上升。你的护城河是零。

4 min · 2026年3月

Knuth说了一声「震惊!」——如果你了解Knuth,你就知道这意味着什么

Donald Knuth,在世最受尊敬的计算机科学家,被Claude解决了一个他研究数周的开放问题而震惊。意义远超数学本身。

3 min · 2026年3月

职场最不公平的优势

Andy Grove写下了管理学中最重要的一句话。2026年,这个等式悄然改变了。你的组织现在包括AI代理。

3 min · 2026年3月

MCP vs CLI是一场错误的辩论

我们刚给了一个AI代理对staging环境的无限制CLI访问权限。安全团队是从Slack告警中得知的——而不是治理审查。

3 min · 2026年3月

大多数企业卡在了第二阶段

你已经部署了AI。它能用。但它没有复利效应。那不是第三阶段,那是第二阶段——而大多数企业卡在了这里。

4 min · 2026年3月

AI代理即将比外包人工更贵

我们为了替代外包劳动力而构建的技术,即将比外包劳动力更贵。一个Gartner预测,应该让每个企业AI买家警醒。

3 min · 2026年3月

Vibe Coding将杀死Agent Builder UI

2024年,我们构建了拖拽式的代理构建器。2026年,开发者直接描述他们想要什么。配置界面的时代只持续了18个月。

4 min · 2026年3月

关于领导力,有一个教训一直伴随着我

关于领导力,有一个教训贯穿了我的整个职业生涯。领导力不是做一件事,而是打造一个团队。

3 min · 2026年2月

Anthropic的全面胜利(暂时的)

2026年Anthropic做的所有事:200亿美元年化收入、iOS排名第一、五角大楼合同。Anthropic如何赢下这一局——以及前方的风险。

5 min · 2026年2月

我在LinkedIn上发表文章,并在构建的过程中更新这个网站。