BestBlogs 早报：Claude Code 实践、AI 自动化悖论、百川医疗 AI

ginobefun@hongming731 · X

2026-05-26 08:37·20天前

AI 摘要

Anthropic 工程师 Ara 分享内部使用 Claude Code 的三项核心实践：将规格说明升级为 HTML 以提升结构密度；让模型通过 ask_user_question 工具主动采访需求；采用智能体原生 DOM 验证框架，实现人工、Opus 4.7 无头浏览器及 CI/CD 的统一验证。Every 公司 CEO Dan Shipper 用团队一年内从 15 人扩张至近 30 人的数据，反驳 AI 会大规模裁员的叙事，认为自动化反而催生需求增长与质量管控需求。百川智能创始人王小川透露，公司已收缩通用模型与金融等业务线，All in 医疗大模型，并即将发布新医疗大模型 M4。

http：//x.com/i/article/2059070654180421632

# BestBlogs 早报 · 05-26|Claude Code 实践、AI 自动化悖论、百川医疗 AI

在线阅读和收听：https：//www.bestblogs.dev/explore/brief/2026-05-26

## 导语

今天是 2026 年 5 月 26 日，欢迎收听 BestBlogs 早报 EP68，本期内容丰富。

今日早报从三个不同的切入角度，共同指向同一个深层问题：当 Agent 开始重写工程与组织的规则，身处其中的人该怎么站位？

Anthropic 工程师 Ara 分享了他们内部使用 Claude Code 的第一手范式--规格说明从 Markdown 升级为 HTML、让模型来主持需求采访、以及智能体原生 DOM 验证框架，这是工程方法论层面的具体答案。Every 公司 CEO Dan Shipper 则用自家团队一年从 15 人扩至近 30 人的真实数据，颠覆了 AI 会大规模裁员的主流叙事。百川创始人王小川的对话则展示了一条更长远的选择：离开通用 AI 的主干道，把整个公司押注到「造医生」这件事上。

三条精讲各有棱角，速览与补充阅读涵盖 Agent 术语厘清、异构智能扩展、AI Agent 的工资单逻辑、Karpathy 加入 Anthropic 的战略解读，以及 OpenAI 数学突破、AI 安全治理等前沿动态。

今日精选共 14 篇内容，覆盖 AI 工程实践、组织变革与人力影响、垂直 AI 产品以及 AI 安全治理等多个维度，让我们开始。

## 精讲一：Anthropic 内部如何使用 Claude Code：HTML 规格说明、让模型来采访你，以及智能体原生 DOM 验证框架

Anthropic Applied AI 团队的架构师 Ara 在一场内部工程工作坊上，分享了他们使用 Claude Code 的三项核心实践--每一项都和主流做法存在明显反差。这不是通用的「怎么写好提示词」指南，而是 Anthropic 工程师在大量实际场景中摸索出来的、真正有效的智能体原生工作方法。

从 Markdown 到 HTML 规格说明

过去，Markdown 一直是 AI 辅助开发中描述需求的主流格式。但随着模型能力提升、Agent 执行周期变长，依赖大段平铺文本的方式开始暴露问题：长上下文中细节容易被忽略，Agent 走偏时消耗大量 token 才能校正。

Ara 的团队将工程规格说明迁移到 HTML 格式。这不是单纯的格式替换，而是一次结构密度的升级。HTML 规格说明可以提供可视化检查的结构化基线--开发者可以直接在浏览器中看到设计变体（比如 Claude Opus 4.7 生成的极简风格或布鲁塔利主义风格方案），截图后送入模型视觉系统。这套方式在 Agent 真正开始执行改动之前，就建立了一个由人类审核确认的强基线，大幅降低了 Agent 跑偏的概率。

Tar 在内部提出的概念「HTML 文件的非理性有效性」，正是这一实践的理论出发点。结构化 HTML 不只是给模型看的--它同时也是给工程师看的，可供随时视觉验证的活文档。

让模型来采访你

Ara 把这一点联系到 Richard Sutton 的经典论文《苦涩的教训》（The Bitter Lesson）--依赖原始数据和算力，长期来看总能胜过人工设计的约束。

在与高级 AI Agent 协作时，工程师常见的两种失误：一是在开始阶段用过多硬规则约束模型，二是用「让它更好」这样的模糊指令驱动执行。Ara 的建议是颠倒这个过程：需求其实就在你脑子里，但你可能自己还没梳理清楚。正确的方式是让 Claude 主动用 ask_user_question 工具来采访你--挖掘边界条件、用户领域和隐含约束。