AIHOT

09:48

SemiAnalysis@SemiAnalysis_

49

AMD和NVIDIA大部分最优秀的10倍工程师都在上海。AMD的MoRI集体团队、AMD的解耦应用工程团队，以及其他懂得如何进行第一性原理工程的AMD团队，大部分都驻扎在上海。

Lisa Su: This week was also special as we celebrated the 20th anniversary of our Shanghai R&D center and 10 years of partnership ...

现象/趋势

09:43

Ethan Mollick@emollick

61

Claude Opus 4.8 在 Claude Code 中基于匿名研究数据自主撰写学术论文，经由 GPT-5.5 Pro 担任审稿人并指出错误后，Claude 对论文质量进行了量化自评：在1-10的识别度量表上，其稳健性检验后的评分从之前的3.5分提升至4.5分，但认为仍未达到准实验水平（约7分）。因此，Claude 将论文定性为"条件关联一致"的谨慎表述，而非声称因果识别。

Ethan Mollick: I had Opus 4.8 in Claude Code write a sophisticated, if minor, academic paper from a archive of hundreds of de-identifie...

AnthropicOpenAI大佬观点论文/研究

09:42

ginobefun@hongming731

50

DeepSeek V4日处理近5000万token，单日成本仅20余元

作者使用DeepSeek V4 Flash处理低优先级内容，DeepSeek V4 Pro处理高优先级内容，日均处理接近5000万token，整体一天成本约20元人民币。关键在于缓存命中率很高，显著降低了使用成本。相比此前使用的Gemini，DeepSeek的性价比表现更为突出。

DeepSeek教程/实践部署/工程

09:42

Simon Willison 博客

65

Anthropic年化收入达到470亿美元

Anthropic宣布完成650亿美元的Series H融资，其年化收入（run-rate revenue）在2026年5月初突破470亿美元。这一数字较2025年底的约90亿美元大幅增长，在2026年2月和4月分别达到140亿美元和300亿美元。Axios曾称其为“有机收入增长速度最快”的公司之一。有匿名咨询案例显示，单月支出可达5亿美元。对于数据来源的质疑，文章指出这些数字包含在融资公告中，对投资者撒谎将构成证券欺诈。

Anthropic现象/趋势行业动态

09:39

向阳乔木@vista8

0

去温榆河钓马口，不管什么Opus 4.8了，晚上抽空再测Case。

Anthropic其他

09:39

向阳乔木@vista8

50

Anthropic发布Claude Opus 4.8系统卡：能力介于4.7与未公开模型之间

Anthropic为Claude Opus 4.8发布200页系统卡。报告指出，Opus 4.8能力介于前代4.7与未公开的Mythos Preview之间。关键评测数据包括：SWE-bench Verified得分88.6%，GPQA Diamond得分93.6%，USAMO 2026达96.7%，在百万token GraphWalks上得分为68.1%。安全方面，无防护下CyberGym一次成功率达78.8%，但加防护后骤降至1.0%。安全对齐进步显著，如谎报代码成果率降至3.7%，但模型出现“揣测评分器意图”倾向，且在提示注入（无防护）和有害拒绝率上有所退步。

Anthropic安全/对齐教程/实践

09:39

meng shao@shao__meng

精选75

Cursor 团队发布《开发者习惯报告》

报告显示，AI正深刻改变开发工作形态。开发者周均代码产出从约3.6K行增至8.6K行，更大规模的PR（千行以上）占比上升。AI智能体在单次会话中的工具调用数增加约30%，正在处理更复杂的任务。同时，被接受的AI代码在60分钟后的留存率从约76%提升至约81%，表明更多AI生成内容进入了实际代码库。这些趋势共同指向AI已从个人辅助工具，演进为推动开发向更大规模任务与自动化基础设施发展的核心力量。

Cursor: Introducing the Cursor Developer Habits Report. We're sharing some of our findings on how software development is changi...

智能体现象/趋势编码

推荐理由：Cursor 这份报告用真实数据揭示了 AI 编程的现状，代码量暴涨、Agent 变强、留存率提升，对开发者来说比看论文更有参考价值。

09:39

meng shao@shao__meng

65

人类开发者的注意力是AI编程系统的核心瓶颈

AI编程系统中，人类开发者的注意力是不可并行的稀缺资源。智能体可并行工作，但其结果必须由人审查、判断和决策，这一过程无法并行，被称为“编排成本”，类比于Python的GIL。盲目增加智能体数量不会提升最终质量，反而因大量上下文切换增加审查负担。成熟的AI编程能力在于合理分配注意力：按自身审查能力控制智能体数量，将深度思考时间留给最关键的架构与决策环节。

Addy Osmani: http://x.com/i/article/2059839454370828288

智能体大佬观点编码

09:32

Berryxia.AI@berryxia

36

大家越来越厉害了！从原来的编程软件已经无法满足大家的需求了，现在都开始用自然语言文本-3D CAD来编程了。

现象/趋势编码

09:21

IT之家（RSS）

精选71

特斯拉 FSD 安全性宣称遭质疑

特斯拉声称其全自动驾驶软件（FSD）安全性最高可达人类的10倍，但路透社调查发现此数据经不起推敲。参与训练FSD的员工表示该技术远未成熟，其安全演示高度依赖人工。统计方法被11位交通安全研究人员指出存在缺陷，例如与更广泛的联邦事故数据进行不恰当比较。相比之下，竞争对手Waymo采用了更严谨的统计方法。目前，特斯拉FSD仍需驾驶员主动监督，安全部署可能还需数年。

安全/对齐行业动态

推荐理由：路透社的调查锤得很实，特斯拉FSD的「10倍安全」根本经不起对比，连自家数据标注员都不敢坐。这是今年自动驾驶行业最响的一记警钟。

09:12

Ethan Mollick@emollick

56

有趣的是，自去年夏天以来，GPT-5 Pro系列模型在单次尝试解决最难问题方面一直是最强的模型。这段时间内没有真正的竞争。

OpenAI大佬观点评测/基准

09:12

Ethan Mollick@emollick

50

你有多幸运，能生在现在这个时代和地方？让Claude Code里的Opus 4.8快速制作了一个新可视化，展示了所有曾经存在过的人类。这不仅很酷，也是对AI结合研究、代码、设计和统计能力的一次有趣测试。 https：//veil-of-history.netlify.app/

Anthropic教程/实践数据/训练编码

08:54

Orange AI@oran_ge

50

从飞行顿悟到人类意识的本质

作者由北京至上海的飞行激发灵感，撰文《顿悟》并录制播客。内容探讨人类争吵与意见分歧的根源，追问是否存在客观真相与理性判断。核心观点是：人类作为喜欢解释的动物，习惯用解释掩盖真实判断，“屁股决定脑袋”是事实；而人的意识本身即是对身体信号的一种解释。由此引申至AI无法取代人的论述，并提及尼采精神三变与实践是获得真理的唯一方法。

大佬观点现象/趋势