AIHOT

全部动态

全部一手资讯 X 论文

6月3日周三

6月2日周二

6月3日

02:49

Ars Technica：AI（RSS）

数学家警告AI对数学职业构成威胁，行业影响扩大

国际数学联盟支持一份关于科技行业影响力对数学领域构成威胁的警告。该警告指出，随着行业影响力的扩大，人工智能对数学家的职业前景构成了威胁。

推理现象/趋势

02:47

Chubby♨️@kimmonismus

Mustafa Suleyman， Microsoft AI： 7个新微软模型，开发无止境，未来几年数量级提升

Chubby♨️: Open claw windows companion app

Microsoft大佬观点

02:38

Ethan Mollick@emollick

法学教授们写下了他们在办公时间被学生问到的问题。Gemini 2.5 和人类分别作答，然后其他法学教授在不知道答案作者的情况下对结果进行了评判： - Gemini 的胜率为 75%，击败了教授们 - Gemini 的答案被评为比人类的答案危害更小 - 更新的模型表现甚至更好

Andrew Curran: In a new Stanford study, law professors by far preferred Gemini 2.5 Pro's responses over those written by their peers wh...

Google评测/基准

02:36

向阳乔木@vista8

OpenAI Codex 更新：从代码工具到通用工作系统

OpenAI披露，Codex每周用户已超500万，其中非开发者用户约占20%，增速是开发者的3倍多。此次更新旨在将其从开发工具推向通用工作系统，主要推出三项能力：1) 面向数据分析、销售等角色的角色插件，覆盖62个应用和110个技能；2) 面向企业客户的Sites功能，可将计划生成为可协作的交互式网站；3) 扩展到文档、表格等的批注功能，支持局部修改。这些更新旨在让Codex更好地理解岗位上下文，进入企业现有工具链。

智能体OpenAI现象/趋势编码

02:32

swyx@swyx

这看起来像音乐节阵容 😭😭

derek barry miller: This looks like a festival lineup 😭😭

其他

02:32

swyx@swyx

Mustafa是不是刚泄露了Mythos的FLOP数据？？这之前是公开信息吗，就算是个估计值我也不明白这有什么好处

swyx: 12.30pm today on the @Microsoft Build stream @NoPriorsPod x @latentspacepod x @satyanadella Join us! :)

Microsoft数据/训练行业动态

02:22

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

打破代际创伤是你的责任。

AI Notkilleveryoneism Memes ⏸️: Normal 🔨Mere Tool🔨 behavior. My hammer only does its job when I ask nicely.

其他安全/对齐

02:06

向阳乔木@vista8

字节背景创业者梦琪的AI软件创业一年复盘：从垂直Agent到C端浏览器插件

字节背景创业者梦琪复盘其AI软件公司Invocal一年来的转型历程。她经历了典型剧本：组团队、讲AI智能体故事、连续融资，随后经历三次错误决策：选择垂直智能体场景（达人营销的Sourcing资源挖掘）、选错场景（该环节仅占链条30%）、并误判横向扩张。她得出结论：垂直智能体存在结构性困局，易被迫变成代理公司，且To B模式难以获得模型效率的倍增红利。转向C端后，团队开发了浏览器插件CLICK，其核心价值在于缩短用户意图与解决方案的距离。她总结认为，大部分应用层创业公司不需要算法工程师，创始人刚融资时最易陷入“愚昧之巅”。

智能体现象/趋势

01:58

jason@jxnlco

OpenAI关于知识工作与Codex新报告的10个要点。 Codex不再仅限于编码，而是面向所有知识工作！

OpenAI大佬观点编码

01:58

郭明錤｜Ming-Chi Kuo@mingchikuo

我對 NVIDIA RTX Spark 的幾個想法：裝置端 AI agent 敘事、實現檢視與 Apple WWDC

郭明錤认为，NVIDIA CEO黄仁勋在GTC提出的“重新发明PC”口号，核心是展示端侧AI agent工作流概念。他指出，该概念并非原创，但将借助高曝光度主导未来叙事。然而，现实挑战在于：配备N1X芯片的RTX Spark装置未来两年出货量约1000万台，仍属利基市场；且当前PC主流AI应用与端侧算力关系不大。关键制约在于操作系统支持，Windows需完善相关工具才能兑现端侧AI agent体验。这也将影响Apple在WWDC上如何回应。

郭明錤|Ming-Chi Kuo: 許多人期待、Nvidia 可能將要發布的 N1X / Windows PC 處理器,供應鏈調查與重點分析: ▌供應鏈調查顯示,配備 N1X 的裝置未來兩年出貨量約10M ➡ 仍屬利基市場,瞄準對裝置端 AI 算力有需求的重度使用者。 ➡ 未...

智能体大佬观点端侧

01:58

郭明錤｜Ming-Chi Kuo@mingchikuo

郭明錤分析NVIDIA RTX Spark：设备端AI智能体愿景与现实挑战

郭明錤分析了NVIDIA在GTC上提出的RTX Spark笔记本及设备端AI智能体概念。他指出，该概念演示（无实际现场展示）包含操作系统、云/本地LLM切换、智能体框架等要素。供应链调查显示，配备相关N1X芯片的设备未来两年出货量约1000万台，仍属利基市场。当前PC端主流AI应用仍依赖云端算力。若设备出厂时，NVIDIA CUDA Toolkit未正式支持Windows Arm64，且Microsoft的设备端AI智能体栈（包括MCP on Windows、ODR等）仍处于预览状态，则RTX Spark将难以兑现其核心卖点。此外，Apple在WWDC上如何应对设备端AI智能体工作流也值得关注。

智能体现象/趋势端侧

01:43

Lee Robinson@leerob

AI模型基准测试遭质疑

Lee Robinson 批评当前AI模型基准测试存在局限，如 SWE-bench 已过时且结果难以复现。评测分数易受硬件、GPU差异和prompt微小改动影响，波动明显。这些基准对模型训练者衡量进展有价值，但对普通用户，当分数饱和时便失去参考意义。他指出，模型的交互风格、个性等重要因素无法被现有公共基准充分衡量。因此，建议用户综合参考多个基准，并亲自使用模型以形成判断。

lilly sharples: I'm tired of useless AI benchmarks. How about we give three people a different model, strand them on an island, and see ...

大佬观点评测/基准

01:17

Chubby♨️@kimmonismus

有趣的是，数据中心和社区受到了如此多的关注。最近有大量关于数据中心扩张阻力的报道；现在微软承诺：数据中心不会导致电费上涨，同时节约资源。

Chubby♨️: RTX spark running 120b parameter model locally. Ngl, pretty cool

现象/趋势

01:11

AYi@AYi_AInotes

独立开发者用Codex在23.5小时内开发开源App，绕过Whoop 5.0订阅限制

独立开发者Bennett利用Codex AI编程工具，在23.5小时内开发出开源App Goose。该应用可直接通过蓝牙读取Whoop 5.0的健康数据，无需订阅。实现基于公开的BLE协议分析，使用Rust和SwiftUI将数据本地化存储。此举暴露了依赖用户数据锁定和惯性构成的订阅制硬件护城河的脆弱性，并展示了AI工具如何降低个人挑战封闭生态的成本。

开源/仓库现象/趋势端侧编码

01:00

ViggleAI@ViggleAI

从角色创建到动捕和重定向，看到创作者们用@Viggle_PINOC将想法转化为可玩体验，真是太棒了。期待接下来的发展！

独立开发者William: 🤓rig+mocap+retarget整个流程走通了。下一步是完善游戏的controller,做state machine 然后明天开始演戏当动捕演员了🤓 准备给我的游戏设计几个酷炫的技能想想就好激动。

教程/实践视频

00:48

Berryxia.AI@berryxia

Moonshot AI创始人杨植麟的40分钟视频近日被广泛转发。他在视频中详细拆解了Kimi K2的训练过程，其核心突破在于仅以460万美元的极低成本完成训练。在近期一场8模型实时编程大赛中，Kimi K2获得第一名。杨植麟通过分享强调了极致优化与架构设计的重要性。

Berryxia.AI: Moonshot AI创始人杨植麟最近放出了一个40分钟视频。这位92年生、清华计算机本科第一、CMU博士、Transformer-XL和XLNet共同作者,前Google Brain和Meta研究员,坐在镜头前平静拆解了Kimi K2的...

推理现象/趋势编码

00:47

Chubby♨️@kimmonismus

天啊，"模型发布周期从15个月缩短到6周"。这就是指数级增长的定义！

🚨 AI News | TestingCatalog: Intelligence at Work keynote from OpenAI 🍿

OpenAI现象/趋势

00:47

Chubby♨️@kimmonismus

AI驱动医学革命：retatrutide攻克肥胖与癌症

AI正在推动医学领域的革命性突破。Eli Lilly研发的三重激动剂retatrutide能有效溶解脂肪，解决肥胖及其下游后果问题。肥胖自工业革命以来已成为现代文明的严重挑战，如今正被攻克。新型药物使黑色素瘤、胰腺癌等曾无法治疗的癌症变得可治疗，同时GLP-1激动剂还具有抗炎等益处。我们正进入Demis Hassabis所说的“科学黄金时代”，见证科学潜力全面展现。

DeepMind现象/趋势

00:45

Claude：Blog（网页）

精选74

Claude Code团队实践：智能体编程如何重塑工程组织与流程

在Code w/ Claude SF 2026活动上，Claude Code工程团队分享了将智能体编程设为默认工作方式后带来的流程与结构变革。核心变化包括：规划转向即时（JIT）模式，强调快速原型与反馈；上下文收集变为“先问Claude”；代码审查中Claude处理风格与测试，人工专注于法律、安全等专业判断。新范式下，工程瓶颈从编写代码转向验证、审查与安全维护。

Anthropic大佬观点现象/趋势部署/工程

关联讨论 2 条

推荐理由：Anthropic 工程总监把 Claude Code 团队流程全晒了出来，从抛弃半年路线图到代码审查只留专家复审，每一步都反直觉但实战有效，工程领导者直接抄作业。

00:37

Tomer Tunguz 博客（VC 分析）

精选61

开放模型的繁荣生态

根据OpenRouter平台数据，自2025年以来，开放模型使用量显著增长。最新数据显示，开放权重模型产生了69.1%的token使用量，闭源模型为30.9%。新模型的发布会吸引开发者测试，推动token使用量达到新的平台期。开放模型市场内部竞争激烈，领导地位频繁更迭，如DeepSeek的早期优势在2025年末至2026年初被MiniMax与Kimi模型取代，随后MiMo、Qwen、腾讯Hy3、阿里巴巴及Arcee等模型的发布再次改变了份额格局。尽管开放模型目前仍只占推理总量的一小部分，但激烈的竞争与增长表明，开发者正越来越愿意将生产流量路由至开放模型。

开源生态现象/趋势

推荐理由：开放模型在OpenRouter上的token份额已到69%，而且每轮新模型发布都会把使用量推上一个台阶，做推理基础设施的应该重视这个信号。

00:36

向阳乔木@vista8

英伟达开源Skill安全扫描工具

英伟达开源了一款针对AI智能体Skill（技能）的安全扫描工具。推文指出，Skill安全虽是一个实际问题，但目前专门做此方向扫描的工具和人员似乎较少。尽管尚未出现由Skill引发的严重破坏性案例，但仍需保持警惕。推文建议，用户可以考虑编写一个Meta Skill（元技能）来自动生成各种所需的Skill，并强调他人的Skill应主要用作学习和参考，而非直接使用。

MCP/工具安全/对齐开源/仓库

00:34

Hacker News 热门（buzzing.cc 中文翻译）

Seth Godin：别再搞砸了

知名营销专家 Seth Godin 发表博文《别再搞砸了》，呼吁在做事时保持质量和初心，避免将原本好的事情破坏。文章发布于2026年6月2日，在 Hacker News 上获得了110个积分。

其他大佬观点

00:22

Gary Marcus：The Road to AI We Can Trust（RSS）

精选58

Gary Marcus：为什么事情终将崩塌

知名人工智能批评者Gary Marcus在其关于可信赖AI的专栏中，探讨了人工智能发展面临的根本性挑战。文章开篇即指向问题的核心，指出相关数学理论的局限性与人类心理的复杂性，是导致AI系统最终可能出现问题的根源。

大佬观点安全/对齐

推荐理由：Marcus用数学和心理学双重框架解释AI信任为何必然崩溃，比他以往只说深度学习不可信更完整，但核心还是那套，做安全的人可以看看有没有新论据。

00:19

Bloomberg：Technology（RSS）

Google 800亿美元的AI豪赌

Alphabet意外宣布筹集800亿美元资本，引发热议。Jefferies分析师Brent Thill认为这是一次主动的战略出击，而非被动救援。此举旨在OpenAI、Anthropic和SpaceX可能的IPO之前抢先巩固优势。他预测AI领域的年支出可能突破1万亿美元，并指出AI热潮或将从根本上重塑企业的招聘与投资决策。

GoogleOpenAI行业动态

关联讨论 4 条

6月2日

23:34

Hacker News 热门（buzzing.cc 中文翻译）

迈克尔·伯里认为，SpaceX和Anthropic均不值1万亿美元

迈克尔·伯里公开表示，SpaceX与Anthropic的估值均不应达到1万亿美元。他指出，即使Anthropic的年化收入达到当前水平，实现这一估值也面临巨大挑战。此言论引发市场对当前AI及科技公司高估值合理性的关注与讨论。

Anthropic大佬观点行业动态

23:11

Emad@EMostaque

推文提出疑问：多少创始人会拒绝那些曾在前一轮投资中拒绝过自己的投资人？并引述Anthropic上一轮融资的内幕：一位知名基金的合伙人与Dario共进了三次晚餐后，其份额被削减至零。同时，至少另外四家一线基金也在最后关头被撤。引用推文指出，这些投资人受罚的原因是错过了由Spark领投的Series B--那是Dario经历过最艰难的一轮募资。在风险投资中，信任（conviction）就是一切。

Sam: Anthropic's last round was apparently a bloodbath behind the scenes. A GP at a prominent fund had dinner with Dario thre...

Anthropic行业动态

23:05

SenseTime@SenseTime_AI

精选81

商汤开源SenseNova-Skills AI办公技能套件

商汤开源了AI办公技能套件SenseNova-Skills。这是一个为任何技能兼容智能体（如OpenClaw与HermesAgent）设计的开源技能集合，提供四大核心功能：图像信息图表生成（可镜像参考风格）、数据分析（支持多表解析、清洗与可视化）、PPT创建（生成大纲内容并智能排版，输出可编辑文件）以及深度研究（跨学术、技术、社交等多源搜索并生成报告）。该技能套件现已完全开源。

智能体图像生成开源/仓库

推荐理由：商汤掏出了一套开箱即用的 agent 技能包，从做图到写报告都能一键接，而且代码全在 GitHub 上。想做 agent 产品的可以直接 fork 当乐高用，比等 API 发布快多了。

22:32

X.PIN@thexpin

人形机器人公司宇树科技（Unitree）在行业亏损中实现盈利

中国人形机器人公司宇树科技（Unitree）于2024年实现净利润7750万元人民币，2025年利润增至约6亿元，净利润率约35%，在行业普遍亏损的背景下实现盈利。该公司已通过上海证券交易所上市委员会审核，拟融资约42亿人民币，目标成为首家在A股上市的专业人形机器人公司。其H2 Plus人形机器人预计年底出货，已被Nvidia纳入Isaac GR00T参考设计，将与Jetson Thor整合。宇树以低成本、高可靠性的产品路线实现商业化，基础版G1机器人售价约1200美元。

具身智能现象/趋势

21:37

Ethan Mollick@emollick

关于AI写作的另一点是，虽然单次针对某个话题的AI写作可能没问题，但在许多人使用AI回应特定提示的任何情况下（评论区、作业、申请文书），回应之间的相似性会变得极其明显。

大佬观点

21:25

Orange AI@oran_ge

投资人Mike Vernal：AI时代创业应直接瞄准深水区

投资人Mike Vernal认为，AI让软件编写成本趋近于零，传统“找楔子→扩展套件→变平台”的三段式创业剧本已过时。他指出，Cursor等公司能在两年内从0做到一亿ARR，时间窗口被极大压缩。因此，他主张在创业初期就直接瞄准核心市场（即“深水区”），展现不可理喻、不可阻挡的野心。他以Cursor种子轮时就声称要替代VS Code为例，认为这个目标如今看来甚至还不够大胆。

Mike Vernal: http://x.com/i/article/2061520512174768128

大佬观点现象/趋势行业动态

21:21

SemiAnalysis@SemiAnalysis_

近期Ornn H100指数跌至2.63美元（-7.72%）令人困惑。但这主要因为该指数具有误导性。我们的H100小时价格已连续146天在2.70-3.01美元区间内波动。仅上月Ornn指数就经历了1.80→3.22→2.63美元的剧烈波动。原因在于OCPI仅基于已成交交易构建。但数月来我们覆盖范围内H100按需实例已售罄。不存在连续的现货交易记录。剩余数据仅来自少数贡献者的双边交易残余。小样本量极易被扭曲。

现象/趋势部署/工程

21:13

The Verge：AI（RSS）

Gemini Spark：迄今最令人震撼与恐惧的AI体验

Google推出了名为Gemini Spark的新一代AI智能体。它是一个始终保持在线的agentic产品，野心在于成为解决各类问题的“万能答案”。在实际测试中，Spark在旅行规划这一典型AI用例上，展现了与以往AI截然不同的能力。此前，AI规划行程通常只能提供最通用、最表层的建议；而Spark则表现出更深层次的、主动的代理能力，其体验被作者形容为“迄今最令人震撼与恐惧”。

智能体Google评测/基准

21:02

The Verge：订阅版科技（RSS）

精选71

Gemini Spark：最令人印象深刻也最可怕的AI体验

Google DeepMind的AI模型Gemini Spark提供了一次极为深刻但同时令人感到不安的用户体验。该模型展现的强大能力令人印象深刻，但其带来的影响和潜力也引发了深刻的恐惧感。

智能体Google评测/基准

推荐理由：David Pierce 首次试用 Gemini Spark 的深度体验，一句话概括就是「impressive and terrifying」。它展示了 AI 代理在复杂任务中的惊人能力，但也让人看清未来有多渗人，任何做产品的人都该看一眼。