AIHOT

5月21日

04:33

Ethan Mollick@emollick

我们最终知道OpenAI在IMO上获得金牌的是什么模型了吗？那是一年前的事了，当时被称为一个未发布的内部通用模型。GPT-5.5 Pro Extended是否已经赶上了那个模型？

OpenAI大佬观点推理

04:33

Ethan Mollick@emollick

又是The Graph（不是METR的图，是o1发布时的那张图）。虽然能力并未随计算量增加呈现对数衰减……

Noam Brown: This is a general-purpose LLM. It wasn't targeted at this problem or even at mathematics. Also, it's not a scaffold. We ...

OpenAI大佬观点推理模型发布

04:06

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

为何大多数对齐工作都是徒劳，一张图说明【引用 @AISafetyMemes】：大多数对齐计划：第一步）创造沙神第二步）… 😈 欺骗沙神 😈 … 第三步）沙神永远忠诚 "当前的对齐工作，不过是在沙王巨怪脸上涂口红。" -@romanyam

AI Notkilleveryoneism Memes ⏸️: Most alignment plans: Step 1) Create sand gods Step 2) ... 😈 Trick the sand gods 😈 ... Step 3) Sand gods remain loyal ...

安全/对齐现象/趋势

03:48

Noam Brown@polynoamial

数学家Tim Gowers关于@OpenAI模型在Erdos单位距离问题上取得突破的重要长文！【引用 @wtgowers】：如果你是数学家，那么在继续阅读之前，你可能需要确保自己是坐着的。

Timothy Gowers @wtgowers: If you are a mathematician, then you may want to make sure you are sitting down before reading further.

OpenAI大佬观点推理

03:48

宝玉@dotey

美国大学毕业典礼嘉宾鼓吹AI遭学生强烈嘘声

近日，美国多所大学毕业典礼上，嘉宾赞扬人工智能的言论引发学生集体嘘声。前谷歌CEO埃里克·施密特在演讲中将AI比作“火箭船票”，鼓励毕业生组建AI团队，却遭遇持续哄场，他承认恐惧合理但坚持AI将塑造世界。其他演讲者称AI为“工业革命”或“改写行业”也引发类似反应。学生不满源于就业压力，认为鼓吹AI变革的嘉宾正是推动自动化、可能导致岗位减少的群体。民调显示美国人对AI热情降温，愤怒情绪上升。

现象/趋势行业动态

03:35

Chubby♨️@kimmonismus

"我们距离AGI只有几年之遥（……）现在就能开始感受到。2026、2027年就是它开始的时候。" Demis Hassabis从未以制造炒作闻名。听他说我们正走在通向AGI的道路上，真的让我很兴奋。

DeepMind大佬观点现象/趋势

03:35

Chubby♨️@kimmonismus

AI改变世界："工业革命的10倍规模，以10倍速度推进，即100倍"（Demis Hassabis）【引用 @kimmonismus】："我们距离AGI仅剩数年（…）现在已能初见端倪。2026、2027年将是起点。" Demis Hassabis向来不以制造热点著称。听他坦言我们正走在通向AGI的道路上，令我倍感振奋。

Chubby♨️: "We are only a few years away from AGI (...) we can start feeling it now. 2026,2027 is when it's starting." Demis Hassab...

DeepMind大佬观点

03:06

Rohan Paul@rohanpaul_ai

Anders Hejlsberg（C#、TypeScript创造者）：AI已将软件工作从编写代码转变为审查智能体编写的代码、架构和监督。 "我们都在变成项目经理"

大佬观点编码

02:36

Rohan Paul@rohanpaul_ai

英伟达CEO黄仁勋："有人认为全球GDP上限是100万亿美元。但更可能发生的是，AI将使这100万亿变成200万亿、300万亿、500万亿。GDP的规模没有根本性的上限。"

大佬观点现象/趋势

02:01

Emad@EMostaque

分析表明，取消美国下半部人群的联邦税可惠及数百万人，对总税收影响有限（仅占3%），并有望为经济增添超千亿美元。Jeff Bezos指出，此举是不从民众口袋取钱的直接方式，对低收入群体意义重大。

Jeff Bezos: Thank you. The important part is zeroing out taxes on the bottom half. Best way to put money in someone's pocket is to n...

其他

01:56

AYi@AYi_AInotes

Meta泄露音频：员工培训AI后遭裁员，信任危机

近日，Meta CEO扎克伯格的内部音频泄露，他承认公司秘密收集员工键盘、鼠标和屏幕数据，用于训练Llama等AI模型，因Meta员工智力高可提升模型能力。然而，数据收集约20天后，Meta裁员8000人，引发“企业食人主义”批评：员工在不知情下训练可能取代自己的AI，资本剥削从时间升级到智慧。这损害了员工信任，揭示了AI时代高效但冷酷的用人逻辑——员工越优秀，其价值被快速榨取并抛弃的风险越高。

More Perfect Union: LEAKED AUDIO: In an all-hands meeting on April 30, Mark Zuckerberg tells employees that he's training AI on them ahead o...

Meta数据/训练现象/趋势

01:36

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

审判中最搞笑的时刻【引用 @rocketalignment】：ELON：如果我们制造大量机器人，必须确保它们安全，不能出现终结者那样的情况 KRY：你什么意思 ELON：嗯，如果你看过那部电影，就知道那不是什么好情况

🚀 Rocket Is Courtside: ELON: If we make a lot of robots we have to make sure they're safe, not a terminator situation KRY: What do you mean ELO...

其他安全/对齐

01:06

SemiAnalysis@SemiAnalysis_

如果你已加入氛围编程浪潮（我们当然也加入了！），你可能注意到一个瓶颈：曾经"租个便宜CPU盒子"的步骤，如今已不再像过去那样简单常规了。（1/3） 🧵

现象/趋势编码

00:19

小互@xiaohu

Midjourney创始人称被Google TPU坑惨

Midjourney创始人暗示他们被Google的 TPU坑了白白浪费了一年时间… 如果回到过去他会选择英伟达的GPU🤣 “这大概让我们的研究进度，比起一开始就完全采用 Nvidia 技术栈，落后了差不多一年。并不算特别理想。如果我能回到过去，我会从第一天开始就全部使用 Nvidia 的方案。”

David: @bubbleboi it probably put our research a year behind where it could have been if we were pure Nvidia stack, not totally...

Google图像生成大佬观点数据/训练

00:14

歸藏(guizang.ai)@op7418

Mac版豆包输入法试用体验

豆包输入法Mac版上线后，用户试用体验极佳，称其在准确性、中英文混合输入、专业名词识别和响应速度方面均为市面顶尖。与其他输入法相比，它解决了过度优化和无法实时预览的痛点，实现“言出法随”的快速输出与实时润色，避免乱加Markdown格式。对于如Claude Code、AntiGravity、Perplexity等专业术语与中文混合的场景，豆包输入法处理出色，用户已完全依赖其手机和电脑端。未来期待支持自定义提示词润色功能，但目前识别能力已无可挑剔。

端侧评测/基准语音

00:13

OpenRouter@OpenRouter

精选70

提示💡 你无需担心自动路由（以及所有单独模型）的缓存未命中问题 OpenRouter会将你的会话固定在一个模型/提供商上，直到缓存过期

教程/实践部署/工程

推荐理由：OpenRouter 这个 Auto Router 的缓存说明很实用，会话会被固定在一个提供者直到缓存过期，不用担心切换带来的不一致，API 开发者看一眼能省事。

00:02

向阳乔木@vista8

精选75

开源插件为Codex App增添高级功能

一个开源项目允许用户增强Codex App的功能。即使通过API登录，也能通过安装插件的方式启用Computer Use特性并添加Goal指令。项目还支持界面自定义，例如调整为类似Chrome浏览器的顶部Tab样式，并可设置任务开始和完成的提醒音效。相关开源项目地址已在评论区提供。

智能体MCP/工具OpenAI开源/仓库

推荐理由：这不只是个插件，它把 Codex 从只能聊天变成了能动手的 Agent，用 API 登录也能开 Computer Use，是给开发者装上了超能力的实用补丁。

5月20日

23:56

AYi@AYi_AInotes

Kimi 10分钟建站，零代码打造可售网站

Kimi 2.6能够一键生成获奖级别的网站，全程无需代码。配套的详细视频教程时长近10分钟，可指导用户快速上手，在极短的时间内产出可用于销售的成品网站，大幅降低了利用AI进行独立开发与变现的门槛。

AYi: Kimi做网站设计这么牛逼吗? 这个视频分享了怎么用Kimi 2.6做获奖10美元的网站, 教程讲的特别细, 需要字幕学习的可以评论区留言告诉我!

教程/实践编码

23:45

swyx🛬 SFO@swyx

虽然迟了很久，但现在回想起来，我认为@sama那句富有传奇色彩的"构建一个随模型进步而变得更好的业务"，基本上就是我在这里所说的Agent Labs。看到模型性能与Agent Labs收入之间存在非常直接的关联，在2025年第四季度出现断层。（摘自@patrickc的Stripe Sessions）

swyx🛬 SFO: New @latentspacepod Essay: why Agent Labs are clearly emerging in 2025 as a complement to Model Labs' all becoming AI Cl...

智能体大佬观点现象/趋势

23:33

elvis@omarsar0

自我改进的AI是件大事！

作者探索利用Fireworks AI Agent，通过自然语言交互自动化完成大语言模型的微调流程。他以Qwen小模型为例，调整其输出风格以优化PaperWiki项目的扩展效率。这一方法灵感源于@karpathy关于LLM知识库的推文，强调微调是让模型更“懂”数据的关键步骤。核心观点是自动化微调可推动构建可递归自我改进的AI系统，最终目标是打造一个能自我优化、用于知识发现和端到端自动化研究的强大工具。

elvis: http://x.com/i/article/2056851733582880768

智能体开源/仓库教程/实践数据/训练

23:14

歸藏(guizang.ai)@op7418

墨水屏新用途：AI推送与磁吸名片场景

墨水屏硬件可通过AI推送日历、待办事项等基础信息，利用磁吸设计便捷固定。关机时，借助墨水屏的常显特性可切换为电子名片，简化社交场合的加好友流程。该方案将打包为Skills分享，为同类硬件用户提供实用参考。

教程/实践端侧

23:03

elvis@omarsar0

通过AI代理自动化微调，将知识注入大语言模型权重

本文探讨了通过微调，将个人知识库（如LLM Wiki）的内容从依赖上下文窗口，转变为固化到模型自身权重中的方法。关键在于利用如Fireworks Agent这样的自主AI代理，仅需提供自然语言目标，它就能自动完成从数据准备、训练到部署的完整微调流程。这标志着模型自我改进的闭环成为可能：当训练成为AI工作流中一个可调用的步骤时，模型能主动将反复使用的模式（如特定写作风格或决策逻辑）学习并内化到权重中，从而实现使用与优化的持续迭代。

智能体MCP/工具教程/实践数据/训练

22:35

Chubby♨️@kimmonismus

从现在起，我需要知道： Seedance到底有什么魔力，能让他们的Model 2.0在Google I/O之后依然遥遥领先？ Seedance 2.0是在二月发布的（！）。 Model 3.0应该快了，而目前还没有任何模型能接近2.0的水平。

JSFILMZ: Google promised that Gemini Omni Flash would change the game, but when you put it side-by-side with Seedance 2.0... it's...

Google图像生成大佬观点视频

22:33

elvis@omarsar0

播客《Agentic Review》推荐：聚焦AI编程的务实对话

推荐QodoAI出品的播客《Agentic Review》，该节目以平衡的视角探讨AI代码生成的真实场景。通过主持人与Dexter Horthy、Scott Hanselman等嘉宾的深度对话，节目强调了上下文工程作为关键技术壁垒的重要性，并指出AI无法弥补破碎的开发流程，反而更凸显了代码审查与工程技艺的持续价值。核心观点认为，尽管编码方式可能变革，但软件开发生命周期的本质与严谨性将更加重要。节目避免了过度炒作或悲观论调，为AI工程师提供了有价值的实践参考。

智能体大佬观点编码

22:08

Berryxia.AI@berryxia

性能飞跃但成本激增，Gemini 3.5 Flash重新定义"轻量"？

Google发布的Gemini 3.5 Flash在性能上实现飞跃，智能指数达55分，超越Grok 4.3等竞品，幻觉率大幅下降，输出速度超280 tokens/s。然而，其运行成本是前代的5.5倍，定价显著提高，引发对“Flash”是否仍代表“便宜”的讨论。该模型已在ZenMux平台开放免费体验，实际测试显示效果惊艳，在多项Agent和多模态榜单中表现顶尖，标志着顶级智能与极致速度的新结合。

Berryxia.AI: 兄弟们! 今天已经可以在ZenMux上免费体验Gemini 3.5 Flash 了! 我第一时间用它跑了那个经典的「AI模型递归二叉树生长测试」. 同一个 Prompt ,不同模型画出的树形态完全不一样。(见视频-Prompt见评论区) G...

Google多模态推理评测/基准

22:08

Berryxia.AI@berryxia

黑神话悟空带火山西小西天，3D数字模型上线

推文分享了在通关《黑神话：悟空》后，对游戏中小西天场景原型——山西临汾隰县小西天悬塑艺术的震撼与实地探访。一个团队通过实地拍摄数千张照片，使用 Gaussian Splatting (3DGS) 技术，将其建成了一个可在线漫游的 3DGS 数字存档。该模型旨在保留明代悬塑密集的金色空间、细节与光感，让观众得以在屏幕前细细欣赏这一通常因平面印刷限制而难以被充分展现其震撼力的艺术瑰宝，并配有专门音乐。

MasterPa: 小西天,看着像视频,但其实是我们在现场实地拍摄 3,811 张 206 GB 的照片后建模的。FUNES 把《黑神话:悟空》里「既见未来,为何不拜」满天神佛的原型,来自自山西临汾隰县的小西天,做成了一个可漫游的 3DGS 数字存档。完全实...

图像生成教程/实践

22:03

Ethan Mollick@emollick

我开始难以集中注意力阅读即使是有趣的信息，如果它们是用Claude或ChatGPT的典型风格写成的。我认为部分原因是节奏的雷同，而非明显的语言癖好：Claude总是如此断断续续。ChatGPT则偏爱用短句作为收尾。很无聊。

AnthropicOpenAI大佬观点

21:47

meng shao@shao__meng

Claude Design 发布一个月了，还有朋友记得它吗？从 Google Trends 看，Claude Design 在进入 5 月后，迅速回落到发布前的数值。。

Anthropic产品更新现象/趋势

21:46

宝玉@dotey

title_zh：

David Hill: we've been busy redesigning the desktop app from the ground up the beta taught us a lot most importantly, that left side...

智能体大佬观点

21:16

meng shao@shao__meng

最近面试过程中，用 AI 辅助的候选人，明显多起来了 😄

面试中AI辅助效果不佳，回答泛泛缺乏针对性。深入项目经验时，AI只复述概念，不分享实际工程问题。面试官指出，AI能应对概念提问，但实战经验如工程“坑”无法替代，候选人需依赖真实能力。

智能体现象/趋势

21:08

Berryxia.AI@berryxia

推文描述了高强度训练后的身体反应，训练者得到教练肯定，但感到腿部明显发软与酸胀。文中将自身感受与提及的"香鱼"的腿部发软情况作了对比，并用"太酸爽"来形容整体的训练体验。

Berryxia.AI: http://x.com/i/article/2056641313874083840

其他

21:01

Emad@EMostaque

搞明白了【引用 @karpathy】：个人动态：我已加入 Anthropic。我认为未来几年在大语言模型前沿领域将尤为关键。我非常兴奋能加入这里的团队并重返研发工作。我依然对教育充满热情，并计划适时恢复相关工作。

Andrej Karpathy: Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....

Anthropic大佬观点

20:33

Ethan Mollick@emollick

递归自我改进的一个有趣附带效应是，只要它还在发生，就会让三大实验室对人才更具吸引力，同时缩短潜在竞争对手的启动窗口。

rohit: The most interesting fact here is that Andrej did not raise a few billion dollars to do what he'd supposedly be doing no...

大佬观点行业动态

20:08

Berryxia.AI@berryxia

本地AI生图"意外"加速，Draw Things新发现

在开源生图软件Draw Things中，一项意外发现显著提升了本地AI生图速度。将原为Z-Image Base训练的Z-Image-Fun-Lora-Distill与Z Image Turbo搭配使用后，原本需要8-9步的生成过程可缩减至3-4步，大幅缩短了本地生成时间，同时保持了画质与细节的稳定。这一组合有效突破了此前本地生图速度较慢的限制。

Draw Things: 🔍 An interesting discovery! 🧩 Z-Image-Fun-Lora-Distill from alibaba-pai was originally trained for Z-Image Base, with ...