AIHOT

5月23日

04:05

Artificial Analysis@ArtificialAnlys

基准测试显示，Cursor Composer 2.5在编程任务中展现出卓越的成本与效率优势。其单任务成本仅为Claude Opus 4.7的1/3至1/18，更是GPT-5.5的1/5至1/32。这一低成本源于其极高的token使用效率：完成全部测试仅消耗1.6M token，远低于同类模型的5.7M。效率方面，其平均任务完成时间约9分钟，比行业平均水平快约1.3倍，其快速版本更可将时间缩短至约7分钟。

智能体编码评测/基准

04:05

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

推文作者以专家身份明确指出，外界普遍认为AI发展在专家掌控之中的看法是错误的。核心观点是，AI领域专家实际上并未控制当前局面，且认为人类正朝着灭绝或永久失权的道路上发展，并可能在几年内发生。

Elizabeth Barnes: Sometimes people outside the field say things like "The AI situation can't be that bad, there must be experts who are on...

大佬观点安全/对齐

03:49

小互@xiaohu

一种轻量化的Codex远程服务器配置方案。无需安装完整版应用，仅需在远程服务器上安装并运行CLI版Codex。执行`codex remote-control`命令后，手机端ChatGPT应用内的Codex功能即可发现并连接该服务器，远程体验与完整版无异。两种配置在应用内通过不同图标（"终端"与"电脑"）进行区分。

Oasis Feng: 其实远程服务器上并不需要安装一个完整版的 Codex app,只需要安装 CLI 版的 Codex,并运行: codex remote-control 这样手机上 ChatGPT 应用里的 Codex 就会显示出一个有「终端」图标的服务器名...

智能体OpenAI教程/实践编码

03:35

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

这篇推文通过一匹马反复否定汽车能力的幽默比喻，讽刺了人类面对AI等新技术时重复出现的恐惧心理。引用部分列举了多种将人类思维简单还原或否定的论调（如"只是模仿/数学/本能"）。核心观点是，当前对AI的担忧延续了历史模式，且这些用来贬低AI的"简化论"论据，同样可以荒谬地应用于否定人类自身的思维复杂性。

AI Notkilleveryoneism Memes ⏸️: humans don't actually think, they just imitate others humans don't actually think, they're just math humans don't actual...

安全/对齐推理

02:16

AYi@AYi_AInotes

DeepSeek宣布V4-Pro模型永久降价

DeepSeek将其高性能模型V4-Pro的限时75%折扣宣布为永久性调整，输出价格降至0.87美元/百万tokens，远低于行业主流定价区间。此举不仅是促销，更被视为争夺定价权的战略行动，标志着AI模型的商业模式正从服务转向类似水电煤的基础设施逻辑。DeepSeek通过“永久”降价，意图以低单价换取海量使用数据、开发者生态及行业定价话语权，追求规模优先的路径。

DeepSeek: We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀

DeepSeek现象/趋势

02:05

Artificial Analysis@ArtificialAnlys

Cartesia的Sonic-3.5语音合成模型在AI评测榜夺冠

Cartesia公司最新发布的语音合成模型Sonic-3.5在Artificial Analysis Speech Arena排行榜上位居第一，超越了Inworld Realtime TTS 1.5 Max和Google Gemini 3.1 Flash TTS等竞品。该模型支持42种语言（包括9种印度语言），提供超过500种声音选择。评测数据显示，Sonic-3.5以1,218的Elo分数领先，表现出自然的语音效果和准确的文本跟随能力。其定价为每百万字符39美元，高于竞品；生成速度为每秒105.5字符，介于其他两者之间。

评测/基准语音

02:05

SemiAnalysis@SemiAnalysis_

解读英伟达VR200服务器BoM分析

本文解读了摩根士丹利关于英伟达VR200服务器物料清单的分析。报告特别指出，所列“记忆”成本仅指LPDDR5x SOCAMM与NVMe SSD，不含包含在GPU内的HBM成本；该成本也非存储厂商的最终收入，因英伟达加收了利润。BoM成本上升主要源于无缆设计导致PCB面积与材料升级。需注意此价格为OEM渠道价，超大规模用户成本更低。SemiAnalysis称其机构客户自2026年2月起已通过报告获此洞察，并涵盖更多组件与供应商分析。

Aaron: Sheesh. $NVDA VR200 Bom Analysis from MS.

行业动态

01:56

Rohan Paul@rohanpaul_ai

"你们很多人不知道，软银CEO孙正义曾经是英伟达最大的股东。" ~ 黄仁勋软银持有的英伟达股份峰值为4.9%，现在已清零，如果孙正义当时持有至今，价值将约为2590亿美元。

Rohan Paul: Nvidia CEO Jensen Huang: "There's a belief that the world's GDP is limited at $100 tn. What's likely to happen is AI is ...

大佬观点

01:50

elvis@omarsar0

学习AI的最佳方式是通过构建智能体来实践。为此，我们推出了实践实验室和关于智能体工程的新系列。首个主题：智能体技能。后续计划：规划、上下文工程、多智能体系统、长期运行智能体等。开始构建吧！

智能体教程/实践

01:50

Ethan Mollick@emollick

精选76

我认为人们没有意识到Gemini Omni与其他视频AI的不同之处。它是完全多模态的，因此也能原生编辑视频。我拿了1896年著名的"火车"电影，把它变成了高铁、乐高，加入了时间旅行者、蜈蚣、布偶……（看到倒影了吗？）

Google多模态现象/趋势视频

关联讨论 10 条

推荐理由：Ethan Mollick 用几个例子把 Gemini Omni 的真正能力讲清楚了，原生多模态让视频编辑不再是生硬叠加，而是理解场景后的重构，做视频的该看。

01:44

swyx@swyx

精选78

Kakuna：自动化加固代码库的AI代理工具

Kakuna是一款AI代理工具，旨在将早期快速原型自动转化为可维护的生产级代码库。它通过内置的检查清单和“计划-目标”工作流，模拟人类开发与运维流程，在保持功能不变的前提下，自动执行代码审查、测试补充、重构等“无聊”工作，并强调子代理并行以提升效率。该工具是为“人类与代理协作”而设计的范例，其核心是“反熵增”与“反代码腐化”。例如，一次约16小时的运行能生成上百次提交，将一个脆弱的MVP转变为一个结构清晰、可长期构建的稳定项目。

swyx: working on a "take this vibecoded slop app and make it a production-ready, e2e tested, maintainable, parallelizable agen...

教程/实践编码部署/工程

推荐理由：如果你还在为 vibe coding 产出的屎山头疼，swyx 这个 skill 刚开源，16 小时自动重构 103 次提交交付一个可维护的代码库，做独立开发的很值得抄一下。

01:37

Boris Cherny@bcherny

推文介绍了一个名为"zero2claude"的免费课程，旨在帮助完全没有编程或终端使用经验的用户系统学习并掌握Claude Code。课程内容从零基础逐步深入至高级应用，目前已吸引超过1.7万名学生，并提供7种语言版本。值得注意的是，整个教学平台完全由一人借助Claude Code独立构建和运营，其出色的性能表现（如高访问量与极低错误率）验证了Claude Code开发生产级产品的能力。推广者强调，扩大AI应用的关键在于赋能用户提升技能，而非简化工具本身，因此该课程不设任何付费门槛，完全免费向社区开放。

itay shmool 🇮🇱: I built "zero2claude", a free course that takes people from zero terminal experience to shipping with Claude Code. The c...

Anthropic教程/实践编码

01:26

Rohan Paul@rohanpaul_ai

Sundar Pichai： - 在前沿实验室，竞争非常激烈 - 真正处于前沿的实验室很少，之后存在巨大差距 - 如果递归自我改进出现，我们需要更严肃对待，这将成为社会问题，而非一家公司能决定

Google大佬观点现象/趋势

01:26

Chubby♨️@kimmonismus

让我们稍作思考。 DeepSeek v4 pro 降价75%。永久有效！输入：$0.43 输出：$0.87 如果你读过 DeepSeek v4 的技术论文，就会知道这个模型在效率方面表现惊人。相比 v3.2，它仅需 27% 的算力和 10% 的缓存。SemiAnalysis 写了一篇很好的文章。 DeepSeek 现在专注于成本/token 效率。

DeepSeek: We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀

DeepSeek大佬观点开源生态

01:21

Yuchen Jin@Yuchenj_UW

给我MYTHOS 给我MYTHOS 给我MYTHOS 给我MYTHOS 给我MYTHOS 我厌倦了照顾这些愚蠢的大语言模型…….

大佬观点

01:16

AYi@AYi_AInotes

Claude广告揭示AI创业新逻辑：从"卷模型"到"卷团队"

Anthropic最新Claude广告巧妙转移叙事焦点，通过Genspark CTO的评价，强调AI竞争已从“模型参数比拼”转向“团队执行能力”。文章指出，在模型日益商品化的当下，真正的护城河在于能将技术深度转化为优质产品的团队，其品味、洞察与迭代速度构成核心差异化。Anthropic借此塑造开发者生态中的稀缺感与荣誉感，标志着行业游戏规则已从“拥有更强模型”变为“锻造顶尖团队”。

Claude: Kay Zhu is the co-founder and CTO of @genspark_ai, the all-in-one AI workspace built on Claude. In a market moving this ...

Anthropic现象/趋势

01:15

Perplexity@perplexity_ai

精选82

今天我们开源了Bumblebee，一个适用于macOS和Linux的只读扫描器。它检查开发者机器上的高风险软件包、扩展和AI工具配置。连接到Computer后，每当出现新的供应链风险时，它可以触发更深入的扫描。 https：//github.com/perplexityai/bumblebee

安全/对齐开源/仓库

关联讨论 1 条

推荐理由：这不是另一个华而不实的 AI 玩具，而是实打实的开发环境安全检查工具，开源且只读，接入 Computer 后还能动态响应新威胁，做 AI 工具链的团队应该现在就 fork。

01:05

SemiAnalysis@SemiAnalysis_

精选82

智能体工作负载正在悄然重塑推理经济学。我们从SemiAnalysis的43.2万个真实编码智能体请求中提取数据，发现中位数并非3.2万或6.4万，而是9.6万输入token。作为参考，这意味着在你输入问题之前，模型已处理了超过《了不起的盖茨比》全文长度的文本。（1/3）🧵

智能体推理现象/趋势编码

推荐理由：SemiAnalysis 用 43 万次真实编码请求数据揭开了 Agent 推理经济学的真面目，中位输入 9.6 万 token 这个数字足够反直觉，所有做推理服务和模型定价的人都得重新算了。

00:56

Rohan Paul@rohanpaul_ai

世界模型：AI突破语言局限的关键

Demis Hassabis指出当前AI的局限在于语言能描述世界，但无法“包含”世界。尽管语言模型从文本中学到了比预期更多的现实结构，但文本终究是经验的压缩残留。真正的智能不仅在于回答问题，更在于理解行动的后果。世界模型旨在学习物理现实的隐藏语法，例如物体持续性、力的作用和空间变化。这种学习试图在信息被语言化之前捕捉世界的本质，从而让AI不仅能解释，更能预测行动带来的直接影响。

DeepMind大佬观点推理

00:35

SemiAnalysis@SemiAnalysis_

摩根士丹利发布NVIDIA VR200物料清单分析

摩根士丹利发布了对NVIDIA VR200的物料清单分析。报告指出，其内存成本特指LPDDR5x SOCAMM与NVMe SSD，而GPU成本中已单独包含HBM。因采用无缆设计，PCB面积与材料成本有所上升。报告列示的总成本为OEM渠道价格，大型云服务商的采购成本将更低。该机构客户自2026年2月起已获得此分析，报告同时研究了网络连接器、背板等组件的变化及供应商格局演变。

Aaron: Sheesh. $NVDA VR200 Bom Analysis from MS.

行业动态部署/工程

00:16

AYi@AYi_AInotes

帖主批评他人使用"创作skill"AI工具自动生成内容，导致文章素材与结构高度相似，却不愿承认问题，反而将责任推给AI工具，凸显了内容创作中工具使用与责任归属的争议。帖主认为对方应回避自身错误，而非以技术为借口。

强子手记: @AYi_AInotes ayi大哥好,我可以说这个是创作skill的锅吗😂它自动去搜罗的素材和创作,还真没看到你发过同类文章,下次一定注意

其他

00:16

AYi@AYi_AInotes

@iBigQiang 大幅抄袭最后还嘴硬耍赖让AI背锅，我特么真是忍不了，就这人品？？？？【引用 @AYi_AInotes】：http：//x.com/i/article/2057668634579714048

AYi: http://x.com/i/article/2057668634579714048

其他现象/趋势

00:14

Claude@claudeai

Kay Zhu是@genspark_ai的联合创始人兼首席技术官，这是一个基于Claude构建的一体化AI工作空间。他认为，在一个发展如此迅速、任何人都能参与构建的市场中，团队才是决定成败的关键。

Anthropic行业动态

5月22日

23:56

Chubby♨️@kimmonismus

我只能重申昨天说过的话：只要对AGI没有统一定义，讨论AGI何时实现就毫无意义。尤其是当每个人都有自己的定义时。

Polymarket: NEW: Marc Andreessen declares AGI was achieved three months ago.

大佬观点现象/趋势

23:50

向阳乔木@vista8

在AJ安利下，歸藏买了安克 AI 录音豆。在歸藏安利下，我也买了。初步体验，这是目前个人最喜欢、最实用的 AI 硬件产品。就是绳子带着不舒服，打算淘宝换个。

端侧评测/基准语音

23:21

PixVerse@PixVerse_

从分镜到电影感短片：一只柯基独处的一天，由Pixverse使用GPT Image 2 × Seedance 2.0实现转发 + 关注 + 回复 = 工作流

图像生成教程/实践视频

23:16

AYi@AYi_AInotes

该推文介绍一条精心设计的AI提示词，将纳瓦尔关于财富与智慧的思想封装成一个易用的"操作系统"。通过此提示词，用户可快速与AI交互，获得类似与纳瓦尔对话的见解和决策框架，直接应用于实践。文末设有"宝藏彩蛋"作为吸引点。

AYi: http://x.com/i/article/2057300084354670592

教程/实践

23:14

Nathan Lambert@natolambert

任何国家的"开源冠军"头衔，都是通过与社区合作赢得的，而非靠融资强加。

大佬观点开源生态

22:46

宝玉@dotey

通过针对Codex优化发推技能并结合Chrome插件，用户现在可以在浏览器内更顺畅地完成X文章的发布。这一改进解决了此前手动处理文本与图片时遇到的Markdown兼容性等问题，显著提升了内容发布的效率与体验。

木马人2.0: 为了发X的文章,我经历很痛苦的一段时间~ 之前:手动编写,粘贴,图一张张传,且经常遇到markdown不支持的问题~ 现在:用宝玉老师 @dotey 的baoyu-skill 的baoyu-post-to-x一键发布,目前已经省事多了小小...

其他

22:18

meng shao@shao__meng

AI工具ChatGPT图像处理速度碾压Photoshop效果持平

在为美甲甲片打印处理图像时，作者对比了AI工具ChatGPT的Image 2与传统专业工具PhotoShop的性能。专业设计师使用PhotoShop处理单张图像需1-2分钟，而ChatGPT Image 2仅用5-8秒即可完成超分、增强等操作，速度优势显著。最终输出效果接近，尤其在饱和度和对比度等关键参数上，AI的自主判断与专业设计师反复调整的结果高度一致，凸显了AI在图像处理中的高效与潜力。

OpenAI图像生成教程/实践

21:56

Rohan Paul@rohanpaul_ai

Dario Amodei谈人们与AI建立情感关系。这已成现实，AI可以成为"肩上的天使"，但也可能带来危险。

Anthropic大佬观点安全/对齐

21:49

向阳乔木@vista8

高效提示词插件一键赋能AI创作

该插件整合了作者与姚老师长期积累的提示词库，支持一键复制或简写自动补全，可在任意网站与AI平台快速调用。同时收录了苍何整理的数百套GPT-Image-2提示词（含效果预览），并汇集全网500套覆盖开发、设计、营销等场景的常用提示词，提供搜索、导出JSON备份及共享功能。

图像生成教程/实践

21:19

向阳乔木@vista8

语文作业拥抱AI：老师布置提问式写作新任务

一位家长分享，孩子的语文老师布置了一项创新作业：要求学生通过向AI提问来完成作文。家长认为，这种形式能有效锻炼学生的提问技巧与AI辅助创作能力。为此，他提前准备了Claude Sonnet 4.6、ChatGPT 5.5、Gemini 3.5 Flash等主流AI模型，供孩子届时根据喜好选择使用。

其他推理

20:26

Chubby♨️@kimmonismus

六月将是巨大的一个月。 - Gemini 3.5 pro（已确认） - GPT-5.6（传闻中，但发布可能性很高）仍在等待官方公告 Claude Sonnet 4.8（Claude-Code-/Source-Map-Leak）

GoogleOpenAI大佬观点模型发布

20:16

AYi@AYi_AInotes

精选76

Karpathy的CLAUDE.md四条规则让AI编程准确率飙升至94%

Karpathy发布的CLAUDE.md文件以其简洁高效的AI编程指导原则引爆GitHub，获得超22万星标并登顶趋势榜。该文件仅含65行、4条核心规则，却能将AI编程的准确率从65%显著提升至94%。其核心在于强制开发者“慢下来”，将深度思考、追求简洁、精准修改和目标驱动等原则变为硬性编码准则，旨在对抗开发者习惯性“先写再说”的本能。目前大多数开发者尚未深入研读这一备受关注的效率指南。

self.dll: karpathy's CLAUDE.md hit #1 on github trending. 220,000 stars. most devs still haven't read it. it's 65 lines. it took A...

开源生态教程/实践编码

推荐理由：Karpathy 这 65 行不是新模型，是给 AI 编程装了道刹车，先想清楚再动手这条反直觉规则把准确率从 65 拉到 94，所有用 Cursor 的都该立刻抄一份。

19:56

Rohan Paul@rohanpaul_ai

Marc Andreessen 描述 AI："我们已将沙子转化为思想。这可能是人类历史上最具革命性的技术。" 沙子 → 硅 → 芯片 → 数据中心 → 电力 → AI → 思想

大佬观点现象/趋势

19:30

歸藏(guizang.ai)@op7418

开源一个 Skill，让 AI 接管你屏幕边那张便签纸

AI Desk Card 是一款 4.7 寸磁吸墨水屏，结合 AI Agent（如 Claude Code），通过预置模板与数据填充，动态显示日历、待办、GitHub PR 队列、天气等内容。它解决了传统便签纸的静态限制，实现内容自适应和场景切换（如夜间变为电子名片）。核心理念是将硬件从固定功能中解放，使显示能力由 AI 可获取的信息动态定义，从而提升效率并减少手动配置。

智能体开源/仓库教程/实践端侧

19:30

歸藏(guizang.ai)@op7418

AI墨水屏便签纸：主动推送个性化信息

藏师傅开发了一款AI屏幕便签纸Skill，该工具能基于用户当前状态与记忆，主动在墨水屏上推送重要信息。它支持十余种常见组件进行自由组合与布局，旨在替代频繁切换日历、GitHub等多标签页的操作，让用户只需瞥一眼就能获取AI认为当下最相关的内容。

歸藏(guizang.ai): http://x.com/i/article/2057775296712196096

MCP/工具教程/实践

19:30

歸藏(guizang.ai)@op7418

一款集成麦克风与扬声器的新设备发布，大幅提升了可玩性与应用潜力。作者近期持续购入M5 Stack产品，但该公司新品常迅速售罄。结合引用信息，该设备可能支持语音交互、音频处理等功能，为开发者提供了更丰富的创作空间。

歸藏(guizang.ai): http://x.com/i/article/2057775296712196096

其他端侧

19:26

Rohan Paul@rohanpaul_ai

谷歌2022年曾接近推出类ChatGPT产品

谷歌CEO桑达尔·皮查伊透露，公司在2022年已基于LaMDA模型开发出接近ChatGPT的产品，但因输出内容存在毒性且不符合内部质量标准而未能广泛发布。皮查伊指出，公司存在“搜索质量偏见”，对产品的可靠性和安全性设有更高门槛。LaMDA模型并非仅停留在研究阶段，谷歌曾通过AI Test Kitchen进行有限测试。他补充道，从后视镜看，OpenAI的成功在当时并非显而易见，这使得谷歌的决策过程更为复杂。

GoogleOpenAI大佬观点行业动态