AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
5月30日周六
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月30日
20:16
François Chollet@fchollet
17
当人类背离人性之时,终局将至。
大佬观点
20:14
The Decoder:AI News(RSS)
53
陶哲轩认为 AI 可为数学带来史上首次分工

数学家陶哲轩阐述了 AI 如何通过首次实现分工来重塑数学研究。目前,研究者需亲力亲为完成从问题建模到结果验证的全过程。陶哲轩预见“工业数学”的出现:由大型 AI 辅助团队取代孤军奋战的天才,而人类在提供“灵感性猜想”方面仍不可或缺。

大佬观点推理
20:11
向阳乔木@vista8
63
X算法大改:你的粉丝积累,基本上白费了

法国创业者Arnaud Bertrand通过分析X在GitHub公开的最新算法代码,揭示创作者触达率暴跌的核心原因。其一是2026年4月上线的自动翻译功能,使同一话题下的内容竞争者数量级激增。其二是新版算法采用两阶段排序:先基于话题语义从数十亿帖子中筛选约1,500条候选帖,再由Grok模型依据15个预测行为打分,其中粉丝量与账号历史权重被大幅削弱。5月15日更新进一步引入一次性曝光过滤、作者多样性评分等机制。结论是算法结构性偏爱带媒体、情绪化、强话题性的内容,每条内容需独立竞争,话题选择比账号积累更重要。

搜索现象/趋势
19:46
Chubby♨️@kimmonismus
16
好吧朋友们,这听起来可能有点奇怪。当我的智能体在工作时,我会在后台玩挂机游戏。 我的问题是:你知道有什么好的挂机游戏可以在Steam或iOS上玩,同时让Codex工作吗?:D
其他
19:44
Xiaomi MiMo@XiaomiMiMo
56
MiMo-V2.5系列推理有哪些新进展? 我们刚刚发布了一篇博客,详细介绍了针对MiMo-V2.5系列的全链路推理优化,包括如何将混合SWA效率推向极限。 阅读全文请访问: https://mimo.xiaomi.com/blog/mimo-v2-5-inference
推理教程/实践部署/工程
19:34
AYi@AYi_AInotes
57
Tesla FSD中国路测震撼表现,引申AI工具使用哲学

推文感叹Tesla FSD在中国路测中的会车能力表现惊艳,堪称“遥遥领先”。引用推文进一步探讨了AI工具的使用本质,提出工具分为替人思考的“Agent型”和与人共思的“实习生型”(以Cursor为代表),后者是使用者“以术入道”、磨炼判断力的过程。其关键瓶颈是必须在场,而作者通过免费工具UU远程(4K 144帧、原生终端支持)在手机上远程操控运行Cursor的Mac,解决了此限制。

AYi: 今天,把一件关于 AI 很底层的事,彻底想透了。 使用 AI 的最佳方式是以道御术,但前提是你得先以术入道。 就像黄仁勋说的--真正会用 AI 的人,都是极高认知的提问者,带着自己的认知去提问,让 AI 帮你叩开未知的边界,而不是让它替你思...

智能体大佬观点
19:21
IT之家(RSS)
61
小米 MiMo-V2.5 系列 API 永久降价并公开推理优化方案

小米 MiMo-V2.5 系列 API 完成永久降价,最高降幅达 99%。其技术基础是公开的推理系统全链路优化方案:针对 Hybrid SWA + MoE + 多模态的复合架构,系统性重构了 KVCache 管理、分级缓存、前缀缓存与调度策略。核心优化包括将 KVCache 存储压缩至约 1/7,线上前缀缓存命中率平均达 93%,TTFT P90 降低 30%,Prefill 性能提升约 40%,Decode 阶段前 128 token 加速比达 2.3×。多模态视频处理端到端延时从 156 秒降至 23 秒。该方案宣称是业内首篇全面覆盖此类复合架构的大规模工程落地方案,模型能力无缩减。

推理教程/实践部署/工程
19:19
Peter Steinberger 🦞@steipete
51
使用 GPT 5.5、/goal、autoreview 和 crabbox 后,我的提示词任务从约30-60分钟变成了常常4-10小时的任务,而我对结果准备就绪的信心也大大提高了。 让智能体屈服是一种技能。
智能体OpenAI大佬观点
19:16
Rohan Paul@rohanpaul_ai
69
调查显示超八成企业尚未从AI获得生产力提升,智能体能耗问题引关注

一项对6000名高管的调查显示,尽管投入巨大,超过80%的公司尚未从AI中获得生产力提升。仅1/3的领导者使用AI,且平均每周使用时间仅约90分钟。不过,多数受访者预期AI未来三年内将提升生产力。与此同时,Goldman Sachs预测AI智能体的Token使用量到2030年将增长24倍,因其任务循环消耗的Token可能远高于普通对话。智能体生产力与Token消耗之间的平衡,正成为企业新的成本考验,微软近期收紧了对Claude Code的访问即是一例。

Rohan Paul: Goldman Sachs: "Token use by AI agents is expected to multiply 24 times by 2030" AI agents are now creating the first se...

智能体Microsoft现象/趋势
18:49
Peter Steinberger 🦞@steipete
66
我一直用Codex做这个。让它审查代码找bug,它会说一切正常;告诉它有bug,它就会反复循环,然后找出问题。

Lea Verou, PhD: 💡Recent insight: gaslighting @claudeai seems to improve code quality >90% of the time. "You overengineered this, there ...

AnthropicOpenAI教程/实践编码
18:46
Chubby♨️@kimmonismus
46
文章探讨了OpenAI GPT系列模型的迭代策略。核心观点是,模型更新不仅意味着能力增强,更重要的是token效率的提升。token效率的提高直接带来更低的延迟、成本和摩擦,对于未来更复杂、运行时间更长的AI智能体工作流至关重要。从GPT-5.0到GPT-5.5的每次迭代,都在能力和token效率(进而带来速度增益)上实现进步,GPT-5.5是目前最好的模型。作者肯定了GPT-5.5在推理和执行效率方面的实际提升,并对GPT-5.6将变得更高效抱有高期望。

Tibo: When we go from GPT-5.0 -> GPT-5.1 -> ... -> GPT-5.5, the number incrementing goes with improvements in capabilities and...

OpenAI大佬观点推理
18:42
歸藏(guizang.ai)@op7418
70
GitHub周榜第一:社交媒体卡片Skill

一个名为“guizang-social-card-skill”的社交媒体卡片技能,在GitHub本周新建项目Star排名中冲到了第一名。作者通过群友发现自己的项目登顶,并亲自确认了这一成绩。

歸藏(guizang.ai): http://x.com/i/article/2059811469081141248

开源/仓库
18:39
公众号:小米 MiMo
59
MiMo-V2.5 系列推理全链路优化:将 Hybrid SWA 效率推向极致

小米发布 MiMo-V2.5 系列模型(含 MiMo-V2.5、MiMo-V2.5-Pro),采用 Hybrid Sliding Window Attention(Hybrid SWA)架构,KVCache 存储与计算量均降至 Full Attention 的约 1/7。以 MiMo-V2.5-Pro 为例,70 层中仅 10 层为 Full Attention,60 层为 SWA(窗口大小 128)。团队围绕 KVCache 系统重构(双池管理、按层异步拉取、SWA-aware 前缀缓存树)及分布式缓存 GCache 等环节优化,使存储效率提升约 7×,显著降低长上下文推理成本。

推理教程/实践部署/工程
17:46
Rohan Paul@rohanpaul_ai
54
高盛:AI 智能体 token 消耗到 2030 年将增长 24 倍

高盛预测,到 2030 年,由 AI 智能体驱动的模型 token 月度消耗量将激增至 120 quadrillion,较当前增长约 24 倍。核心原因是智能体在完成单次用户请求时,需要进行多轮工具调用、结果检查与修正,导致其 token 消耗量可能达到普通问答的 10 倍甚至 50 倍以上。这一趋势引发了成本担忧,Uber 和 Microsoft 等公司已开始重新评估昂贵的智能体使用方案。报告同时指出,推理成本正以每年 60%-70% 的速度下降,智能体带来的生产力提升与潜在的 token 浪费正成为新的博弈焦点。

智能体现象/趋势行业动态
17:44
The Decoder:AI News(RSS)
56
Salesforce声称AI代理将231天的迁移缩短至13天,且事故更少

Salesforce宣布已将整个开发组织迁移至Anthropic的Claude Code,并取消了token限制。其2026年4月报告显示,每位开发者的pull request数量增加了79%,生产事故减少了5%。这些数字未经独立验证。此次迁移突显了编码领域对智能体化转型的巨大分歧:这究竟是真正的革命,还是前所未有的技术债务积累?

智能体Anthropic现象/趋势编码
17:34
AYi@AYi_AInotes
43
以术入道,用远程工具连接你的AI实习生

推文通过《黑袍纠察队》AI视频案例,点明AI意义在于呈现“希望发生的”剧情。核心讨论了AI工具的两条发展路径:以Claude Code为代表的“AI智能体型”(自主运行)与以Cursor为代表的“实习生型”(需人类监督判断)。作者认为后者是“以术入道”培养判断力的过程,但受限于必须人在场。为此推荐使用免费的UU远程配合Cursor,实现手机远程控制电脑,消除物理距离限制,从而随时随地磨练使用者自身,成为优秀的提问者。

AYi: 今天,把一件关于 AI 很底层的事,彻底想透了。 使用 AI 的最佳方式是以道御术,但前提是你得先以术入道。 就像黄仁勋说的--真正会用 AI 的人,都是极高认知的提问者,带着自己的认知去提问,让 AI 帮你叩开未知的边界,而不是让它替你思...

图像生成现象/趋势视频
17:34
Berryxia.AI@berryxia
50
X平台算法更新致流量普遍下滑,核心机制与应对分析

X平台近期算法更新导致众多用户(包括大V)帖子触达量显著下降。核心原因在于平台推出自动翻译功能,使内容竞争从单一语言圈扩大至全球范围,竞争池倍增。同时,粉丝数的流量分配作用被大幅削弱,每条帖子都需通过预测互动率单独争取读者。算法分两步工作:先从全平台约1500个候选帖中检索,再由基于Grok的模型通过预测约15种用户互动行为(如喜欢、回复、停留、屏蔽等)的概率来排序打分。最关键的逻辑是,算法打分完全基于预测的互动可能性,不考量内容质量、作者专业性或资历。因此,长文流量下滑是多重机制叠加的结果。

Arnaud Bertrand: So I spent some time studying the new Twitter/X algorithm today since the latest version was published about a week ago ...

xAI搜索现象/趋势
17:19
凡人小北@frxiaobei
38
现在好像没有 cv 工程师了, 都是 accept 工程师或者 yes 工程师了。
现象/趋势编码
16:21
IT之家(RSS)
61
何小鹏:很多机器人公司没做好小脑,他们做的是"脑干、脊椎"
具身智能大佬观点
16:10
Tibo@thsottiaux
19
当我们从 GPT-5.0 -> GPT-5.1 -> … -> GPT-5.5 时,版本号的递增伴随着能力的提升和 token 效率的提高(这转化为速度的提升)。GPT-5.5 是我们迄今为止最好的模型。 我们希望继续这一简单的策略。
OpenAI大佬观点
15:46
Rohan Paul@rohanpaul_ai
47
日本AI数据中心热潮正推动液冷技术普及

日本AI数据中心热潮正推动企业从传统空气冷却转向液冷技术,主要原因是AI GPU机架的散热需求激增。当前冷却已占数据中心用电量的30%至40%,且GPU发热量在5年内翻了一倍多。传统风冷因空气载热能力有限,面临噪声大、能耗高及物理空间限制。液冷技术通过将金属冷板直接贴合芯片,利用液体流道高效导热,能更高效地移除热量并提升芯片温度稳定性。其主要挑战在于安装成本较高且需专门的服务器机架设计。日本的Fuji Electric、Nidec、Mitsubishi Heavy等公司正积极开发相关系统。

数据/训练现象/趋势部署/工程
15:41
Hacker News 热门(buzzing.cc 中文翻译)
精选71
最后一次技术面试

Steve Yegge 在 Medium 发表观点文章《最后一次技术面试》,探讨 AI 时代传统技术面试的意义变化。文章在 Hacker News 社区获得 100 分关注。

大佬观点编码

推荐理由:Steve Yegge 用他一贯犀利的文笔预言技术面试的终结,这不是危言耸听,而是给所有还在刷 LeetCode 的开发者提前拉响的警报。
14:49
Greg Brockman@gdb
44
AI加速研究,通过扩展数学家和科学家敢于尝试的边界: AI能给予研究者追求"更疯狂"想法的自由。 对陶哲轩而言,AI创造了更多空间去实验、测试意想不到的路径,并发现那些原本可能无法企及的成果。

OpenAI: AI can give researchers the freedom to pursue "crazier" ideas. For Terence Tao, AI creates more room to experiment, test...

OpenAI大佬观点
13:41
向阳乔木@vista8
57
AI自动化解决Chrome CDP调试弹窗确认问题

Chrome的CDP调试在使用Codex或Claude Code时,每次调用都弹出确认对话框,尤其在远程服务器或Mac Mini上运行技能时影响自动化执行。由于强制确认且无配置文件调整,用户让Codex编写脚本自动点击确认,虽可能不安全,但个人电脑上可接受。这启发将电脑重复操作脚本化,避免使用Computer Use等方案,因其速度慢且成本高。

教程/实践编码
13:34
Berryxia.AI@berryxia
56
AI家教的"贴心陷阱"

本文批评当前AI家教产品(如Claude、GPT)直接给出完整答案的模式,认为这相当于“抄袭答案”,跳过了学习必需的“适度挣扎”过程,导致知识无法进入长期记忆。作者指出,研究显示适度挣扎能强化大脑记忆连接。而提供完整思维链(如Qwen、GPT展示CoT)或追求交互满意度并非关键。相比之下,Koji与Brilliant等产品通过追问卡点、分步解锁等方式鼓励学生主动思考。文章强调,优秀的AI家教核心应是帮助学生真正掌握知识,即便过程“有点烦”。

Sue: AI is making kids dumber. It should be making them geniuses. Introducing Koji, the first AI tutor that gets kids to actu...

教程/实践现象/趋势
13:11
向阳乔木@vista8
72
近期X平台用户互动下降,主要受两大因素影响。一是全球自动翻译功能于2026年4月7日上线,打破了语言壁垒,使得同主题内容(如地缘政治)的潜在竞争者数量从约5000个英语账户剧增至约5万个全语言账户,大幅降低了单个帖子的能见度。二是推荐算法根本性转变:粉丝权重降低,每条帖子需基于预测互动独立赢得受众。新算法采用两阶段机制:先通过语义匹配从全平台筛选出约1500个候选帖,再通过一个Grok模型基于15项预测互动指标(如点赞、回复、停留时间等)进行排序。其中,负面互动(如标记不感兴趣、屏蔽)会被负向加权,直接影响展示优先级。

Arnaud Bertrand: So I spent some time studying the new Twitter/X algorithm today since the latest version was published about a week ago ...

开源生态现象/趋势
12:49
Greg Brockman@gdb
22
用 Codex 开发的感觉太棒了

Carol Monroe: Nobody talks about how pleasant building with Codex feels

OpenAI大佬观点编码
12:42
歸藏(guizang.ai)@op7418
20
我在想藏师傅的这种东西是不是绝佳的前端训练数据可以造非常多 【引用 @op7418】:http://x.com/i/article/2059811469081141248

歸藏(guizang.ai): http://x.com/i/article/2059811469081141248

大佬观点数据/训练
12:41
向阳乔木@vista8
62
推文宣布了与姚老师合作举办的GEO公开课。姚老师将主讲GEO的底层逻辑、方法、系统原理及理念,并分享一系列核心资源,包括GEOFlow系统、用于创建技能的元Skill、17套GEO Skill合集,以及收录41篇最新论文的资料库。此外,分享内容还涵盖《GEO到底是什么》等多篇白皮书、红皮书、蓝皮书及AI营销提示词合集。该公开课将通过WaytoAGI进行直播,另一位主讲人将负责AI工具与模型相关的问答环节。

姚金刚: 今晚八点,会通过WaytoAGI做第一场GEO直播分享,会把GEO的底层逻辑、方法、系统原理及理念做一轮讲解,相关的一些资料和系统如下,分享给大家: 1、GEOFlow,今晚主讲的系统和背后的GEO原理 https://github.com...

开源/仓库搜索教程/实践
12:11
meng shao@shao__meng
31
用户吐槽Claude Opus 4.8升级不大,还遇到账号问题

Claude Opus 4.8发布后,部分用户反馈其相比Opus 4.7升级感知不强,甚至认为模型变笨了。同时,有声音指出GPT-5.5更好用,并调侃该模型是否蒸馏了Qwen。此外,有用户在发布后尝试测试,发现自己的新注册账号意外变为“未注册”状态,此前该账号仅发送过一条消息,引发了对账号安全性的担忧。

AnthropicOpenAI大佬观点模型发布
12:11
向阳乔木@vista8
52
Codex 制作的 Suno MTV,任意一首Suno歌曲自动转成带LRC歌词同步显示的 MV。 图片由Codex根据歌词内容自动生成,还挺符合意境。
图像生成多模态教程/实践
12:10
宝玉@dotey
70
群聊总结技能更新:支持上下文问答

我今天对群聊总结的 Skill 更新了个小功能,在群里 @bot,总结群聊记录的时候,就可以结合聊天记录的上下文,在总结的时候回复问题 具体参考:https://github.com/JimLiu/baoyu-skills/commit/a85c81e8db8a19a633e30dda0823e8a9c686263d

宝玉: baoyu-skills 新加了一个 Skill: 微信群聊总结 Skill:https://github.com/JimLiu/baoyu-skills/tree/main/skills/baoyu-wechat-summary 依赖于 ...

智能体教程/实践
11:40
Tibo@thsottiaux
13
@JustinBleuel 正在用 Codex 不断交付成果,并让 ChatGPT 变得更好。值得关注(也可以向他吐槽)。
OpenAI其他
11:40
Tibo@thsottiaux
24
你还会相信评测基准吗,还是只听朋友的?是什么让你尝试一个新模型?
其他评测/基准
11:18
MarkTechPost(RSS)
52
Hermes Agent 为 MCP 推出工具搜索功能:Anthropic 评测显示 Opus 4 准确率提升 49% 至 74%

Nous Research 的 Hermes Agent 为 MCP 添加了工具搜索功能,以解决上下文膨胀问题。该功能采用 BM25 渐进式模式披露机制。根据 Anthropic 的评测,在 Opus 4 模型上,此功能实现了 49% 到 74% 的准确率提升。

智能体AnthropicMCP/工具开源/仓库
11:14
elvis@omarsar0
65
MCP:AI智能体不可或缺的基础协议

作者认为MCP(模型上下文协议)对AI智能体的未来至关重要,其核心价值不仅在于工具连接,更在于它所启用的抽象能力。作者以自身构建的自我改进系统为例,该系统完全通过MCP驱动,展示了MCP如何赋能智能体间交互、实现复杂协调、版本控制、评估工作流及工具集成等关键功能。作者强调,尽管新事物可能不断涌现,但MCP协议本身对于未来所有进展将是必要且关键的基础。

智能体MCP/工具大佬观点
11:10
meng shao@shao__meng
59
Salesforce 工程如何从 Copilot 走向 Agentic?

Salesforce 分享了工程团队从“Copilot 辅助”演进到“Agentic 工程”的路径,即让智能体承担软件开发生命周期的执行层,工程师专注于目标、规则与验收。关键变革包括:全组织采用 Claude Code 并取消 token 限额、推行“规则即代码”(Markdown 规则+参考实现)、以及自治与并行。一个原估 231 人天的 API 迁移案例,仅用 13 天完成。变革成果体现在:PR 数量增加 79%,有效产出增加 151%,事故减少 5%。真正的信号是下游流程也被智能体接住,避免了“代码洪水”。工程师的核心能力转变为设计智能体工作流与沉淀规则库等复利资产。

Boris Cherny: Salesforce published a detailed writeup on going agentic with Claude Code. A couple things jumped out. A migration they'...

智能体Anthropic现象/趋势编码
11:10
Hacker News 热门(buzzing.cc 中文翻译)
60
MCP 死了?

Hacker News上一篇题为“MCP 死了?”的文章引发讨论,获得了103分。文章来自quandri.io,发布于2026年5月29日,但未提供关于MCP(模型上下文协议)现状的具体论述或结论。

智能体MCP/工具现象/趋势
10:40
Hacker News 热门(buzzing.cc 中文翻译)
46
什么是迪科弗?

基于您提供的文章内容,当前仅包含标题“What Is a Dickover?”及元数据(来自daringfireball.net,2026年5月29日发布,获108 HN Points)。由于缺少正文主体,无法提取关于“迪科弗”的具体定义、背景或论述,因此无法生成完整摘要。

大佬观点现象/趋势
10:10
meng shao@shao__meng
36
构建生产级AI智能体框架的完整指南

如何构建你自己的 Agent Harness? 先看几个问题: · 生产级 Harness 是“选一个框架”就能搞定的吗? · 生产级 Harness 必须承担的 15 项真实职责是什么? · 每项职责如何做成可安装、可版本化、可换语言的 worker? · 单次 turn 如何跑通? · 策略、审批、预算、trace 在生产级 Harness 里为什么重要? @mfpiccolo 在他的「How to Build Your Own Agent Harness」中给出了完整答案,强烈建议阅读原文: https://iii.dev/blog/how-to-build-your-own-agent-harness/ [引用 @mfpiccolo]:http://x.com/i/article/2060024515619397638

Mike Piccolo: http://x.com/i/article/2060024515619397638

智能体大佬观点
‹ 上一页
1…3940414243…50
下一页 ›