AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
6月8日周一
6月7日周日
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月8日
07:46
Eric@ericmitchellai
26
Eric Mitchell 发推称"Nvidia 基本上就是一辆汽车",并引用 @perrymetzger 的观点:那些在线上说 AI 仍频繁幻觉、不能写代码的人,就像试图说服你每天开的车不存在--你明明在开车上班、花钱加油、依靠它通勤 20 英里,他们却说你想象或替汽车公司撒谎。这些人仿佛活在完全不同的现实。推文借汽车类比 Nvidia,点出 AI 实际用户与线上批评者之间的认知鸿沟。

Perry E. Metzger: I have said this before, but to those of us using AI systems to get lots of work done reliably and quickly, the people w...

OpenAI现象/趋势
07:31
宝玉@dotey
36
Claude Code 虽然移动端可以 remote control,但是 plan 后不能 bypass permission,需要不停的确认,神烦
Anthropic大佬观点编码
07:08
Rohan Paul@rohanpaul_ai
66
MIT研究追踪超10万GitHub开发者:AI编码工具使代码量增300%,但发布仅增30%

麻省理工新研究追踪超10万GitHub开发者使用三代AI编码工具(自动补全、交互式agent、自主agent)的生产漏斗。自主AI agent使代码提交数提升180%,但实际发布仅增30%。代码量激增近300%,经人工审核后收益降至150%,最终发布仅增约30%。研究估算替代弹性为0.25,即AI能力大幅提升时仅能替代少量人类工作。应用市场同样显示新应用数量增加,但总使用量未升。瓶颈在于人类仍需负责审查、测试、打包和发布等环节,AI加速的局部任务并未转化为同等产出增长。

Rohan Paul: FT publisehd a piece. AI is raising software supply faster than demand. AI is producing far more work inside companies, ...

GitHub编码论文/研究
06:48
jason@jxnlco
14
但这……"Codex 几乎适用于一切"。
OpenAI大佬观点编码
06:40
karminski-牙医@karminski3
58
Ideogram 4实测:9.3B开放权重原生2K

ideogram发布Ideogram 4文生图模型,开放权重,仅9.3B参数,支持原生2K分辨率生成。作者将其与通义Z-image-Turbo生成效果对比,认为两者风格相似。

图像生成开源生态评测/基准
06:38
Rohan Paul@rohanpaul_ai
53
FT/MIT:AI编辑增300%,发布仅30%瓶颈明显

FT报道MIT一项研究,跟踪软件团队从文件编辑到审查到发布的完整生产漏斗。使用AI后,开发者创建或编辑文件数量增加近300%,但在审查阶段增益降至150%,最终到软件发布仅提升约30%。这表明AI在加速局部编码任务上效果显著,但人类审查、协调、产品判断、测试和发布流程仍是决定产出价值的关键瓶颈,大量额外工作未能转化为最终产品。

现象/趋势部署/工程
06:37
elvis@omarsar0
55
超强AI模型即将发布:避免锁定单一供应商

未来几周将有超强AI模型发布,模型能力可能迎来阶段性提升。DAIR.AI创始人Elvis Saravia认为,当前最大的错误是从成本或工程角度锁定单一供应商,建议开始利用模型组合(包括开源模型),保持“模型无关”,以便随时切换模型以发挥其各自优势。对于编程智能体,开源模型表现已媲美前沿模型。他建议将“AI模型路由”作为核心策略,高效分配任务/工作给不同模型,这是一项高回报的AI工程投入。

智能体大佬观点编码
05:37
Rohan Paul@rohanpaul_ai
67
Demis Hassabis 新采访:AGI 可能于 2030 年前后到来

Google DeepMind 联合创始人兼 CEO Demis Hassabis 在新采访中表示,社会需要意识到我们没有多少时间准备了,人类正站在奇点的山麓。他认为 AGI 可能只需几年,大约 2030 年(±1 年)就能实现。推文作者评论指出,真正的颠覆不在于 AGI 何时精准到达,而在于机构能否适应——后 AGI 世界技术变化远快于人类系统响应速度,学校、公司、政府均未做好准备。若 AGI 按前沿实验室时间线到来,这一滞后将压缩成危险鸿沟。

DeepMind大佬观点现象/趋势
05:33
SenseTime@SenseTime_AI
26
商汤 Phil Wong 谈中国 AI 优势与差异化实践

商汤资本市场主管 Phil Wong 在汇丰私人银行圆桌会议上指出,中国 AI 优势日益体现于成本、产品质量及提升终端客户生产力与效率。真正差异化在于大规模创造可衡量业务成果。商汤实践包括:多模态模型 SenseNova U1 以较小规模实现强性能;AI 工具 Office Raccoon(数据分析与 PPT 生成)和 Seko(视频制作);AI 基础设施 SenseCore 通过算力协同优化降低能耗、提升效率。此外需关注空间智能、世界模型等前沿领域。

多模态大佬观点
05:10
SemiAnalysis@SemiAnalysis_
57
NVIDIA的新Nemotron3 Ultra在TerminalBench等编码任务上被Kimi K2.6和GLM5.1击败。为了让全球Nemotron联盟训练委员会训练前沿开源模型,黄仁勋应邀请至少以下一家前沿AI实验室加入委员会:DeepSeek、MoonshotAI、MiniMax、Qwen、StepFun、zAI GLM。
开源生态编码评测/基准
04:58
Hacker News 热门(buzzing.cc 中文翻译)
33
Linear 为何如此快?技术解析

performance.dev 上发布的一篇技术解析文章,探讨项目管理工具 Linear 实现快速性能的原理,在 Hacker News 上获得 111 个点赞。

其他部署/工程
04:39
Yuchen Jin@Yuchenj_UW
65
OpenAI的Sora负责人离职了。 OpenAI的芯片负责人跳槽去了Anthropic。 "同时押注所有大赌注"的策略开始显得脆弱。 当你在编程领域与Anthropic进行白刃战时,其他所有赌注都在流血。(在编程本身方面,OpenAI显然已经迎头赶上。)
AnthropicOpenAI大佬观点
04:18
jason@jxnlco
14
近期生活
其他
04:09
Chubby♨️@kimmonismus
65
Demis Hassabis:AGI约2030年到来,等同于奇点

DeepMind创始人Demis Hassabis在Google I/O上表示,AGI(约2030年)的到来将等同于奇点——一个不可逆转的技术突破点。他直言社会需要尽早准备,因为时间不多了;回顾当下,我们正站在奇点的山脚。推文作者将其视为比工业革命快10倍、强10倍的深刻革命,人类社会正面临前所未有的变革。

DeepMind大佬观点安全/对齐现象/趋势
03:50
Hugging Face:Blog(RSS)
27
Amazing Digital Dentures(一个失败的项目)

受《神奇数字马戏团》启发,作者尝试用 Nemotron 30b 构建一个数字宠物,自动生成以 Three.js 实现的冒险游戏,起初作为过度工程化的待办列表,后转向纯冒险生成。长提示、技能卡及 RAG 方案均未产出可运行游戏(常出现空白屏幕)。项目最终转型为简单的 HTML 玩具制作器,能一次生成时钟、待办列表、贪吃蛇、打砖块,但俄罗斯方块等复杂项目仍会崩溃。作者正寻求新方向。

其他编码
03:45
Greg Brockman@gdb
68
OpenAI 公布了数十个 Codex 实际工作流程,展示团队如何用其自动化任务。用例包括:管理收件箱并草拟回复、审阅 GitHub PR、将 Figma 设计转为代码、理解大型代码库、自动分类 bug、用自然语言查询数据集、从提示词部署应用、构建 Mac/iOS 应用、自动创建幻灯片、将 Slack 对话转为编码任务、用 AI 动作操控电脑。Codex 正从 AI 助手演变为 AI 队友。

Suraj Sharma: OpenAI just published dozens of real-world workflows showing how teams are using it to automate work. > Manage your inbo...

智能体OpenAI教程/实践编码
03:11
Peter Steinberger 🦞@steipete
60
这是您的月度提醒:您不应再手动提示编码智能体了。 您应该设计循环来提示您的智能体。
智能体教程/实践编码
03:07
Rohan Paul@rohanpaul_ai
49
Meta-Agent Challenge:当前AI智能体能否自主构建更好的智能体?

一项新研究提出Meta-Agent Challenge(MAC)基准,测试AI智能体能否在没有人类设计帮助的情况下自主构建更优智能体。智能体需在安全工作区内自行发明策略、编写代码、测试并从失败中学习。实验覆盖数学、科学问答、竞赛编程、代码修复和长终端任务5个领域。结果显示,当前智能体大多无法超越人工设计的强智能体系统,仅Claude等少数封闭前沿模型取得较好表现。研究认为,当前智能体更像是强大的执行者,而非具备可靠自改进能力的工程师。

智能体arXiv论文/研究评测/基准
02:27
AYi@AYi_AInotes
9
Damn,有钱真的能改变一个人

AYi: http://x.com/i/article/2060717603987791878

其他
02:07
Rohan Paul@rohanpaul_ai
46
AI 可以在医学发现方面做很多事情,但也有一些合理的担忧,即 AI 正在超越博士水平的病毒学家,这可能会助长一种并非假设性的生物武器风险。 --约翰霍普金斯大学教授兼 Anthropic 顾问 Ben Buchanan
Anthropic大佬观点安全/对齐
01:58
Hacker News 热门(buzzing.cc 中文翻译)
69
车床(Lathe):利用LLMs学习新领域,而非跳过

Lathe(车床)是一个基于大型语言模型(LLMs)的工具,核心理念是使用LLMs帮助用户逐步学习一个陌生领域,而非直接替代学习过程。项目托管在 GitHub 上。

GitHub开源/仓库
01:36
Ethan Mollick@emollick
63
现在正是储存一些你最困难、最有价值、最不寻常的好主意的好时机--无论是为了工作、爱好还是新的事业。 得益于 AI,真正好且独特的想法实现起来变得极为廉价,但找到它们却不一定更容易。巨大的机会就在眼前。
大佬观点
01:31
宝玉@dotey
74
baoyu-design:在本地复现 Claude Design 的开发工作流

宝玉分享开发模式:先用 Claude Design 设计 App UI/UX,生成 HTML+CSS+React+data.js(优于 Figma,利于 AI 理解和 Git 版本管理);再用 Claude Opus 4.8 实现 MVP(GPT 5.5 在 UI 实现上差距明显)。因反复在本地与网页间导出替换设计稿繁琐,他编写工具解析 HAR 文件、解密 Claude Design 二进制内容,分析其 Prompt 和内置组件,将核心逻辑本地化集成到 Cursor(利用网页标记功能),配合 Opus 4.8 即可本地运行。最终开源 GitHub 项目“baoyu-design”。

宝玉: 最近为了研究 Claude Design,专门写了一个工具,可以解析 HAR 文件,解密 Claude Design 传输的二进制内容,这样可以方便的看到请求的 Prompt

智能体AnthropicGitHubMCP/工具
01:31
Nathan Lambert@natolambert
35
美国开源回来了。HuggingFace 首页前 30 个模型中,有 9 个由 Nvidia 发布。 Slowly, then suddenly!

0xSero: American Open Source is so back. 9 / 30 of the models on page 1 of Huggingface are published by Nvidia.

开源生态现象/趋势
01:07
elvis@omarsar0
59
论文提出用代码压缩率衡量AI智能体是否真正发现新知识

本周一篇AI论文探讨自我改进智能体是否真正发现新知识,还是仅重新组合已知信息。作者将行为分为三类:检索(查询已有笔记本)、搜索(组合现有工具)和发现(发明新概念),并用范畴论和左Kan扩展定义——若旧版本能产生相同结果则非发现。他们构建Builder/Breaker agent研究蛋白质力学,四轮中R²从0.48升至0.68再降至0.54和0.41,看似变差实则不断挑战更难蛋白质并重写理论:数据增长近10倍,模型代码仅增长1.3倍。论文提出用代码压缩率作为真实发现信号。链接:arxiv.org/abs/2606.01444。

智能体arXiv大佬观点推理
01:05
MarkTechPost(RSS)
50
使用GEPA构建反思性提示优化:多组件提示、结构化反馈与保留验证

本教程展示如何利用GEPA这一反思性提示进化框架,改善小型语言模型在多步算术应用题上的表现。从弱种子提示出发,构建确定性基准并定义能返回可操作反馈的结构化评估器。多组件设置同时进化指令字段与输出格式规则,最后在保留验证集上对比基线提示与优化提示,检验优化效果是否泛化。

推理教程/实践
00:58
Hacker News 热门(buzzing.cc 中文翻译)
59
美国人工智能的OnlyFans经济

一篇题为“The OnlyFans Economy of American AI”的文章于6月7日在Hacker News上获得104点赞,探讨美国人工智能行业中的类似OnlyFans的订阅制经济现象。

开源生态现象/趋势
00:27
AYi@AYi_AInotes
69
免费获取AI额度的四个隐藏入口

文章盘点四大渠道:① OpenAI Codex for OSS,开源项目维护者可免费获6个月ChatGPT Pro(价值$1200)及API credits;② Anything AI,新用户通过促销链接注册可得2万credits,需重复点击触发bonus;③ Lenny's Product Pass,付费订阅其年度Newsletter($200-400)可兑换总价值$30000+的AI工具一年会员,先到先得且要求新用户;④ 三大云startup credits,微软Founders Hub最低$1K-$5K(无VC要求),谷歌AI-first创业最高$350K但要求严,AWS可叠加(自筹$1K+YC等)。每个口子均有门槛限制。

GoogleOpenAI开源生态教程/实践
6月7日
23:36
Gary Marcus:The Road to AI We Can Trust(RSS)
精选67
Slop、生产力,以及为何AI驱动的世界进展甚微

Gary Marcus在金融时报上看到John Burn-Murdoch的一张图表,认为它精准提炼了自己一直试图表达的观点。

大佬观点现象/趋势

推荐理由:Gary Marcus用一张图把AI的「生产力幻觉」撕了个干净,虽然他一向毒舌,但这次数据确实让我没法反驳,做AI产品和战略的可以看看这个反共识视角。
22:43
🚨 AI News | TestingCatalog@testingcatalog
0
你无法预测AI将如何影响你的生活。 你无法预测何时以及多快。 但你可以保持关注,为AI明天可能发生的任何事情做好准备。 测试是唯一的方法。 立即关注并订阅。 https://bit.ly/4uXNiUQ
其他
22:30
宝玉@dotey
54
Deep Research 能力对比:ChatGPT 最优,Gemini 次之,Claude 垫底

宝玉 (@dotey) 对比各模型 Deep Research 表现:ChatGPT 的 DeepResearch 最好,Gemini 搜索能力强、表现也不错,Claude 做得很差。引用推文补充:在写代码、工程工作及需联网搜索数据并分析得出结论的任务上,Claude 的“5.5”版本远超 Opus,Opus 搜索能力几乎不可用。

patrick_bob: @dotey 但是写代码,工程工作,以及所有需要上网搜索数据计算得出分析结论的事项,5.5 比 opus 强很多,opus基本不可用,它的搜索能力几乎等于没发用

AnthropicGoogleOpenAI搜索
22:08
Bloomberg:Technology(RSS)
精选79
苹果秘密会议内幕:它终于认真对待AI

苹果在一次内部秘密会议后,终于决定将AI作为核心战略。这场会议促使公司全面转向AI领域,相关进展预计将在WWDC 2026上公布。

现象/趋势端侧
关联讨论 1 条Bloomberg:Technology(RSS)
推荐理由:这不仅仅是WWDC前瞻,Gurman曝光了苹果内部那场让高管们「惊醒」的AI会议,解释了为什么iOS 27的AI布局会这么激进,做苹果生态的人得看。
22:08
Bloomberg:Technology(RSS)
51
AI搜索"死亡螺旋"威胁互联网内容生态

研究人员指出,AI驱动的搜索正导致“零点击”搜索增加,用户留在平台内而非跳转至出版商网站。流量下降威胁新闻与内容创作的长期经济基础。大型出版商通过品牌多元化、社交媒体分发、许可协议及与AI公司的付费合作来抵消搜索流量下滑。核心问题是:若创作者收入减少,互联网能否继续产出AI所依赖的内容。

搜索现象/趋势
22:07
Chubby♨️@kimmonismus
64
WWDC 2026 预计将成为苹果 AI 关键节点。Siri 将围绕定制版 Google Gemini 模型(约 1.2 万亿参数)重建,自有设备端模型仅约 3B 参数。新 Siri 采用混合架构--本地小模型 + 云端大模型,由苹果控制 UI、应用权限和隐私层。预期功能包括更自然对话、跨应用个人上下文、屏幕感知、应用内操作、独立 Siri 应用(支持语音、文件上传和多模态交互)、Dynamic Island 深度集成,并可选择接入 ChatGPT、Claude 或 Gemini 等第三方服务。苹果意将 Siri 打造成操作系统的隐私 AI 层,成为跨 iPhone、Mac、iPad 的系统智能体。

Chubby♨️: Tomorrow could be Apple's most important AI moment yet. WWDC 2026 is expected to be all about one thing: making Siri rel...

Google多模态大佬观点语音
21:58
Hacker News 热门(buzzing.cc 中文翻译)
47
一位软件工程师发文称:LLM正在侵蚀我的职业生涯,我不知所措

一位软件工程师在个人博客中直言,大型语言模型(LLM)正逐步侵蚀其软件工程职业生涯,令其感到无所适从。文章标题为“LLMs are eroding my software engineering career and I don‘t know what to do”,在Hacker News上引发关注,获得125个点赞。作者通过亲身经历表达了对AI取代开发工作的忧虑,但未提出明确解决方案。

现象/趋势编码
21:28
Hacker News 热门(buzzing.cc 中文翻译)
精选75
Symbolica 2.0:适用于 Python 和 Rust 的可编程符号系统

Symbolica 2.0 发布,这是一款可编程符号系统,支持 Python 和 Rust 语言。该版本在 Hacker News 上获得 100 点热度。

GitHub开源/仓库

推荐理由:Symbolica 2.0 把符号计算从研究玩具升级成了生产级工具,如果你还在用 SymPy 做复杂符号运算,这个库的 Rust 后端可能让你的速度飞一个数量级。
21:27
AYi@AYi_AInotes
50
内容整理新范式:将素材拆解为知识原子,用Markdown作为AI运行时

推文介绍一套内容整理范式:将推文、文章等拆解为知识原子(问题、概念、观点、案例),而非单纯归类文件。通过严格结构的纯文本Markdown作为“运行时”,让AI Agent按既定方法论检索、重组内容,使过往积累从死库存变为可反复调用的资产库。核心纪律:先审计再建工程,结构先于规模,避免全量乱跑(仅X推文就一万两千条)。这标志着内容创作者的护城河从写作能力转向内容资产的工程化可调用能力。

dontbesilent: http://x.com/i/article/2061721924875825152

智能体教程/实践
21:06
meng shao@shao__meng
16
邵猛:从法国养老企业到旷视的技术蜕变

邵猛此前在法国企业做数据分析软件,节奏极慢,两天就能完成一周工作。14-15年左右,他加入AI CV四小龙旷视,周围多是清华姚班的全职或实习生,智商极高、学东西快且深。作为算法封装与商业化工程师,他硬学CV知识,两三个月后跟上节奏。曾与一位算法伙伴两周用古法编程跑通人脸关键点和美颜贴纸算法,获公司认可。此后心态彻底改变,不再畏惧跨领域挑战。后来离开旷视,在创业公司担任CTO等。

其他大佬观点
20:58
Hacker News 热门(buzzing.cc 中文翻译)
37
开源界的怪胎们

一篇标题为“开源界的怪胎们”的讨论在 Hacker News 上获得 100 点热度,原文来自 drewdevault.com,正文未提供具体内容。

开源生态现象/趋势
20:16
The Verge:订阅版科技(RSS)
59
社交媒体平台发现AI"内容创作者"越来越难识别

社交媒体平台感到困惑,因为AI生成的“内容创作者”正变得越来越难以被识别。

现象/趋势
‹ 上一页
1…1819202122…50
下一页 ›