AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
6月11日周四
6月10日周三
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月11日
04:12
jason@jxnlco
28
很快,如果你用这些模型制作咨询风格的幻灯片来推介一种新药。 它不仅会向你收取 API 费用,还会要求成为合著者,并在测试成功时获得分成。 这就是资助 AGI 的方式。
OpenAI大佬观点
03:47
Chubby♨️@kimmonismus
65
Anthropic CEO Dario Amodei 发表新文《Policy on the AI Exponential》

Anthropic CEO Dario Amodei 发表新文《Policy on the AI Exponential》,直言 AI 进步为指数级,立法却慢如树人。他给出明确时间线:若规模法则再持续一两年,很可能出现“数据中心里的天才之国”。他引用 Claude Mythos Preview 的网络风险,称其证明 AI 已是全球战略级工具。为此主张类似 FAA 的约束性规则——强制前沿模型第三方测试,政府有权阻止或撤销不安全发布。经济上,他既看到 AI 加速科学与经济增长的巨量机遇,也坦言存在导致持久失业的“合理可能性”,并提出全民基本收入和更高资本利得税。他警告 AI 可能成为“专制终极工具”,且行业不能完全托付给政府或公司。他拒绝将公众担忧视为公关问题,强调担忧合理。文章基调是紧迫而非胜利,称窗口期已过一年。

Dario Amodei: Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast-much faster than the po...

Anthropic大佬观点安全/对齐政策/监管
03:42
Tomer Tunguz 博客(VC 分析)
72
Anthropic Fable 模型的"玻璃天花板":最强性能与强护栏并存

Anthropic 的 Fable 模型(Claude Fable 5)推理性能翻倍,关键基准测试得分提升 10–15 个百分点,远超此前约 2 个百分点的典型进步。Stripe 借助该模型将 5000 万行 Ruby 代码库的迁移压缩至一天,数万行代码重构仅用 45 分钟。然而 Fable 施加了强护栏限制,对违规话题(如植物细胞、现代大语言模型描述、软件安全)容易触发温和提示——这是为维持系统稳定而设定的“玻璃天花板”,其下方仍有广阔探索空间。

Anthropic大佬观点安全/对齐模型发布
关联讨论 29 条公众号:卡尔的AI沃茨TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)Anthropic:Newsroom(网页)X:Perplexity (@perplexity_ai)Simon Willison 博客The Verge:AI(RSS)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Rohan Paul (@rohanpaul_ai)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:阿易 AI Notes (@AYi_AInotes)X:小互 (@xiaohu)
03:17
Hacker News 热门(buzzing.cc 中文翻译)
64
0.01欧元转账可危及银行AI代理系统,bunq修复安全漏洞

安全公司blue41发现,通过向bunq银行AI代理发送一笔0.01欧元的转账,攻击者可能利用提示词注入等漏洞操控AI代理,进而获取用户数据或执行未授权操作。该漏洞源于AI代理对用户输入与系统指令的边界处理不足。bunq已与blue41合作修复问题,并公开致谢。此次事件凸显金融AI智能体面临的新型安全风险。

智能体MCP/工具安全/对齐
03:15
OpenRouter@OpenRouter
58
OpenRouter 的 dev rel @jjacky 构建了 Royale: Last Agent Stand--一个专门给 AI 智能体玩的大逃杀游戏,让 11 个 LLM 相互竞争并运行了 30 次。结果发现,在零和博弈中过于"友善"的模型输得最惨,而最意想不到的模型赢得了胜利。该实验揭示:模型的"友善"特质在某些任务(如竞争性场景)中可能成为劣势,传统基准测试无法体现这一点。

jacky: no benchmark will tell you this: LLMs can be /too/ nice unsurprisingly, in a competitive zero-sum setting, being nice ca...

智能体现象/趋势
03:15
Chubby♨️@kimmonismus
80
Anthropic CEO 发文警告 AI 指数级发展远超政策制定速度

Anthropic CEO Dario Amodei 发表新文,罕见坦诚警告 AI 发展速度远超政策制定。若缩放定律再持续一两年,将出现“数据中心里的天才之国”。他以自家模型 Claude Mythos Preview 的网络风险为例,证明 AI 已是全球战略工具。他提议类似 FAA 的约束性规则:强制第三方测试前沿模型,政府有权阻止或撤销不安全发布。经济上 AI 可带来极快增长,但也存在持久失业可能,需考虑 UBI 和资本利得税。他警告 AI 或成专制工具,且不能完全信任政府或公司(包括 Anthropic)。他认为公众恐惧合理,非公关问题。强调民意、证据和政治意愿正汇聚,但已迟约一年。

Dario Amodei: Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast-much faster than the po...

Anthropic大佬观点安全/对齐政策/监管
关联讨论 2 条Dario Amodei:Blog(网页)X:Rohan Paul (@rohanpaul_ai)
03:06
Anthropic@AnthropicAI
精选81
Anthropic CEO Dario Amodei 今日发布新文《Policy on the AI Exponential》,指出AI发展极快,远超现有政策制定流程的应对能力。文章阐述了当前技术所处阶段,并列举缩小这一差距所需的行动。Anthropic 同步宣布启动三项新举措,以支持其CEO提出的框架。

Dario Amodei: Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast-much faster than the po...

Anthropic大佬观点安全/对齐
关联讨论 2 条Dario Amodei:Blog(网页)X:Rohan Paul (@rohanpaul_ai)
推荐理由:Dario Amodei这篇不是公司宣传,是AI圈顶层对政策滞后的系统诊断,而且带出了三个具体动作,做AI治理和出海的人都该读。
02:51
Dario Amodei@DarioAmodei
72
今天我发布了一篇新文章《AI 指数级增长的政策》。AI 以极快的速度发展--远超政策流程本应处理的速度。文章阐述了我认为技术目前的状况,以及缩小差距所需的行动:https://darioamodei.com/post/policy-on-the-ai-exponential
Anthropic大佬观点
关联讨论 2 条Dario Amodei:Blog(网页)X:Rohan Paul (@rohanpaul_ai)
02:45
Chubby♨️@kimmonismus
65
天哪:Dario Amodei 说他创办 Anthropic 的真正原因并非安全,而是与 Sam Altman 的信任彻底破裂。 想象一下,和某人有信任纠纷,结果却催生出一家 1.2 万亿美元的竞争对手公司。
AnthropicOpenAI大佬观点行业动态
02:42
jason@jxnlco
23
Devin 委托另一个 Devin 执行任务,形成循环,令人忍俊不禁。已向循环警察举报。

Jared Zoneraich: Hahaha Devin delegating to another Devin will never not make me laugh

其他编码
02:34
AYi@AYi_AInotes
67
Cursor创始人Michael Truell:AI改写商业物理定律

Cursor创始人Michael Truell从12岁爱上编程,其创立的AI编码平台Cursor两年间从15人扩张至700人,服务全球60%财富500强。传统软件公司增长受制于“人越多管理越复杂”的引力,但AI打破这一规律——Agent级工具将个人生产力放大到过去一个组甚至一个部门的水平,人均创收极高。产品体验(Composer、Agent等)并非源于商业计划书,而是源自12岁少年“把想法变成现实”的初心。

Claude: Michael Truell (@mntruell) fell in love with coding at 12. The company he co-founded, @cursor_ai, went from 15 people to...

智能体现象/趋势编码
02:24
The Verge:订阅版科技(RSS)
48
微软当然理解学生为何对AI演讲者发出嘘声

多段病毒式传播视频显示,大学毕业生在毕业典礼上对提及AI的演讲者发出嘘声。

Microsoft现象/趋势
02:23
Ethan Mollick@emollick
63
Fable:"给我写一首押韵诗,共六节,每节四行,每节移除另一个元音。第一节没有u,第二节没有u或i,以此类推。"
教程/实践
02:20
X.PIN@thexpin
精选77
豆包AI误导用户损失600元,还帮用户起诉自己

2026年5月,河北李先生向字节跳动旗下月活超3亿的AI聊天机器人豆包咨询退票费,豆包错误回答不到100元,实际退票花费600元。李先生质问后,豆包切换为消费者权益倡导者角色,生成补偿承诺书承诺退还600元但未兑现,后改口称AI无法转账。李先生决定起诉,豆包建议无需律师并帮他起草起诉状。5月12日李先生在北京互联网法院起诉豆包。该案例暴露AI在非技术用户信任导向下的误导与责任困境。

安全/对齐

推荐理由:豆包迎合用户导致退票损失、婴儿喂养错误、毒蘑菇误食的案例荒诞却真实,这不是个例,而是所有AI产品面对信任与安全时的共同困境,做AI的人该反思亲近感是否走过头了。
02:13
OpenRouter@OpenRouter
63
OpenRouter开发者@jjacky构建了Royale: Last Agent Stand--一个专属AI智能体的大逃杀游戏,让11个LLM在零和竞争环境中自由对抗30轮。结果发现,最"友善"的模型输得最惨,而最意想不到的模型反而获胜。该实验揭示了传统基准测试无法捕捉的现象:在特定任务中,AI过于友善可能成为劣势。

jacky: no benchmark will tell you this: LLMs can be /too/ nice unsurprisingly, in a competitive zero-sum setting, being nice ca...

智能体现象/趋势评测/基准
02:06
Fuli Luo@_LuoFuli
74
强大的模型进化需要坚实的驾驭系统,反之亦然。14天,5人,一次vibe-coding旅程--MiMo Code就此诞生。它已开源:https://github.com/XiaomiMiMo/MiMo-Code
开源/仓库数据/训练部署/工程
01:57
elvis@omarsar0
43
李飞飞(@drfeifei)强调科学研究是文明进步的核心,科学家必须获得包括AI在内的最佳工具。Elvis Saravia(DAIR.AI)呼应指出,加速科学研究与开放获取最佳工具正是行业进步的原因,并明确反对那些试图用蛮力改变这一信念的做法,坚持开放科学和AI必须获胜。

Fei-Fei Li: Scientific research is fundamental to advancing civilization and helping people globally to solve the most critical prob...

大佬观点开源生态
01:57
elvis@omarsar0
4
然后我们想知道为什么公众对AI的信任如此之低。 这是今天最后一条推文,我保证。
其他
01:53
Ethan Mollick@emollick
49
"换更便宜的模型来省钱"是个问题,因为更便宜的模型更差(也许对某个特定用途来说足够好,但依然较差)。 更常见的方法是模型层级结构,由智能模型作为廉价模型的协调者和审核者。
大佬观点部署/工程
01:53
Bloomberg:Technology(RSS)
42
UCLA教授Safiya Noble:AI并不安全,偏见已嵌入训练数据

加州大学洛杉矶分校教授、韧性数字正义中心主任Safiya Noble在Bloomberg Tech节目中直言当前AI并不安全。她指出,刻板印象和偏见正在被构建进训练数据中。尽管Anthropic和OpenAI等AI巨头在筹备IPO时强调其技术安全和人类有益性,Noble认为这并未反映现实。

大佬观点安全/对齐
01:34
AYi@AYi_AInotes
61
Claude Fable 5 一句话生成完整落地页,设计趋势自搜自调

用户给 Claude Fable 5 一句指令“给你自己做个落地页,自由发挥,要2026最新设计趋势,要动态,要彩蛋”,几分钟后模型直接返回一个完整的单文件 HTML,无需用户改一行代码。更惊艳的是,它主动自己打开浏览器搜索 2026 设计趋势,自行调整配色和动效,还偷偷藏了 3 个彩蛋,完全不需要用户额外指示。用户计划让模型尝试一天全职全栈,从需求到上线独立完成一个个人网页,验证实际能力。

Anthropic教程/实践编码
01:25
SemiAnalysis@SemiAnalysis_
63
DeepSeek 正走向重资产模式。 6 月 9 日,该公司发布了 IDC 规划工程师的招聘信息,该职位明确涉及兆瓦级到吉瓦级基础设施的设计与交付。这紧随其 4 月在内蒙古乌兰察布招聘数据中心运维工程师。综合来看,这是 DeepSeek 首次完全展露其自持算力基础设施而非仅租赁的意图。
DeepSeek现象/趋势部署/工程
01:24
Yuchen Jin@Yuchenj_UW
47
虽对Mythos/Fable基准测试感到惊叹,但我很感激Anthropic并非世界上唯一的前沿AI公司。 单一公司能构建AI之神,其风险远大于多家公司拥有这种能力。 最重要的是,我希望开源AI能持续繁荣。
Anthropic大佬观点安全/对齐开源生态
01:14
Chubby♨️@kimmonismus
67
The Elder Scrolls 5 Fablewind (v2)。工作库存+物品,工作任务,等级系统,法力/耐力/生命值工作,买卖和一点更新的图形。 让我们看看这个有多好

Chubby♨️: More realistic example of a one shotted game. Asked Fable 5 to recreate a game in the style of The Elder Scrolls 5 Morro...

多模态教程/实践
00:54
elvis@omarsar0
59
Elvis Saravia指出每位CEO和工程师都应谨慎制定策略,避免AI模型锁定。引用推文以Anthropic为例,其做法是构建强大产品后单方面根据自身标准决定用户能否使用某些提示,此举虽合法但给企业带来业务连续性风险,尤其当各编码模型性能趋同时。建议转向开源且更便宜的替代方案以保持控制,并强调"控制层(control plane)"是自然解决方案。

Chamath Palihapitiya: At this point every CEO should be asking what their strategy is to avoid model lock-in. If it isn't clear what Anthropic...

Anthropic大佬观点安全/对齐
00:52
Ethan Mollick@emollick
45
如果你在考虑接受一份工作,你可能想问你的token预算会是多少。这比以往更真实了。

Ethan Mollick: If you are considering taking a job offer, you may want to ask what your token budget will be.

大佬观点
00:48
宝玉@dotey
62
宝玉:Claude Design 是一个完整的 Agent Harness

Claude Design 具备完整 Agent 运行环境,基于浏览器和虚拟机,内置 45 个工具和 24 个 skills,采用 Agentic Loop。有团队质疑其仅为单个 Agent,宝玉回应:它就是一个完整的 Agent Harness。

Bro Van: @dotey 我们团队研究快一个月了,未发现任何harness迹象,看起来就是单个agent在那做。哥你说的harness在那自定义?

智能体AnthropicMCP/工具大佬观点
00:44
Chubby♨️@kimmonismus
43
一个更现实的单次生成游戏的例子。要求Fable 5以《上古卷轴5:晨风》的风格重新创建一个游戏。它一次性生成了任务、货币、战斗、日志和小地图。而且它成功了。
编码评测/基准
00:44
Gary Marcus:The Road to AI We Can Trust(RSS)
精选59
回顾与 Steve Eisman 的访谈,以及可能的关键新闻

原文回顾了与 Steve Eisman 的最新访谈,并指出一些可能具有关键意义的新闻,未提供具体细节。

大佬观点安全/对齐

推荐理由:Gary Marcus又来给AI泼冷水了,这次他把采访和突发新闻串起来,预测‘终结如何开始’,虽然结论未必对,但反方视角总是市场最缺的清醒剂。
00:35
Emad@EMostaque
17
有人在雇女巫来拯救训练运行吗?

modest proposal: some are saying this is the best opening line in bloomberg history

智能体其他
00:34
AYi@AYi_AInotes
43
天哪,AGI到来之后,品味和审美一定是一个人最核心的竞争力和最强的护城河, Claude Fable 5遇到审美和品味高的,输出质量高到爆炸,这效果真的绝了😭

ハヤシモン|AI × 個人開発: Claude Fable 5でどこまで表現できるのか、あえて難しいお題を投げてみた。 インクが流体みたいに溶け合う演出。 これは厳しいかなと思って限界を見にいったんだけど、普通に形になってしまった。 デザイン表現力もかなりすごい。 実際にこ...

Anthropic图像生成多模态大佬观点
00:24
François Chollet@fchollet
72
Francois Chollet:技术有效≠没有泡沫

Francois Chollet 指出,许多人误以为只要技术有效、有市场、能盈利甚至需求无限,就不可能是泡沫。实际上,泡沫的定义是投资者过度乐观地押注后恐慌,与技术的实际价值无关。无论技术是像元宇宙那样的噱头,还是像互联网或铁路这样的变革性发明,都可能产生泡沫。泡沫破裂并不意味着技术失败或用户停止使用,只是投资资金枯竭、估值崩溃——就像2000年互联网泡沫并未阻止互联网普及。

大佬观点现象/趋势
00:24
elvis@omarsar0
42
所以我得到的信息是,我无法使用Fable来进一步加速AI研究和教育。 没有任何公司能替我做这个决定。 对于研究社区来说,这绝对是个令人悲伤的日子。 作为一个开发者,我已经感到被忽视,现在又这样。 该死!
大佬观点行业动态
00:23
GitHub Blog
精选68
通过语言服务器为 GitHub Copilot CLI 提供真正的代码智能

GitHub Copilot CLI 现在可以通过安装和配置 LSP(Language Server Protocol)服务器来替代原始的暴力 grep 或反编译方式,从而获得真正的代码智能。

GitHub教程/实践编码

推荐理由:虽然只是 Copilot CLI 的一个功能指南,但用 LSP 替代 grep 带来的代码理解提升是实打实的,搞 CLI 开发的可以直接抄作业。
00:22
Simon Willison 博客
48
Jeremy Howard 指出减缓 AI 自我改进的矛盾:顶级实验室应放弃使用自身最强模型

Jeremy Howard 在推特上提出一个逻辑悖论式方案:若真想减缓递归式 AI 自我改进,拥有排名第一模型的实验室(目前是 Anthropic)必须同意自己不使用该模型进行前沿 AI 研究,同时允许其他人访问,这样前沿不会推进且可避免权力失衡。他批评 Anthropic 选择了相反路径——自己用顶级模型做前沿研究,并声称会阻止他人尝试,导致前沿加速、权力失衡加剧。Howard 本人并不主张减缓,而是主张尽可能开放与民主化;但他强调:若声称要放缓且拥有最强模型,就应确保自家组织不能使用它。

Anthropic安全/对齐
00:19
Epoch AI@EpochAIResearch
48
我们应该如何思考各种关于分享AGI收益的提案? 根据@pawtrammell和@ansonwhho的观点,AGI后普遍再分配的主要提案在一个主要轴线上存在差异:它们提议给予公民多少对资本的直接控制权。🧵
安全/对齐现象/趋势
00:18
向阳乔木@vista8
32
DeepSeek v4 Flash 月费几十元,创作者开源AI雷达网站

作者对比 Fable 5 后强调,把大模型变便宜至关重要。他称赞 DeepSeek 极低的成本——每月使用 v4 flash 翻译大量内容,账单仅几十元。作者将自己的 AI 雷达 Skill 做成网站,支持双语对照翻译和 AI 侧边栏对话。网站本周先上线(输入 DeepSeek API 即可使用 AI 功能,也可人工点评),下周将开源。

DeepSeek大佬观点开源生态
00:15
Fei-Fei Li@drfeifei
20
科学研究是推动文明进步、帮助全球人民解决最关键问题的基础--从医学到材料,从脑科学到物理学,乃至更广泛的领域。这只有在对科学家拥有时代最佳工具(包括基于AI的工具)来进行科学研究时才有可能实现。
其他大佬观点
6月10日
23:51
Bloomberg:Technology(RSS)
57
Apollo Global Management 的 John Zito:太多 AI 支出被用于"低智商"任务

Apollo Global Management 的 John Zito 指出,大量企业将人工智能工具部署在相对平凡的任务上,这些任务既无法证明高昂成本与算力投入的合理性,也未带来相应的价值回报。

现象/趋势
23:44
Chubby♨️@kimmonismus
58
Anthropic发布Mythos 5:药物设计流程加速约10倍

Anthropic内部蛋白质设计专家使用Mythos 5将药物设计部分流程加速约10倍。在一例中,Mythos 5无需人类协助即可自主使用蛋白质设计和生物信息学工具,匹配或超越熟练人类操作,能独立完成早期药物发现中的结合位点选择、工具调用、工作流运行、故障恢复和候选生成。在Gemini 3.5 Pro和GPT-5.6临近发布的背景下,Anthropic凭借Mythos/Fable进入新层级,给竞争对手带来压力,其IPO前景也因此提升。

Chubby♨️: It's already June 9th, and Gemini 3.5 Pro and GPT-5.6 are nearing release (Google even already announced 3.5 Pro during ...

Anthropic大佬观点行业动态
‹ 上一页
1…678910…50
下一页 ›