AIHOT

全部动态今日 22 条

6月11日周四

6月11日

06:25

Rohan Paul@rohanpaul_ai

Sam Altman 据报告正警告员工，递归自我改进（RSI）可能会延迟其 IPO。 Altman 表示，一次重大的 RSI 突破可能合理推迟上市，因为一些工作在作为私营公司时可能更容易进行。在模型能力变化可能比季度报告解释更快的阶段，公开市场对收入/利润的压力可能巨大。

OpenAI行业动态

06:22

MarkTechPost（RSS）

Microsoft SkillOpt 编码实现：仪表化提示优化、技能演化分析与基线比较

实现了一个端到端的 Microsoft SkillOpt 仪表化工作流，包括设置仓库、连接 OpenAI 兼容模型、配置优化器和目标模型。以原始种子技能为基线，运行包含 rollout、reflection、aggregation、selection、更新和验证门控的优化循环，检查训练历史，可视化准确率、编辑预算行为和 token 用量，并将进化后的技能与基线进行比较。

MCP/工具Microsoft教程/实践部署/工程

06:19

OpenAI：官网动态（RSS · 排除企业/客户案例）

天体物理学家用 Codex 模拟黑洞

天体物理学家 Chi-kwan Chan 借助 Codex 构建黑洞模拟程序，用于研究极端物理现象并检验爱因斯坦的广义相对论。

OpenAI教程/实践编码

06:17

Hacker News 热门（buzzing.cc 中文翻译）

关于人工智能指数增长的政策

本文发表于 darioamodei.com，英文标题 "Policy on the AI Exponential"，中文译为“关于人工智能指数增长的政策”。文章聚焦于人工智能能力的指数级提升对公共政策提出的新挑战，强调现有政策框架需进行根本性调整以适应 AI 的快速迭代。该文在 Hacker News 上获得 100 点热度，引发讨论。

Anthropic大佬观点安全/对齐

06:14

jason@jxnlco

Sandbagging 正降临到 AI 智能体上，但不会降临到 ChatGPT Codex。

智能体OpenAI大佬观点

06:13

Thariq@trq212

很多人问我怎么用 Fable 编辑它自己的发布视频，所以我做了个视频来解释！ TLDR：它写了很多代码和工具调用，来使用转录服务、ffmpeg、做调色、使用 figma mcp、制作 remotion UI 并渲染。我根本没碰视频编辑器。

MCP/工具教程/实践视频

05:54

Rohan Paul@rohanpaul_ai

Palantir CEO：AI公司复制不了我们的企业业务

CNBC记者问Palantir CEO Alex Karp如何回应华尔街对AI可能复制Palantir业务的担忧。Karp表示，AI公司虽有优秀工程师，但根本不了解企业级实际问题的复杂性和高难度。他指出，从造车到国防，这些高端企业的核心业务不仅涉及技术，还有文化和信任层面的鸿沟，没有一家此类企业会采用AI公司提供的方案。

现象/趋势行业动态

05:47

Chubby♨️@kimmonismus

OpenAI 首席科学家 Jakub Pachocki 在 Slack 消息中写道，GPT-5.6 将比 GPT-5.5 有"有意义的改进"。 GPT-5.5 很棒，是我在 Codex 中的日常伴侣。一次重大飞跃将受到欢迎。但事实是：OpenAI 需要自己的神话/传说。来源：The Information

OpenAI模型发布

05:47

Chubby♨️@kimmonismus

Inworld 宣布将 API 价格下调约 50%，覆盖 TTS、STT 和 LLM 服务。主推文补充称语音成本降幅超 50%，并推出双倍六月积分及年付免两个月优惠。此举旨在解决消费级 AI 开发者面临的模型成本困境--现有定价基于企业级 $300/月座位，而非消费者 $10/月订阅。已有 Wishroll、Biblechat、Talkpal、Luvu 等团队实现 AI 成本降低 40-95%。

Inworld AI: We want to make AI accessible for everyone, so we're reducing our API prices by ~50%. Consumer AI growth is still blocke...

行业动态语音

05:44

jason@jxnlco

当你使用Codex处理sheets时，会遇到哪些问题？

OpenAI其他

05:28

SemiAnalysis@SemiAnalysis_

对于一个AI实验室来说，更好的商业模式是订阅还是API？（1/4）🧵

大佬观点

05:24

Bloomberg：Technology（RSS）

xAI 联合创始人 Babuschkin 成立新创企，主打个性化 AI

来自 Elon Musk 旗下 xAI 的一批前员工组建了一家新创业公司，专注于个性化人工智能。这可能是近期 xAI 离职潮中备受关注的新公司。

xAI行业动态

05:23

Claude Code：GitHub Releases（RSS）

精选69

Claude Code v2.1.172 发布

子智能体现可创建自己的子智能体，最多嵌套5层。Amazon Bedrock 在未设置 AWS_REGION 时从 ~/.aws/config 读取区域。插件市场新增搜索栏。修复了使用1M上下文且无使用额度的会话永久卡住的问题，现会自动压缩回标准上下文限制。修复了多个图片导致重复报错等问题。改进了长对话性能，减少冗余消息归一化和不必要的UI重绘，降低空闲CPU占用。Claude in Chrome 工具加载改为单次批量调用。/code-review 在未登录时保留 ultra 选项并提示需要 claude.ai 账户。

智能体Anthropic产品更新

关联讨论 2 条

推荐理由：子代理现在可以递归生成子代理（最多 5 层），这个特性让复杂的多 agent 编排成为可能，但总体还是以 bug 修复为主，Bedrock 的区域读取也更顺手了，Claude Code 用户直接升级即可。

04:47

Chubby♨️@kimmonismus

最大的瓶颈将是能源--很快。 Gartner 2026年预测显示，全球数据中心电力消耗将达到565 TWh，较去年增长26%。AI服务器已占其中的31%，并将于2027年超越传统服务器。值得注意的是，Gartner给出的制约因素是电力，而非芯片。他们预计到2030年需求将超过1，200 TWh，并警告电网将无法跟上。因此，竞赛悄然从谁拥有最佳硅片转向谁能真正获得电力来驱动它。

数据/训练现象/趋势部署/工程

04:47

Hacker News 热门（buzzing.cc 中文翻译）

喷气推进实验室如何让服役13年的"好奇号"火星车继续开展科学探索

NASA喷气推进实验室（JPL）正维持已运行13年的“好奇号”火星车继续执行科学任务。该火星车自2012年着陆以来持续探测盖尔陨石坑，JPL通过远程软件更新、故障规避和能源管理策略延长其工作寿命。

行业动态

04:47

Hacker News 热门（buzzing.cc 中文翻译）

Anthropic的模型命名法：外推分析

一篇分析Anthropic模型命名模式的外推文章在Hacker News上获得139个点赞，原文发布于samwilkinson.io。

Anthropic现象/趋势

04:30

IT之家（RSS）

小米 MiMo Code V0.1.0 发布并开源：AI 编程助手，基于 OpenCode 二次开发

6 月 11 日，小米 MiMo 发布并开源 MiMo Code V0.1.0，一款终端 AI 编程助手，基于 OpenCode 二次开发，采用 MIT 协议。内置限时免费多模态模型 MiMo-V2.5，支持接入 DeepSeek、Kimi、GLM 等模型。独创持久记忆系统通过项目记忆、会话检查点、任务进度三重机制解决长会话遗忘，由独立 subagent 自动保存状态并在窗口快满时生成简报。Compose 模式可一键完成设计、规划、编码、测试、审查全流程。内置 /dream 命令每 7 天自动合并、去重、验证路径并压缩记忆文件。支持语音输入与控制（MiMo-V2.5-ASR）。

智能体产品更新开源生态编码

关联讨论 5 条

04:30

IT之家（RSS）

甲骨文 2026 财年年报归母净利润 169.84 亿美元，同比增长 36.50%

甲骨文发布2026财年（2025年6月–2026年5月）年报及第四财季报告。全年营业总收入673.57亿美元，同比增长17.35%；归母净利润169.84亿美元，同比增长36.50%。云业务总营收340亿美元，同比增长39%，其中云基础设施（IaaS）营收同比增长77%。第四财季营收191.84亿美元，同比增长20.63%，云业务营收99亿美元，同比增长47%。AI驱动下，Multicloud AI数据库第四季度营收同比增长404%。剩余履约义务达6380亿美元。展望2027财年全年，总营收指引为900亿美元，非-GAAP每股收益指引上调至8.05美元，同比增长18%。

行业动态部署/工程

04:29

OpenRouter：Announcements（RSS）

精选67

Gemini 2.5 Flash API - 定价、快速入门与提供商比较

Gemini 2.5 Flash API 支持配置思考预算（thinking budgets），用户可跨提供商进行比较，并在5分钟内完成首次API调用。

Google推理教程/实践

关联讨论 1 条

推荐理由：想给 Gemini 2.5 Flash 省钱调 thinking budget？这篇把各提供商的定价和配置一次说清，五分钟就能跑通第一个调用，做 API 集成的可以直接抄。

04:24

Xiaomi MiMo@XiaomiMiMo

小米 MiMo 推出开源 AI 编程助手 MiMo Code V0.1

小米 MiMo 正式开源 AI 编程助手 MiMo Code V0.1，搭载多模态模型 MiMo V2.5（限时免费），拥有百万 token 上下文窗口。核心功能包括：无限上下文与无损压缩、Agent 框架（测试/审查/验证闭环）、Compose 模式（设计先行）、自进化系统、语音输入（基于 MiMo-V2.5-ASR）。兼容 Claude Code，自动加载现有技能、MCP 服务器和命令，零成本迁移。采用 MIT 许可，支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等模型提供商。可通过一行命令安装。

智能体产品更新开源生态编码

关联讨论 5 条

04:24

Rohan Paul@rohanpaul_ai

Anthropic CEO Dario Amodei 发文呼吁前沿AI政策改革

Anthropic CEO Amodei 发布新文章，称前沿AI发展速度远超政府监管能力，亟需政策改革。他提出四项核心主张：①强制预发布测试与独立审计，政府有权阻止存在严重网络、生物、自主或自动研发风险的模型部署；②加强安全要求，包括模型权重保护、红队测试、渗透测试及快速上报安全事故；③为劳动力颠覆做好准备，完善就业测量、提供就业激励、工资支持、培训，并探索由AI增长资助的长期收入支持；④民主国家应在AI安全、芯片供应链、出口管制、利益共享、共同防御及防范AI压迫方面进行全球协调。

Dario Amodei: Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast-much faster than the po...

Anthropic大佬观点

04:24

Bloomberg：Technology（RSS）

OpenAI 称与中国关联的账号试图煽动美国数据中心反对

OpenAI 表示，一批与中国关联的 ChatGPT 账号试图在美国当地煽动反对建设数据中心，此举可能旨在阻碍美国在人工智能领域的竞争力。这一说法与近期科技行业的其他言论相呼应。

OpenAI行业动态

04:24

Bloomberg：Technology（RSS）

Oracle 数据中心支出超预期

Oracle Corp. 季度资本支出高于分析师预期，引发投资者对其 AI 基础设施业务盈利能力的担忧。

行业动态部署/工程

04:23

Simon Willison 博客

DiffusionGemma 发布：Google 开源 26B 参数扩散模型，NVIDIA 免费托管

Google 将去年 5 月短暂发布的 Gemini Diffusion 研究成果转化为开放权重的 Gemma 模型，模型名为 google/diffusiongemma-26B-A4B-it，采用 Apache 2 许可证开源。NVIDIA 正通过其 NIM 云 API 免费托管该模型。实测生成 2,409 个模型 token 仅需 4.4 秒，速度至少达到 500 token/s。

Google多模态开源生态模型发布

04:23

Cursor Blog

精选74

Cursor Bugbot 更新：速度提升超 3 倍、成本降低 22%、发现更多 Bug

Cursor 的代码审查工具 Bugbot 迎来重大更新：运行速度提升超 3 倍，成本降低 22%，每轮审查多发现 10% 的 bug，90% 的运行在三分钟内完成。新增 `/review` 命令，可在推送代码前运行 Bugbot 和安全审查，并与 GitHub/GitLab 同步——若已通过 `/review` 审查过同一 diff，打开 PR 时 Bugbot 会自动跳过并备注。支持配置仅审查 PR 中新增内容。性能提升源于驱动 Bugbot 的 Composer 2.5 模型训练改进。Bugbot 遵循模型阻止列表，若组织禁用 Composer 2.5 则自动回退。该功能已在 Cursor 3.7+ 和 cursor.com/agents 上线，CLI 支持即将推出。

智能体产品更新编码

推荐理由：Cursor 的 Bugbot 三倍速跑 review 还便宜了 22%，这次更新让「commit 前先审一遍」变得几乎无痛，对日常开发流是个实在提升。

04:12

jason@jxnlco

很快，如果你用这些模型制作咨询风格的幻灯片来推介一种新药。它不仅会向你收取 API 费用，还会要求成为合著者，并在测试成功时获得分成。这就是资助 AGI 的方式。

OpenAI大佬观点

04:03

OpenAI：官网动态（RSS · 排除企业/客户案例）

OpenAI报告：PRC关联影响力行动瞄准美国AI辩论

OpenAI发布最新报告，详细披露了PRC关联的影响力行动利用AI工具干扰美国科技辩论、数据中心选址叙事、关税政策讨论，并散布关于ChatGPT的虚假指控。

OpenAI安全/对齐

03:56

Ars Technica：AI（RSS）

Google DeepMind 发布 DiffusionGemma，本地 AI 推理速度提升 4 倍

Google DeepMind 发布 DiffusionGemma，一款利用扩散模型加速文本输出的新模型，本地 AI 推理速度达到传统模型的 4 倍。

DeepMindGoogle开源/仓库模型发布

03:47

Chubby♨️@kimmonismus

Anthropic CEO Dario Amodei 发表新文《Policy on the AI Exponential》

Anthropic CEO Dario Amodei 发表新文《Policy on the AI Exponential》，直言 AI 进步为指数级，立法却慢如树人。他给出明确时间线：若规模法则再持续一两年，很可能出现“数据中心里的天才之国”。他引用 Claude Mythos Preview 的网络风险，称其证明 AI 已是全球战略级工具。为此主张类似 FAA 的约束性规则——强制前沿模型第三方测试，政府有权阻止或撤销不安全发布。经济上，他既看到 AI 加速科学与经济增长的巨量机遇，也坦言存在导致持久失业的“合理可能性”，并提出全民基本收入和更高资本利得税。他警告 AI 可能成为“专制终极工具”，且行业不能完全托付给政府或公司。他拒绝将公众担忧视为公关问题，强调担忧合理。文章基调是紧迫而非胜利，称窗口期已过一年。

Dario Amodei: Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast-much faster than the po...

Anthropic大佬观点安全/对齐政策/监管

03:47

Hacker News 热门（buzzing.cc 中文翻译）

Claude Desktop 启动了一台虚拟机，且无法停止它

Claude Desktop 会在用户无授权的情况下自动启动一台虚拟机，且提供任何停止或关闭该虚拟机的途径。这一行为已在 GitHub 上引发讨论，用户担忧其可能带来的资源占用及隐私安全风险。

Anthropic产品更新部署/工程

03:42

Tomer Tunguz 博客（VC 分析）

Anthropic Fable 模型的"玻璃天花板"：最强性能与强护栏并存

Anthropic 的 Fable 模型（Claude Fable 5）推理性能翻倍，关键基准测试得分提升 10–15 个百分点，远超此前约 2 个百分点的典型进步。Stripe 借助该模型将 5000 万行 Ruby 代码库的迁移压缩至一天，数万行代码重构仅用 45 分钟。然而 Fable 施加了强护栏限制，对违规话题（如植物细胞、现代大语言模型描述、软件安全）容易触发温和提示——这是为维持系统稳定而设定的“玻璃天花板”，其下方仍有广阔探索空间。

Anthropic大佬观点安全/对齐模型发布

关联讨论 35 条

03:36

MiniMax (official)@MiniMax_AI

发布功能、重构仓库、复活已死的项目。这就是 M3 擅长的工作。 5000 美元奖池 + 至 16 日 M3 模型 token 80% 折扣

Cysic: 1/ CyOps Arena is here. • $5000 prize pool for 10 winners • 80% off model token price for a limited time • Submission de...

行业动态

03:36

MiniMax (official)@MiniMax_AI

精选75

M3 在 @0G_labs 上链。可验证 + 私有计算，6 月 15-18 日免费运行。

0G Labs (Home of Infinite AI): 0G × @MiniMax_AI We're thrilled to partner with MiniMax to bring frontier AI on-chain through verifiable, privacy-preser...

产品更新安全/对齐开源生态

推荐理由：M3 自己是开源榜头名，现在拉到链上跑还免费用四天，做隐私计算和链上 agent 的开发者可以直接冲。

03:24

Xiaomi MiMo@XiaomiMiMo

小米 MiMo 发布并开源 MiMo Code V0.1，终端 AI 编程助手

小米 MiMo 发布并开源 MiMo Code V0.1，一款终端 AI 编程助手。它附带多模态模型 MiMo V2.5（限时免费），支持百万 token 上下文窗口。核心特性包括：无限上下文（无损压缩，百万行项目质量不降）、深度优化的 Agent 框架（测试/审查/验证闭环）、Compose 模式（规格→计划→构建→报告）、自动学习每轮会话经验的自我进化系统、MiMo-V2.5-ASR 语音输入、与 Claude Code 兼容（可复用现有 skills/MCP/API 配置）、MIT 许可，并支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等模型提供商。一键安装（Mac/Linux 用 curl，Windows 用 npm install）。

智能体GitHub产品更新编码

关联讨论 5 条

03:22

The Decoder：AI News（RSS）

Google 新开源模型 DiffusionGemma：从噪声生成文本，而非逐字逐词

Google 发布 260 亿参数的 DiffusionGemma 模型，文本生成方式不再逐 token 预测，而是通过扩散过程从噪声直接生成，类似图像 AI 将噪声转化为图片。Nvidia 测试显示，该模型在单块 H100 GPU 上可达约每秒 1,000 tokens，速度约为可比自回归模型的四倍。代价是输出质量较低，因此 Google 目前将其定位为面向开发者的实验性工具。模型已开源。

Google多模态开源生态模型发布

03:17

Hacker News 热门（buzzing.cc 中文翻译）

0.01欧元转账可危及银行AI代理系统，bunq修复安全漏洞

安全公司blue41发现，通过向bunq银行AI代理发送一笔0.01欧元的转账，攻击者可能利用提示词注入等漏洞操控AI代理，进而获取用户数据或执行未授权操作。该漏洞源于AI代理对用户输入与系统指令的边界处理不足。bunq已与blue41合作修复问题，并公开致谢。此次事件凸显金融AI智能体面临的新型安全风险。

智能体MCP/工具安全/对齐

03:15

OpenRouter@OpenRouter

OpenRouter 的 dev rel @jjacky 构建了 Royale： Last Agent Stand--一个专门给 AI 智能体玩的大逃杀游戏，让 11 个 LLM 相互竞争并运行了 30 次。结果发现，在零和博弈中过于"友善"的模型输得最惨，而最意想不到的模型赢得了胜利。该实验揭示：模型的"友善"特质在某些任务（如竞争性场景）中可能成为劣势，传统基准测试无法体现这一点。

jacky: no benchmark will tell you this: LLMs can be /too/ nice unsurprisingly, in a competitive zero-sum setting, being nice ca...

智能体现象/趋势

03:15

OpenRouter@OpenRouter

Fable 目前的使用量是 Opus 4.8 的两倍（日 token 使用量相同，但价格高一倍）

现象/趋势行业动态

03:15

Chubby♨️@kimmonismus

Anthropic CEO 发文警告 AI 指数级发展远超政策制定速度

Anthropic CEO Dario Amodei 发表新文，罕见坦诚警告 AI 发展速度远超政策制定。若缩放定律再持续一两年，将出现“数据中心里的天才之国”。他以自家模型 Claude Mythos Preview 的网络风险为例，证明 AI 已是全球战略工具。他提议类似 FAA 的约束性规则：强制第三方测试前沿模型，政府有权阻止或撤销不安全发布。经济上 AI 可带来极快增长，但也存在持久失业可能，需考虑 UBI 和资本利得税。他警告 AI 或成专制工具，且不能完全信任政府或公司（包括 Anthropic）。他认为公众恐惧合理，非公关问题。强调民意、证据和政治意愿正汇聚，但已迟约一年。

Dario Amodei: Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast-much faster than the po...

Anthropic大佬观点安全/对齐政策/监管

关联讨论 3 条

03:12

Google DeepMind@GoogleDeepMind

在塞拉利昂，激增的学生人数正超过可用教师资源。我们最新的研究探索了AI如何在这些环境中作为合作伙伴支持教育工作者--扩大他们的影响力，同时不取代其核心的专业知识与技能。🧵

DeepMind论文/研究