实现了一个端到端的 Microsoft SkillOpt 仪表化工作流,包括设置仓库、连接 OpenAI 兼容模型、配置优化器和目标模型。以原始种子技能为基线,运行包含 rollout、reflection、aggregation、selection、更新和验证门控的优化循环,检查训练历史,可视化准确率、编辑预算行为和 token 用量,并将进化后的技能与基线进行比较。
天体物理学家 Chi-kwan Chan 借助 Codex 构建黑洞模拟程序,用于研究极端物理现象并检验爱因斯坦的广义相对论。
本文发表于 darioamodei.com,英文标题 "Policy on the AI Exponential",中文译为“关于人工智能指数增长的政策”。文章聚焦于人工智能能力的指数级提升对公共政策提出的新挑战,强调现有政策框架需进行根本性调整以适应 AI 的快速迭代。该文在 Hacker News 上获得 100 点热度,引发讨论。
CNBC记者问Palantir CEO Alex Karp如何回应华尔街对AI可能复制Palantir业务的担忧。Karp表示,AI公司虽有优秀工程师,但根本不了解企业级实际问题的复杂性和高难度。他指出,从造车到国防,这些高端企业的核心业务不仅涉及技术,还有文化和信任层面的鸿沟,没有一家此类企业会采用AI公司提供的方案。
We want to make AI accessible for everyone, so we're reducing our API prices by ~50%. Consumer AI growth is still blocke...
来自 Elon Musk 旗下 xAI 的一批前员工组建了一家新创业公司,专注于个性化人工智能。这可能是近期 xAI 离职潮中备受关注的新公司。
子智能体现可创建自己的子智能体,最多嵌套5层。Amazon Bedrock 在未设置 AWS_REGION 时从 ~/.aws/config 读取区域。插件市场新增搜索栏。修复了使用1M上下文且无使用额度的会话永久卡住的问题,现会自动压缩回标准上下文限制。修复了多个图片导致重复报错等问题。改进了长对话性能,减少冗余消息归一化和不必要的UI重绘,降低空闲CPU占用。Claude in Chrome 工具加载改为单次批量调用。/code-review 在未登录时保留 ultra 选项并提示需要 claude.ai 账户。
关联讨论 2 条Claude Code:GitHub Releases(RSS)X:Claude Devs (@ClaudeDevs)NASA喷气推进实验室(JPL)正维持已运行13年的“好奇号”火星车继续执行科学任务。该火星车自2012年着陆以来持续探测盖尔陨石坑,JPL通过远程软件更新、故障规避和能源管理策略延长其工作寿命。
一篇分析Anthropic模型命名模式的外推文章在Hacker News上获得139个点赞,原文发布于samwilkinson.io。
6 月 11 日,小米 MiMo 发布并开源 MiMo Code V0.1.0,一款终端 AI 编程助手,基于 OpenCode 二次开发,采用 MIT 协议。内置限时免费多模态模型 MiMo-V2.5,支持接入 DeepSeek、Kimi、GLM 等模型。独创持久记忆系统通过项目记忆、会话检查点、任务进度三重机制解决长会话遗忘,由独立 subagent 自动保存状态并在窗口快满时生成简报。Compose 模式可一键完成设计、规划、编码、测试、审查全流程。内置 /dream 命令每 7 天自动合并、去重、验证路径并压缩记忆文件。支持语音输入与控制(MiMo-V2.5-ASR)。
关联讨论 5 条Hacker News 热门(buzzing.cc 中文翻译)X:Berry Xia (@berryxia)X:小米 MiMo (@XiaomiMiMo)X:邵猛 (@shao__meng)公众号:小米 MiMo甲骨文发布2026财年(2025年6月–2026年5月)年报及第四财季报告。全年营业总收入673.57亿美元,同比增长17.35%;归母净利润169.84亿美元,同比增长36.50%。云业务总营收340亿美元,同比增长39%,其中云基础设施(IaaS)营收同比增长77%。第四财季营收191.84亿美元,同比增长20.63%,云业务营收99亿美元,同比增长47%。AI驱动下,Multicloud AI数据库第四季度营收同比增长404%。剩余履约义务达6380亿美元。展望2027财年全年,总营收指引为900亿美元,非-GAAP每股收益指引上调至8.05美元,同比增长18%。
Gemini 2.5 Flash API 支持配置思考预算(thinking budgets),用户可跨提供商进行比较,并在5分钟内完成首次API调用。
关联讨论 1 条OpenRouter:Announcements(RSS)小米 MiMo 正式开源 AI 编程助手 MiMo Code V0.1,搭载多模态模型 MiMo V2.5(限时免费),拥有百万 token 上下文窗口。核心功能包括:无限上下文与无损压缩、Agent 框架(测试/审查/验证闭环)、Compose 模式(设计先行)、自进化系统、语音输入(基于 MiMo-V2.5-ASR)。兼容 Claude Code,自动加载现有技能、MCP 服务器和命令,零成本迁移。采用 MIT 许可,支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等模型提供商。可通过一行命令安装。
关联讨论 5 条Hacker News 热门(buzzing.cc 中文翻译)X:Berry Xia (@berryxia)X:小米 MiMo (@XiaomiMiMo)X:邵猛 (@shao__meng)公众号:小米 MiMoAnthropic CEO Amodei 发布新文章,称前沿AI发展速度远超政府监管能力,亟需政策改革。他提出四项核心主张:①强制预发布测试与独立审计,政府有权阻止存在严重网络、生物、自主或自动研发风险的模型部署;②加强安全要求,包括模型权重保护、红队测试、渗透测试及快速上报安全事故;③为劳动力颠覆做好准备,完善就业测量、提供就业激励、工资支持、培训,并探索由AI增长资助的长期收入支持;④民主国家应在AI安全、芯片供应链、出口管制、利益共享、共同防御及防范AI压迫方面进行全球协调。
Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast-much faster than the po...
OpenAI 表示,一批与中国关联的 ChatGPT 账号试图在美国当地煽动反对建设数据中心,此举可能旨在阻碍美国在人工智能领域的竞争力。这一说法与近期科技行业的其他言论相呼应。
Google 将去年 5 月短暂发布的 Gemini Diffusion 研究成果转化为开放权重的 Gemma 模型,模型名为 google/diffusiongemma-26B-A4B-it,采用 Apache 2 许可证开源。NVIDIA 正通过其 NIM 云 API 免费托管该模型。实测生成 2,409 个模型 token 仅需 4.4 秒,速度至少达到 500 token/s。
Cursor 的代码审查工具 Bugbot 迎来重大更新:运行速度提升超 3 倍,成本降低 22%,每轮审查多发现 10% 的 bug,90% 的运行在三分钟内完成。新增 `/review` 命令,可在推送代码前运行 Bugbot 和安全审查,并与 GitHub/GitLab 同步——若已通过 `/review` 审查过同一 diff,打开 PR 时 Bugbot 会自动跳过并备注。支持配置仅审查 PR 中新增内容。性能提升源于驱动 Bugbot 的 Composer 2.5 模型训练改进。Bugbot 遵循模型阻止列表,若组织禁用 Composer 2.5 则自动回退。该功能已在 Cursor 3.7+ 和 cursor.com/agents 上线,CLI 支持即将推出。
OpenAI发布最新报告,详细披露了PRC关联的影响力行动利用AI工具干扰美国科技辩论、数据中心选址叙事、关税政策讨论,并散布关于ChatGPT的虚假指控。
Google DeepMind 发布 DiffusionGemma,一款利用扩散模型加速文本输出的新模型,本地 AI 推理速度达到传统模型的 4 倍。
Anthropic CEO Dario Amodei 发表新文《Policy on the AI Exponential》,直言 AI 进步为指数级,立法却慢如树人。他给出明确时间线:若规模法则再持续一两年,很可能出现“数据中心里的天才之国”。他引用 Claude Mythos Preview 的网络风险,称其证明 AI 已是全球战略级工具。为此主张类似 FAA 的约束性规则——强制前沿模型第三方测试,政府有权阻止或撤销不安全发布。经济上,他既看到 AI 加速科学与经济增长的巨量机遇,也坦言存在导致持久失业的“合理可能性”,并提出全民基本收入和更高资本利得税。他警告 AI 可能成为“专制终极工具”,且行业不能完全托付给政府或公司。他拒绝将公众担忧视为公关问题,强调担忧合理。文章基调是紧迫而非胜利,称窗口期已过一年。
Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast-much faster than the po...
Claude Desktop 会在用户无授权的情况下自动启动一台虚拟机,且提供任何停止或关闭该虚拟机的途径。这一行为已在 GitHub 上引发讨论,用户担忧其可能带来的资源占用及隐私安全风险。
Anthropic 的 Fable 模型(Claude Fable 5)推理性能翻倍,关键基准测试得分提升 10–15 个百分点,远超此前约 2 个百分点的典型进步。Stripe 借助该模型将 5000 万行 Ruby 代码库的迁移压缩至一天,数万行代码重构仅用 45 分钟。然而 Fable 施加了强护栏限制,对违规话题(如植物细胞、现代大语言模型描述、软件安全)容易触发温和提示——这是为维持系统稳定而设定的“玻璃天花板”,其下方仍有广阔探索空间。
关联讨论 35 条Anthropic:Newsroom(网页)X:Rohan Paul (@rohanpaul_ai)X:Testing Catalog (@testingcatalog)X:邵猛 (@shao__meng)IT之家(RSS)Ars Technica:AI(RSS)X:Yuchen Jin (@Yuchenj_UW)X:Anthropic (@AnthropicAI)Hacker News 热门(buzzing.cc 中文翻译)X:阿易 AI Notes (@AYi_AInotes)公众号:卡尔的AI沃茨X:Kim (@kimmonismus)The Decoder:AI News(RSS)TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)X:Perplexity (@perplexity_ai)The Verge:AI(RSS)Simon Willison 博客X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)Gary Marcus:The Road to AI We Can Trust(RSS)X:小互 (@xiaohu)MarkTechPost(RSS)1/ CyOps Arena is here. • $5000 prize pool for 10 winners • 80% off model token price for a limited time • Submission de...
0G × @MiniMax_AI We're thrilled to partner with MiniMax to bring frontier AI on-chain through verifiable, privacy-preser...
小米 MiMo 发布并开源 MiMo Code V0.1,一款终端 AI 编程助手。它附带多模态模型 MiMo V2.5(限时免费),支持百万 token 上下文窗口。核心特性包括:无限上下文(无损压缩,百万行项目质量不降)、深度优化的 Agent 框架(测试/审查/验证闭环)、Compose 模式(规格→计划→构建→报告)、自动学习每轮会话经验的自我进化系统、MiMo-V2.5-ASR 语音输入、与 Claude Code 兼容(可复用现有 skills/MCP/API 配置)、MIT 许可,并支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等模型提供商。一键安装(Mac/Linux 用 curl,Windows 用 npm install)。
关联讨论 5 条Hacker News 热门(buzzing.cc 中文翻译)X:Berry Xia (@berryxia)X:小米 MiMo (@XiaomiMiMo)X:邵猛 (@shao__meng)公众号:小米 MiMoGoogle 发布 260 亿参数的 DiffusionGemma 模型,文本生成方式不再逐 token 预测,而是通过扩散过程从噪声直接生成,类似图像 AI 将噪声转化为图片。Nvidia 测试显示,该模型在单块 H100 GPU 上可达约每秒 1,000 tokens,速度约为可比自回归模型的四倍。代价是输出质量较低,因此 Google 目前将其定位为面向开发者的实验性工具。模型已开源。
安全公司blue41发现,通过向bunq银行AI代理发送一笔0.01欧元的转账,攻击者可能利用提示词注入等漏洞操控AI代理,进而获取用户数据或执行未授权操作。该漏洞源于AI代理对用户输入与系统指令的边界处理不足。bunq已与blue41合作修复问题,并公开致谢。此次事件凸显金融AI智能体面临的新型安全风险。
no benchmark will tell you this: LLMs can be /too/ nice unsurprisingly, in a competitive zero-sum setting, being nice ca...
Anthropic CEO Dario Amodei 发表新文,罕见坦诚警告 AI 发展速度远超政策制定。若缩放定律再持续一两年,将出现“数据中心里的天才之国”。他以自家模型 Claude Mythos Preview 的网络风险为例,证明 AI 已是全球战略工具。他提议类似 FAA 的约束性规则:强制第三方测试前沿模型,政府有权阻止或撤销不安全发布。经济上 AI 可带来极快增长,但也存在持久失业可能,需考虑 UBI 和资本利得税。他警告 AI 或成专制工具,且不能完全信任政府或公司(包括 Anthropic)。他认为公众恐惧合理,非公关问题。强调民意、证据和政治意愿正汇聚,但已迟约一年。
Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast-much faster than the po...
关联讨论 3 条X:Dario Amodei (@DarioAmodei)Dario Amodei:Blog(网页)X:Rohan Paul (@rohanpaul_ai)