苹果在 WWDC 2026 推出 CarPlay“路线共享”功能,支持导航应用以路段坐标数组向车辆传递路线并实时更新,解决特斯拉 FSD 因无法获知 CarPlay 目的地导致的自动变道失效问题。反向操作也支持:特斯拉可根据能耗选充电站,回传途经点至 iPhone 更新路线。另新增视频浏览应用,支持 AirPlay 视频串流,驾驶时自动切换纯音频。
苹果在 WWDC 2026 推出 CarPlay“路线共享”功能,支持导航应用以路段坐标数组向车辆传递路线并实时更新,解决特斯拉 FSD 因无法获知 CarPlay 目的地导致的自动变道失效问题。反向操作也支持:特斯拉可根据能耗选充电站,回传途经点至 iPhone 更新路线。另新增视频浏览应用,支持 AirPlay 视频串流,驾驶时自动切换纯音频。
datasette-agent 0.2a0 新增两个核心功能。工具可通过 `ToolContext` 对象的 `await context.ask_user(...)` 向用户提问,支持 yes/no、多选(`options=[...]`)或自由文本(`free_text=True`)。问题未回答时 agent 挂起,问题以表单形式渲染在聊天界面并持久化到内部数据库,服务器重启后对话可继续。工具应在执行副作用前调用 `ask_user()`,回答后从头重放。另一内置工具 `save_query` 允许 agent 将 SQL 保存为 Datasette 存储查询,但必须经人工批准——显示完整 SQL 及提议的名称、数据库和可见性,用户确认后才会存储。`ask_user` 功能基于作者昨日用 Claude Fable 5 构建的新 LLM alpha 实现。
Anthropic 发布数据保留政策,要求对其 Fable 和 Mythos 产品或模型执行 30 天数据保留。该政策源自 support.claude.com 支持页面,并在 Hacker News 上获得 108 个点赞。具体内容指相关数据将被保留 30 天,适用于 Fable 和 Mythos。详细规定及影响范围可查阅官方文档。
DeepSeek 的相关说明在 Hacker News 上获得 100 个 HN Points,发布于 6 月 10 日。
现有PPO风格信任区域机制对所有token施加统一阈值,忽视自回归生成的非对称性和累积前缀漂移。CPPO通过位置加权阈值和累积前缀预算两种耦合机制进行优化:早期位置限制更严格以抑制序列级漂移,后期位置放宽约束以保障探索;同时动态追踪历史偏差,防止前缀沿累计误差。实验表明,该方法在不同模型规模下均能提升训练稳定性并显著提高推理准确率。
谷歌6月11日发布开源文本扩散模型DiffusionGemma,本地推理速度较自回归模型提升4倍。采用Apache 2.0许可证,可从Hugging Face下载权重。采样速度1479 tokens/秒,开销0.84秒。代码生成HumanEval达89.6%,数学AIME 2025达23.3%超越对比模型。在H100 GPU上每秒生成1000 token,DGX Station上可达2000 token。
Anthropic 推出首个 Mythos 级模型 Claude Fable 5,因 Anthropic 要求留存用户提问与输出内容(30 天后删除,违规最长两年),微软已限制员工使用该模型,但为 GitHub Copilot 和 Foundry 的付费客户上线了 Fable 5。微软内部其余 Claude 模型均遵循零数据留存(ZDR)规则仍可正常使用,公司法务团队正评估新条款。
OpenAI CEO 萨姆·奥尔特曼本周在致员工内部邮件中预估公司“明年内”上市,此前已向美国证券交易委员会秘密提交 IPO 申请。奥尔特曼表示,技术发展速度可能影响 IPO 时间,尤其指出递归自我改进(RSI)若加速,推迟 IPO 会更有利。OpenAI 同时正筹备全新模型,代号 5.6,据首席科学家 Jakub Pachocki 称,该模型将比当前旗舰系统 GPT-5.5 有“显著改进”。
一名前 xAI 工程师起诉 xAI 和 SpaceX,称自己因在 SpaceX 历史性 IPO 前几天提出 Grok 的 AI 安全问题而被公司解雇。诉讼指控不当解雇,但未披露 Grok 安全担忧的具体细节。
OpenAI 与 Oracle 合作,用户可利用现有 Oracle 云服务承诺(commitment)额度,在 Oracle 云上访问 OpenAI 模型和 Codex,用于构建和部署 AI 应用,同时获得企业级安全与治理能力。
实现了一个端到端的 Microsoft SkillOpt 仪表化工作流,包括设置仓库、连接 OpenAI 兼容模型、配置优化器和目标模型。以原始种子技能为基线,运行包含 rollout、reflection、aggregation、selection、更新和验证门控的优化循环,检查训练历史,可视化准确率、编辑预算行为和 token 用量,并将进化后的技能与基线进行比较。
天体物理学家 Chi-kwan Chan 借助 Codex 构建黑洞模拟程序,用于研究极端物理现象并检验爱因斯坦的广义相对论。
本文发表于 darioamodei.com,英文标题 "Policy on the AI Exponential",中文译为“关于人工智能指数增长的政策”。文章聚焦于人工智能能力的指数级提升对公共政策提出的新挑战,强调现有政策框架需进行根本性调整以适应 AI 的快速迭代。该文在 Hacker News 上获得 100 点热度,引发讨论。
来自 Elon Musk 旗下 xAI 的一批前员工组建了一家新创业公司,专注于个性化人工智能。这可能是近期 xAI 离职潮中备受关注的新公司。
子智能体现可创建自己的子智能体,最多嵌套5层。Amazon Bedrock 在未设置 AWS_REGION 时从 ~/.aws/config 读取区域。插件市场新增搜索栏。修复了使用1M上下文且无使用额度的会话永久卡住的问题,现会自动压缩回标准上下文限制。修复了多个图片导致重复报错等问题。改进了长对话性能,减少冗余消息归一化和不必要的UI重绘,降低空闲CPU占用。Claude in Chrome 工具加载改为单次批量调用。/code-review 在未登录时保留 ultra 选项并提示需要 claude.ai 账户。
关联讨论 2 条Claude Code:GitHub Releases(RSS)X:Claude Devs (@ClaudeDevs)NASA喷气推进实验室(JPL)正维持已运行13年的“好奇号”火星车继续执行科学任务。该火星车自2012年着陆以来持续探测盖尔陨石坑,JPL通过远程软件更新、故障规避和能源管理策略延长其工作寿命。
一篇分析Anthropic模型命名模式的外推文章在Hacker News上获得139个点赞,原文发布于samwilkinson.io。
6 月 11 日,小米 MiMo 发布并开源 MiMo Code V0.1.0,一款终端 AI 编程助手,基于 OpenCode 二次开发,采用 MIT 协议。内置限时免费多模态模型 MiMo-V2.5,支持接入 DeepSeek、Kimi、GLM 等模型。独创持久记忆系统通过项目记忆、会话检查点、任务进度三重机制解决长会话遗忘,由独立 subagent 自动保存状态并在窗口快满时生成简报。Compose 模式可一键完成设计、规划、编码、测试、审查全流程。内置 /dream 命令每 7 天自动合并、去重、验证路径并压缩记忆文件。支持语音输入与控制(MiMo-V2.5-ASR)。
关联讨论 5 条Hacker News 热门(buzzing.cc 中文翻译)X:Berry Xia (@berryxia)X:小米 MiMo (@XiaomiMiMo)X:邵猛 (@shao__meng)公众号:小米 MiMo甲骨文发布2026财年(2025年6月–2026年5月)年报及第四财季报告。全年营业总收入673.57亿美元,同比增长17.35%;归母净利润169.84亿美元,同比增长36.50%。云业务总营收340亿美元,同比增长39%,其中云基础设施(IaaS)营收同比增长77%。第四财季营收191.84亿美元,同比增长20.63%,云业务营收99亿美元,同比增长47%。AI驱动下,Multicloud AI数据库第四季度营收同比增长404%。剩余履约义务达6380亿美元。展望2027财年全年,总营收指引为900亿美元,非-GAAP每股收益指引上调至8.05美元,同比增长18%。
Gemini 2.5 Flash API 支持配置思考预算(thinking budgets),用户可跨提供商进行比较,并在5分钟内完成首次API调用。
关联讨论 1 条OpenRouter:Announcements(RSS)OpenAI 表示,一批与中国关联的 ChatGPT 账号试图在美国当地煽动反对建设数据中心,此举可能旨在阻碍美国在人工智能领域的竞争力。这一说法与近期科技行业的其他言论相呼应。
Google 将去年 5 月短暂发布的 Gemini Diffusion 研究成果转化为开放权重的 Gemma 模型,模型名为 google/diffusiongemma-26B-A4B-it,采用 Apache 2 许可证开源。NVIDIA 正通过其 NIM 云 API 免费托管该模型。实测生成 2,409 个模型 token 仅需 4.4 秒,速度至少达到 500 token/s。
Cursor 的代码审查工具 Bugbot 迎来重大更新:运行速度提升超 3 倍,成本降低 22%,每轮审查多发现 10% 的 bug,90% 的运行在三分钟内完成。新增 `/review` 命令,可在推送代码前运行 Bugbot 和安全审查,并与 GitHub/GitLab 同步——若已通过 `/review` 审查过同一 diff,打开 PR 时 Bugbot 会自动跳过并备注。支持配置仅审查 PR 中新增内容。性能提升源于驱动 Bugbot 的 Composer 2.5 模型训练改进。Bugbot 遵循模型阻止列表,若组织禁用 Composer 2.5 则自动回退。该功能已在 Cursor 3.7+ 和 cursor.com/agents 上线,CLI 支持即将推出。
OpenAI发布最新报告,详细披露了PRC关联的影响力行动利用AI工具干扰美国科技辩论、数据中心选址叙事、关税政策讨论,并散布关于ChatGPT的虚假指控。
Google DeepMind 发布 DiffusionGemma,一款利用扩散模型加速文本输出的新模型,本地 AI 推理速度达到传统模型的 4 倍。
Claude Desktop 会在用户无授权的情况下自动启动一台虚拟机,且提供任何停止或关闭该虚拟机的途径。这一行为已在 GitHub 上引发讨论,用户担忧其可能带来的资源占用及隐私安全风险。
Anthropic 的 Fable 模型(Claude Fable 5)推理性能翻倍,关键基准测试得分提升 10–15 个百分点,远超此前约 2 个百分点的典型进步。Stripe 借助该模型将 5000 万行 Ruby 代码库的迁移压缩至一天,数万行代码重构仅用 45 分钟。然而 Fable 施加了强护栏限制,对违规话题(如植物细胞、现代大语言模型描述、软件安全)容易触发温和提示——这是为维持系统稳定而设定的“玻璃天花板”,其下方仍有广阔探索空间。
关联讨论 29 条公众号:卡尔的AI沃茨TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)Anthropic:Newsroom(网页)X:Perplexity (@perplexity_ai)Simon Willison 博客The Verge:AI(RSS)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Rohan Paul (@rohanpaul_ai)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:阿易 AI Notes (@AYi_AInotes)X:小互 (@xiaohu)Google 发布 260 亿参数的 DiffusionGemma 模型,文本生成方式不再逐 token 预测,而是通过扩散过程从噪声直接生成,类似图像 AI 将噪声转化为图片。Nvidia 测试显示,该模型在单块 H100 GPU 上可达约每秒 1,000 tokens,速度约为可比自回归模型的四倍。代价是输出质量较低,因此 Google 目前将其定位为面向开发者的实验性工具。模型已开源。
安全公司blue41发现,通过向bunq银行AI代理发送一笔0.01欧元的转账,攻击者可能利用提示词注入等漏洞操控AI代理,进而获取用户数据或执行未授权操作。该漏洞源于AI代理对用户输入与系统指令的边界处理不足。bunq已与blue41合作修复问题,并公开致谢。此次事件凸显金融AI智能体面临的新型安全风险。
数据硬件与软件提供商 DDN 正在寻求年底前完成新一轮融资。该公司将 Nvidia 列为合作伙伴,客户包括 Google 和 Salesforce,CEO Alex Bouzari 透露了这一融资计划。
Anthropic PBC CEO Dario Amodei 表示,政府应当有权阻止人工智能开发者部署存在特定风险的新模型。
超微计算机计划通过一揽子股权发行筹集70亿美元,用于采购组件,以满足客户对其AI服务器的订单需求。该消息由彭博社报道。
Sam Altman 对员工表示,他预计 OpenAI 的 IPO 将在“一年内”进行,但可能推迟至 2027 年。他将这一延迟归因于对自我改进 AI 的谨慎态度,不过 Anthropic 更强的增长数据及其即将到来的 IPO 或许是更实际的等待理由。
关联讨论 10 条X:歸藏 (@op7418)OpenAI:官网动态(RSS · 排除企业/客户案例)IT之家(RSS)X:Testing Catalog (@testingcatalog)Bloomberg:Technology(RSS)X:Rohan Paul (@rohanpaul_ai)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)TechCrunch:AI(RSS)The Verge:AI(RSS)Google DeepMind 发布实验性开源模型 DiffusionGemma,参数量 26B,采用混合专家(MoE)架构,通过文本扩散(text diffusion)技术实现在 GPU 上最高 4 倍生成速度提升。模型权重已开放。
关联讨论 8 条X:Sundar Pichai (@sundarpichai)Google Developers Blog(RSS)Google DeepMind:Blog(RSS)X:Google AI for Developers (@googleaidevs)X:Google DeepMind (@GoogleDeepMind)X:Testing Catalog (@testingcatalog)Hacker News 热门(buzzing.cc 中文翻译)X:Demis Hassabis (@demishassabis)Anthropic 发布 Claude Fable 5,宣称其为迄今最强大的广泛可用模型,并称赞其生物学能力。但该模型设计上拒绝回答高中水平的基础生物学问题,而是将此类查询转交给上一代旗舰模型 Claude Opus 4.8。原因是 Fable 属于 Mythos 类模型,网络安全能力极强,Anthropic 认为将其完全公开过于危险,因此在公开版本中刻意限制部分能力。
关联讨论 29 条公众号:卡尔的AI沃茨TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)Anthropic:Newsroom(网页)X:Perplexity (@perplexity_ai)Simon Willison 博客The Verge:AI(RSS)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Rohan Paul (@rohanpaul_ai)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:阿易 AI Notes (@AYi_AInotes)X:小互 (@xiaohu)Apache Burr 是一个用于构建可靠 AI 智能体和应用程序的框架,已在 Apache 基金会下发布。该项目提供工具和抽象,帮助开发者设计、开发和部署可信任的智能体应用,强调可靠性、可观测性和生产级部署能力。
Google Research 在 AISTATS 2026 发表正则化 f-散度核检验,用于高效审计 LLM 等模型的机器遗忘。该方法通过统计两样本检验判断模型是否真正“忘记”特定训练数据,避免完全重训的巨大成本。相比最大均值差异等现有工具,新框架理论上可在任意样本量下自然控制假阳性,且假阴性风险随可用样本增加可靠收敛至零,解决了大规模模型审计中计算成本过高的问题。