国家数据局《数字中国发展报告》显示,截至2025年底,我国智能算力规模达159万PFLOPS,全球第二;在用算力机架超1373万架,建成万卡集群42个。同期网民规模11.25亿,普及率80.1%;使用AI解答问题、生成图片视频、生活助手的用户分别为4.57亿、2.88亿、1.84亿,中青年用户占74.6%。工信部《算力互联互通行动计划》提出到2026年建立标准,到2028年实现公共算力标准化互联。中国电信研究院预测,到2035年AI将为我国GDP贡献超11万亿元。
国家数据局《数字中国发展报告》显示,截至2025年底,我国智能算力规模达159万PFLOPS,全球第二;在用算力机架超1373万架,建成万卡集群42个。同期网民规模11.25亿,普及率80.1%;使用AI解答问题、生成图片视频、生活助手的用户分别为4.57亿、2.88亿、1.84亿,中青年用户占74.6%。工信部《算力互联互通行动计划》提出到2026年建立标准,到2028年实现公共算力标准化互联。中国电信研究院预测,到2035年AI将为我国GDP贡献超11万亿元。
亚马逊昨天推出 AI 定制商品功能,用户可通过 Alexa 使用自然语言提示词创建全新商品设计,将创意转化为图案并应用在服装、水杯等产品上。下单后由 Merch on Demand 生产,并通过 Prime 物流交付。该功能适合制作家庭聚会纪念 T 恤、宠物水杯等独一无二的定制商品,挑战 Redbubble、Bonfire 等在线周边平台,有望使 AI 设计商品成为普通消费者的日常购物选项。
谷歌宣布 Google AI Plus 套餐月费从8美元降至5美元,存储空间从200GB翻倍至400GB。该套餐于2026年1月推出,提供 Gemini 3 Pro、Nano Banana Pro 和 Deep Research 等功能,使用额度较 AI Pro 更严格。Google I/O 2026后新增 AI 邮件工具、Daily Brief 智能体(可总结用户当天安排)及视频生成模型 Gemini Omni。现有用户将陆续获得新增存储空间,下期账单反映新价格。
PBSD提出一种贝叶斯校准的自蒸馏方法,用于在稀疏最终奖励下进行细粒度信用分配。它通过验证答案的后验与先验概率比衡量轨迹质量,并利用贝叶斯规则将难以估计的答案侧比率转化为标准学生模型与特权、以答案为条件的教师模型之间的似然比。对该贝叶斯证据分数进行自回归分解,产生每步信号,识别中间推理步骤是支持还是削弱已验证结果。PBSD将稀疏结果监督转化为贝叶斯校准的逐步信用信号,与标准策略优化兼容。实验表明,该方法在领域内和领域外设置中一致提升性能,并有效将知识从短上下文训练迁移到长上下文推理。
针对基于可验证奖励的强化学习(RLVR)在组级别奖励无信息时无法提供梯度信号的问题,提出Reasoning Arena自适应训练框架。该框架将非多样化奖励组路由至评判系统,通过迹线锦标赛(trace tournaments)对推理迹线进行头对头比较,转化为相对奖励信号。每个新迹线仅与动态更新的少量锚点比较,然后在不完全比较图上拟合Bradley-Terry模型。在竞赛数学和编程基准上,平均超越RLVR基线7.6%,训练加速27%至41%,节省近50%生成计算量。
英伟达CEO黄仁勋针对公司供应商提出的投资建议过于乐观,Bloomberg Opinion专栏作者Shuli Ren认为,市场需要的是具体指引,而非这种过度乐观的表态。
滴滴作为首批合作伙伴,已将核心网约车服务融入微信 AI Agent。用户通过微信内 AI 交互说出“帮我叫一辆滴滴去机场”等指令,系统可根据行程距离、时效与个人偏好自动推荐最优车型并一键唤起叫车,全程不跳转。滴滴顺风车、滴滴代驾等更多服务也将接入。6月8日,微信发布《关于开发者接入微信 AI 生态的指引》,提供自动模式与开发模式两种接入选项。京东、美团、滴滴、携程、同程和肯德基均宣布作为首批内测团队接入。
Cursor 将欧洲总部设在伦敦,计划招聘约 200 名员工,并在巴黎、慕尼黑等地开设小型办事处。SpaceX 拥有以 600 亿美元收购 Cursor 的选择权,或支付 100 亿美元开展全新合作。Cursor 目前 B2B 年化营收约 26 亿美元,客户包括英国航空、英国石油、诺基亚等。公司强调数据留存欧洲本地以满足监管合规,其平台支持用户用自然语言生成代码,主打模型中立,竞争对手包括 GitHub Copilot、OpenAI 和谷歌的同类产品。
哈佛大学与 Perplexity 联合发表论文,采用匹配对会话方法对比自主 AI 智能体与搜索助手。结果显示,AI 智能体每会话可自主工作 26 分钟,而搜索助手仅能完成 33 秒的自主工作。智能体在自主性、时间效率与成本方面均实现大幅提升,并且尝试的工作范围更为广泛。
提出AHA-WAM,基于双扩散Transformer(DiT)架构,将视频DiT作为低频世界规划器,维护滚动键值记忆编码长程场景演化;高频动作DiT通过分层联合注意力查询上下文,在闭环中执行短动作块。引入视界自适应偏移训练与观测引导视频上下文路由(OVCR),使动作专家无需重新运行视频DiT即可利用长程世界上下文并保持对实时状态的响应。在RoboTwin基准上平均成功率达92.80%,4项真实世界任务平均成功率78.3%,闭环控制频率24.17 Hz,相比Fast-WAM加速4.59倍,无需任何机器人数据预训练。
SkeMex 是一种部署后自进化框架,通过技能记忆提升医学智能体的临床交互推理能力,无需更新模型权重。它将历史交互轨迹蒸馏为结构化技能(可复用流程知识),组成跨通用、任务特定及行动级的多分支仓库。利用环境反馈估计上下文效用,指导价值感知检索与仓库治理,形成“读取—写入—评估—治理”闭环生命周期。实验表明,在多种临床任务中,SkeMex 在离线和在线设置下均优于代表记忆型智能体,且能跨模型骨干泛化并实现可转移技能记忆。
AI评估结果规模庞大但报告不一致,导致读者难以跨来源比较、识别遗漏或追溯结论。Evaluation Cards通过整合基准元数据、评估运行数据和模型元数据,形成统一记录。方法包括:(1)从52篇论文和10次利益相关者访谈中推导报告模式;(2)实现四个可解释信号(可复现性、文档完整性、来源与风险、分数可比性),并针对研究与非研究受众提供不同读者模式;(3)部署监控工具,覆盖5816个模型、635个基准和101843个结果,揭示当前报告实践中的系统性缺口。
FlashMemory-DeepSeek-V4(FM-DS-V4)提出Lookahead Sparse Attention(LSA)推理范式,基于DeepSeek-V4架构构建神经记忆索引器,主动预测未来上下文需求,仅保留查询关键KV块。采用解耦训练策略,索引器作为独立双编码器训练,无需加载主干模型。在LongBench-v2、LongMemEval、RULER等长上下文基准上,平均物理KV缓存压缩至全上下文基线的13.5%,下游精度平均提升0.6%;在500K极端长度下,物理KV开销减少超过90%,且不损害主干模型的核心推理能力。
OmniGameArena是一个基于十二个Unreal Engine 5新构建游戏的实时基准,涵盖单人(7个)、PvP(3个)和合作(2个)模式,提供统一动作接口。除冷启动排行榜分数外,还引入Improvement Dynamics Curve (IDC),一种智能体反射评估机制:通过工具调用反射大语言模型自动优化技能提示词,追踪多轮反射中的分数变化以及习得技能在任务变体上的泛化表现。论文报告了12个VLM智能体在冷启动排行榜上的表现,以及4个顶级智能体在IDC下的指标。
微软已封锁其在GitHub上的至少70个开源项目,原因是黑客在代码中植入窃取密码的恶意程序。受影响项目涉及Azure、Claude Code、Gemini命令行界面和VS Code等AI编程工具。安全机构Cloudsmith和开源社区OpenSourceMalware首先发现,用户运行篡改程序时会泄露密码及账号凭证。微软已下架相关仓库,部分恢复访问,并通知了少数下载过恶意内容的用户。这是近几周内微软开源项目第二次遭入侵,5月中旬Durable Task项目也曾被攻击。
SpaceX 称轨道 AI 数据中心并非工程难题,现有星链卫星已具备大部分技术。AI 卫星将沿用第三代星链的太阳能电池阵列与热管理系统,结构更简单,无需大型相控阵天线。马斯克展示的 AI1 卫星渲染图显示配备翼展 70 米光伏面板,支持平均 120 千瓦、峰值 150 千瓦计算载荷,相当于单台英伟达 GB300 AI 服务器机架。SpaceX 计划组建约 100 万颗 AI 卫星网络,位于得克萨斯州巴斯特罗普的工厂预计明年年底前实现规模化量产,星舰可重复使用设计将支撑大批量运输。
关联讨论 1 条X:Rohan Paul (@rohanpaul_ai)魅族今年 1 月公布的 22 Next“AI 小方块”因内存涨价被无限期推迟,但工程机现已现身网络。该机实际定名“MEIZU AI 小方块”,搭载紫光展锐 T8200 芯片,配备 4 英寸聚碳酸酯亮面外壳,运行 Flyme AIOS。官方曾规划数十个场景、超 100 个表情界面的 AI 智能体交互体验,可放入吉利系汽车作为“驾乘机器人”,但最终未能上市。
印度金融科技公司 Paytm 计划在未来九个月内招聘约 4000 人,使其员工总数增加 10%。此举旨在扩大商户网络并推动人工智能驱动的产品,作为公司 AI 转型的一部分,同时部分岗位将被削减。
Echo-Memory固定视频扩散骨干、优化器、相机动作表示、采样器和评估流水线,比较原始上下文、压缩记忆、空间摘要(不同读取路径)和状态空间循环四种记忆设计。三分支评估(回放质量、域内循环重访、开放域返回)显示排序常不一致,回放保真度不足以代理世界记忆。发现:原始上下文提升开放域返回远超回放指标;紧凑无法替代容量,激进空间与混合压缩丢失关键证据;块状态空间循环在开放域返回中最强,隐式记忆结构与使用同等重要。
长上下文语言模型推理受KV缓存内存瓶颈制约。现有压缩方法或大幅降低质量,或耗时耗算力。本文通过架构搜索和从头预训练,在350B tokens上持续预训练了0.6B编码器、4B解码器的模型家族,支持1:4、1:8、1:16压缩比,命名为Latent Context Language Models (LCLMs)。该家族在通用任务性能、压缩速度和峰值内存上提升了帕累托前沿,并能作为长时程智能体的高效骨干,快速扫描压缩后的长上下文并按需展开相关片段。
小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro-UltraSpeed 模式,使 1T 参数旗舰模型输出速度首次突破 1000 tokens/s。模型侧采用 FP4 混合量化(仅量化 MoE Expert)与 DFlash 块级 masked 并行推测解码(coding 场景平均接受长度 6.30 tokens);系统侧 TileRT 引入常驻内核引擎与异构流水线协作。API 限时开放(2026 年 6 月 9 日至 23 日),定价为 MiMo-V2.5-Pro 的 3 倍,速度提升约 10 倍。FP4 权重与 DFlash 模型 checkpoint 已开源至 HuggingFace。
关联讨论 3 条Hacker News 热门(buzzing.cc 中文翻译)X:小米 MiMo (@XiaomiMiMo)IT之家(RSS)Kimi 通过「Agent 集群」同时调度 300 个子 Agent,从战术、球员、伤病等维度并行分析 104 场世界杯赛事,并公开预测与复盘。模型综合采用 Elo/FIFA 强度模型、Poisson 与 Dixon-Coles 进球分布模型、xG/xT 指标体系、Monte Carlo 模拟等。分析发现德国队夺冠概率被市场低估:基准约 11.0%,校准后约 11.3%,而部分市场隐含概率仅约 7.4%,存在约 +3.6 个百分点的正向偏离。同时推出总奖池 1 万亿 Token 的竞猜活动,并发布 Kimi Work——面向知识工作者的通用型本地 Agent,集成了建站、PPT 等专业 Skills 及 Kimi WebBridge。
Cadence(楷登)在 COMPUTEX 2026 上宣布,与 NVIDIA 合作推出的 ChipStack AI Super Agent 自主水平达到 Level-5,成为业界首款全自主芯片设计 AI 虚拟工程师。该智能体基于 Cadence AI 驱动 EDA 产品组合与 NVIDIA Nemotron 模型构建,并由 NVIDIA OpenShell 沙箱保障安全,可独立执行规格理解、RTL 生成、验证规划、形式分析、仿真、调试和设计收敛等任务,无需逐步提示,能评估中间结果并自主决策下一步。Cadence 高级副总裁 Paul Cunningham 称,该工具让资深工程师以更高速度和信心推进更具挑战性的设计。
据马里科帕县文件,Waymo以2.2亿美元收购亚利桑那州威特曼市一处5500英亩汽车试验场,产权于6月5日过户。该场地原属苹果关联公司,苹果2021年以1.25亿美元购入,曾用于泰坦计划原型车测试,该造车项目于2024年初终止。场地包含115英亩城市模拟道路、35英亩动态测试区、4英里环道及高速模拟高速。Waymo将在此开展全乘客测试、车辆运动控制测试、运营人员培训及新型测试项目。目前Waymo车队近4000台,已推出极氪自动驾驶厢式车并投入载客,计划每年量产数万台自动驾驶出租车。
特斯拉子公司 Tesla Robotaxi, LLC 向内华达州提交自动驾驶车辆运营网络公司许可申请(案卷编号:26-05015),获批后计划在业务启动后 12 个月内于克拉克县投放最多 5000 辆 Robotaxi,覆盖拉斯维加斯、亨德森机场等人流密集区域。继 2025 年 9 月获测试许可并建成运维中心后,此举是商业化运营关键一步。2026 年第一季度股东报告显示,达拉斯、休斯顿已上线,其余城市在筹备;当季付费运营里程环比近乎翻倍,得克萨斯州运营未出现事故。新款 Cybercab 已于今年 4 月在得州超级工厂投产,将逐步取代 Model Y 成为主力运营车辆。
SpatialWorld 是为评估多模态智能体在复杂真实任务中的交互式空间理解而设计的统一基准。它整合 8 个异构模拟后端,包含 760 个人工标注任务,覆盖家庭日常、旅行、社交协作等场景。智能体需在仅视觉部分可观测条件下主动收集第一人称证据,并通过统一文本动作接口输出决策。对 15 个先进多模态智能体的评测显示,最强闭源模型 GPT-5 平均任务成功率仅 17.4%,最强开源模型 Qwen-3.5 达 14.1%。分析表明任务成功与执行效率存在脱节,不同领域性能差异显著,主动探索与长程规划仍是瓶颈。
Mirage提出一种潜在空间记忆框架,用于视频世界模型的3D一致性生成。它通过深度引导反投影将潜在token提升至3D,形成持久缓存,并利用直接潜在空间扭曲合成新视图,避免了像素空间重建的信息损失和重复编码渲染的计算开销。相比显式3D基线,Mirage实现端到端视频生成加速10.57倍、内存占用减少55倍。在WorldScore上达到当前最优性能,在RealEstate10K上展现强重建质量。
cognition.ai 的 FrontierCode 项目在 Hacker News 上获得 101 个 points。目前公开信息仅包含项目名称和来源,具体功能、技术细节或性能数据尚未披露。
据《科创板日报》报道,曹操出行计划组建独立AI事业部,全面推动AI战略落地,从移动互联网公司转型为AI原生公司。近期已在招聘平台上线“首席AI官”岗位,负责制定AI战略与技术路线、构建AI核心能力体系、推动业务全链路AI赋能。公开资料显示,该公司2025年总收入202亿元(同比增37.7%),毛利18.9亿元(增59.3%),毛利率9.4%;覆盖195城,月活用户4130万(增43.9%),月活司机63.1万(增35.4%)。Robotaxi已部署超100辆,2026年完全定制Robotaxi亮相,2027年开始量产。
联想集团为全体中国区员工推出世界杯“补觉卡”,可在6月12日至7月20日期间任选一个工作日,晚到或提前下班2小时(仅一次)。作为2026 FIFA世界杯合作伙伴,联想与FIFA合作利用生成式AI和3D资产制作球员数字化身,用于越位回放等裁判技术;裁判随身摄像头将向超60亿全球观众提供比赛视角;此外还推出AI知识助手Football AI Pro,为参赛球队提供数据分析。
OpenAI 近日秘密提交 IPO 申请。其 CEO 山姆·奥特曼旗下的 Tools for Humanity 公司正裁员,该公司因虹膜扫描项目 World 及加密货币 Worldcoin 知名,投后估值 25 亿美元,获 Andreessen Horowitz 等投资。因营收困境,公司缩减规模。海外监管方面,肯尼亚以隐私和金融风险为由叫停运营,韩国因违反隐私法规罚款 83 万美元。
Fujikura 高管表示,得益于 AI 数据中心所需光纤光缆需求持续强劲及提价计划,公司有望超越业绩预期。
xAI 从 SpaceX 的 Starlink 卫星互联网服务调来一名高管,负责 Grok 聊天机器人的训练团队,取代了大学生工程师 Diego Pasini。该任命来自内部通知。
2026年全国高考统考科目于6月8日结束,部分省份选考科目仍在进行。海南、山东、山西、重庆、广东、湖北、江西等地已公布查分时间,多数集中在6月25日。教育部将举办“2026年全国普通高等学校招生云咨询周”,并对“阳光高考”平台及“阳光志愿”信息服务系统进行优化升级。此外,多地考场已投入使用AI智能巡查系统,通过视觉分析算法捕捉异常行为并自动标记作弊迹象,供审核员进一步确认。
工信部、国资委6月8日联合发布通知,目标到2026年底,人形机器人等重点产品在代表性场景完成应用验证并开启常态部署,形成百个以上高价值场景,万台级规模落地。要求各省级地区选取不少于20个场景单元(覆盖两类领域),央企不少于10个。围绕打造实景实训空间、组建创新应用联合体、攻关作业技能、加强验证部署、强化要素保障、凝练经验等六大任务展开,鼓励“人形机器人即服务”等商业创新。
华为余承东官宣尊界 V800,定位超高端 MPV,轴距 3430mm,搭载 1.5T 增程器及前后双电机。苹果 WWDC26 发布 iOS 27 等新系统,库克完成 CEO 任内“最后一舞”,Siri AI 等智能功能在中国大陆暂不提供。月之暗面正寻求 20 亿美元新一轮融资,目标估值 300 亿美元,半年估值暴涨七倍。OpenRouter 数据显示中国 AI 大模型周调用量连续六周超越美国,6 月 9 日当周环比增长 27.49% 达 14.19 万亿 Token,DeepSeek-V4-Flash 蝉联榜首,MiniMax 新模型 M3 首周冲入前三。
苹果在 2026 年 WWDC 公布 CarPlay 视频播放功能,仅限适配新款车辆,驻车时通过 AirPlay 投屏观看。iOS 27 允许开发者打造带视频浏览的 CarPlay 应用。AI 版 Siri 将登陆 CarPlay,需 iPhone 15 Pro 及后续机型。四项新优化包括:正在播放界面支持音频进度拖动、GPS 定位与导航准度提升、应用内新增音频迷你播放窗口、无线 CarPlay 连接稳定性改进。所有功能需升级至 iOS 27,开发者测试版今日上线,公开测试版 7 月推送,正式版 9 月面向所有适配机型。
苹果在 WWDC26 主题演讲上公布 iOS 27,带来 Siri AI 和新一代 Apple 智能,系统性能大幅优化且可靠性改进,支持 iPhone 11。中国用户专属更新包括节假日调休闹钟和中文输入法优化。但 Siri AI 与新一代 Apple 智能暂不在中国大陆提供。iOS 27 开发者预览版 Beta 1 今日面向全球推出,公测版 7 月上线,正式版秋季发布。
苹果在 WWDC 2026 推出全新 Siri AI,采用定制的 Gemini 衍生模型运行于 Private Cloud Compute,并利用视觉 LLM 从屏幕提取信息,绕开了已有应用单独集成 Apple Intelligence 的需求。同时发布 Core AI 库,集成 Meta 的 PyTorch 生态,允许开发者在苹果硬件上将 PyTorch 模型转换为 Core AI 程序运行。iOS 27 Developer Beta 已上线,但用户需通过等待列表才能使用新 Siri AI。