AIHOT

全部动态资讯 · 433 条

全部一手资讯 X 论文

6月9日周二

6月8日周一

6月7日周日

6月6日周六

6月5日周五

6月4日周四

6月3日周三

6月2日周二

6月9日

05:15

Apple Machine Learning Research（RSS）

精选79

苹果发布第三代 Apple Foundation Models（AFM）

苹果推出第三代 Apple Foundation Models（AFM）基础模型家族，与 Google 合作定制，包含五个模型，覆盖从设备端到基于 Private Cloud Compute 的服务器端模型。这些模型旨在驱动 Apple Intelligence 功能，包括全新 Siri 和智能工具，以用户为中心深度融合操作系统，隐私为核心设计原则。

Google多模态模型发布端侧

关联讨论 1 条

推荐理由：Apple与Google罕见联手推出的第三代基础模型，直接为下一代Siri和系统级AI功能铺路，标志着消费级AI的深度整合，产品经理和iOS开发者必须关注。

02:11

The Decoder：AI News（RSS）

微软研究院的Lens：详细描述比原始规模更能训练高效图像生成器

微软研究院推出Lens，一个仅3.8B参数的文本到图像模型。依靠由GPT-4.1生成的8亿条详细图像标题，而非模糊的网页替代文本，Lens在基准测试上匹配了规模更大的竞品，训练成本仅一小部分。代码和权重以开源许可证公开可用。

Microsoft图像生成开源生态数据/训练

01:01

Hacker News 热门（buzzing.cc 中文翻译）

小米 MiMo-v2.5-Pro-UltraSpeed 发布：1T 参数模型，每秒 1000 token

小米在 6 月 8 日发布 MiMo-v2.5-Pro-UltraSpeed 模型，拥有 1T 参数规模，推理速度达到每秒 1000 个 token。该模型来自小米旗下的 mimo.xiaomi.com 项目。

推理模型发布部署/工程

关联讨论 3 条

6月8日

17:08

MarkTechPost（RSS）

Microsoft AI 推出 MAI-Transcribe-1.5 语音转文本模型

Microsoft AI 发布 MAI-Transcribe-1.5，其自研语音转文本模型的第二代。该模型支持 43 种语言，新增关键词（实体）偏置功能，可针对领域特定术语优化。在 Artificial Analysis 排行榜上词错误率（WER）为 2.4%，在 FLEURS 基准上达到最佳准确率。转录一小时音频耗时不到 15 秒，长音频转录速度提升达 5 倍。MAI-Transcribe-1.5 已通过 Azure AI Foundry 提供。

Microsoft模型发布语音

14:20

IT之家（RSS）

精选73

全球首个：高德发布3D原生城市世界模型ABot-Earth0.5

阿里巴巴旗下高德发布全球首个3D原生城市世界模型ABot-Earth0.5，已建成覆盖190多个国家和地区的3D地图。用户输入卫星图或文字描述，10分钟即可在消费级GPU上生成公里级3D城市，输出可编辑3DGS格式，可直接导入Unity等引擎。制图成本为传统百分之一，效率提升约千倍，可为具身智能、低空经济、应急救援等提供支撑。目前已开放内测，可前往abot-earth.amap.com提交申请。

具身智能多模态模型发布

推荐理由：第一个把分钟级 3D 城市重建拉进消费级 GPU 的世界模型，成本打到了传统方案的百分之一，对具身智能和低空经济是底层能力补全，值得内测试试。

6月7日

14:34

MarkTechPost（RSS）

精选73

Harness-1：基于强化学习训练的有状态搜索20B检索子智能体

UIUC与Chroma联合推出Harness-1，一个20B参数的检索子智能体。它通过强化学习在一个有状态搜索框架中训练，该框架维护候选池、重要性标注集、证据图和验证记录，由策略决定搜索、筛选、验证及停止的时机。Harness-1在8个基准测试上达到0.730平均curated recall，比下一个最佳开源子智能体高出11.4个百分点，仅落后于Opus-4.6。模型权重和框架代码均已公开。

检索增强搜索模型发布

推荐理由：UIUC和Chroma放出的这个20B检索子代理，用RL训练出了0.73的平均召回，把开源竞品甩开11.4分，只比Opus-4.6低一点。权重、Harness全开源，搞RAG的可以真刀真枪试试了。

6月6日