AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
6月10日周三
6月9日周二
6月8日周一
6月7日周日
6月6日周六
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月10日
00:05
Logan Kilpatrick@OfficialLoganK
79
Introducing Gemini 3.5 Flash Live Translate,我们的实时语音到语音翻译模型,支持超过 70 种语言(输入和输出),并且非常自然。 现在已在 Gemini API、AI Studio 和 Google 翻译中可用,并即将登陆 Google Meet!
Google多模态模型发布语音
关联讨论 6 条Ars Technica:AI(RSS)X:Jeff Dean (@JeffDean)X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)The Decoder:AI News(RSS)X:Berry Xia (@berryxia)
6月9日
23:47
Google AI Developers@googleaidevs
76
Google 发布 Gemini 3.5 Live Translate 实时语音翻译模型

Google AI 推出音频模型 Gemini 3.5 Live Translate,为开发者提供低延迟实时语音翻译,支持 70+ 种语言。模型具备多语言输入(同会话无需切换)、自动语言检测、原生音频处理(保留说话者语调、语速和音高)以及噪声鲁棒性(过滤环境噪音),可直接处理流式语音。

Google多模态模型发布语音
关联讨论 6 条Ars Technica:AI(RSS)X:Jeff Dean (@JeffDean)X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)The Decoder:AI News(RSS)X:Berry Xia (@berryxia)
23:37
Google AI@GoogleAI
85
Google AI 发布 Gemini 3.5 Live Translate 实时语音翻译模型

Google AI 推出 Gemini 3.5 Live Translate,一款面向实时语音到语音翻译的音频模型。该模型支持 70 多种语言,可在用户说话的同时开始翻译并流式输出译文,避免尴尬停顿或断续。模型通过毫秒级决策平衡速度与翻译质量,使对话流畅自然。它可边接收输入边输出翻译语音,延迟仅比说话者慢几秒,并能在长对话中维持语速、音高和语调。目前已在 iOS 和 Android 版 Google Translate 应用中上线。

Google多模态模型发布语音
关联讨论 6 条Ars Technica:AI(RSS)X:Jeff Dean (@JeffDean)X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)The Decoder:AI News(RSS)X:Berry Xia (@berryxia)
23:35
Google DeepMind@GoogleDeepMind
精选69
说 hello, hola, 你好--欢迎 Gemini 3.5 Live Translate:我们最新的音频模型,专为快速跨语言交流而构建。🌐
Google模型发布语音
关联讨论 6 条Ars Technica:AI(RSS)X:Jeff Dean (@JeffDean)X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)The Decoder:AI News(RSS)X:Berry Xia (@berryxia)
推荐理由:Google 这个实时翻译模型把语音+翻译+大模型拧成了一股绳,虽然具体怎么用还不清楚,但做跨境、做语音助手的同学可以把它当个方向标。
23:05
Chubby♨️@kimmonismus
精选77
确认,Claude Mythos 将在接下来几小时内揭晓。 【引用 @steph_palazzolo】: 独家:一个名为 Claude Fable 的精简版 Mythos 今天推出。它价格昂贵--是 Opus 的两倍--但或许不像人们从最初 Mythos 定价(Opus 的 5 倍)所想的那样昂贵。 更多内容及 Apple WWDC 见 AI Agenda: https://www.theinformation.com/newsletters/ai-agenda/anthropics-mythos-coming-today-apple-pursues-modest-goals-siri-revamp

Stephanie Palazzolo: Scoop: A neutered version of Mythos called Claude Fable is coming today. It's expensive-2x the price of Opus-but perhaps...

Anthropic模型发布

推荐理由:Mythos 终于来了,但首发的是阉割版 Claude Fable,价格是 Opus 的两倍。虽然不算便宜,但比起原版 Mythos 定价已经温柔很多,应该能让很多观望的人先尝尝鲜。
22:59
Luma@LumaLabsAI
74
方向进入,电影出来。 Ray3.2 来了 → http://lumalabs.ai/ray3-2
模型发布视频
关联讨论 1 条X:Luma AI (@LumaLabsAI)
22:34
Google DeepMind:Blog(RSS)
精选81
Google DeepMind 发布 Gemma 4 12B:统一的无编码器多模态模型

Gemma 4 12B 是 Google DeepMind 最新推出的中等规模多模态模型,采用无编码器统一架构,原生支持音频输入。其基准测试性能接近 26B MoE 模型,但内存占用不到一半,仅需 16GB 显存或统一内存即可在消费级笔记本上本地运行。模型内置多 token 预测(MTP)drafter 以降低延迟,基于 Apache 2.0 开源许可发布,已累计超过 1.5 亿次下载。

多模态开源生态模型发布端侧
关联讨论 2 条X:Demis Hassabis (@demishassabis)X:Sundar Pichai (@sundarpichai)
推荐理由:把多模态模型的视觉和音频编码器全砍了,仅靠12B就在笔记本上跑出接近26B的效果,而且Apache 2.0开源,做端侧Agent的现在有了一个高性价比的本地推理选项。
20:05
Chubby♨️@kimmonismus
70
Apple 发布 AFM 基础模型系列,200 亿参数模型完全运行在 iPhone 17 Pro 设备端

Apple 发布全新基础模型家族,亮点是 AFM 3 Core Advanced:200 亿参数,完全运行在 iPhone 17 Pro 设备端。通过将完整模型存于闪存,每次仅加载 1-4B 专家参数到活跃内存,巧妙绕过 DRAM 瓶颈,实现设备端更生动的语音和更精准的听写。共 5 个模型,与 Google 合作打造,覆盖从设备端到 Private Cloud Compute 的云端模型,最高性能云端模型运行在 NVIDIA GPU 上。

模型发布端侧
17:41
小互@xiaohu
63
小道消息:Anthropic 将于今晚发布其最强 AI 模型 Mythos…
Anthropic模型发布
17:34
Chubby♨️@kimmonismus
58
据多方泄露,Claude Mythos 将于今日(6月9日)发布。 有趣的问题是,他们是否也会更新 Sonnet 或 Haiku。 不是说 Mythos 对我而言不够用,我只是好奇为什么目前小模型受到的关注这么少。 总之,它可能被命名为 Claude-5-fable。

M1: New Claude model checkpoints (Possibly Mythos GA) - Claude Fable 5 - Claude Fruitcake EAP The new checkpoints were detec...

Anthropic模型发布
16:34
Chubby♨️@kimmonismus
58
据消息,Anthropic 计划明天发布 Mythos 公开版。该版本将配备实质性护栏,权限不如 Project Glasswing 合作伙伴可访问的版本宽松,但在长周期、多轮任务上表现将大幅提升。准备好,朋友们,就要来了!

Alex Heath: Sources: Anthropic is planning to release a public version of Mythos tomorrow - Will have substantial guardrails and not...

智能体Anthropic模型发布
16:18
歸藏(guizang.ai)@op7418
63
MiMo推出V2.5 Pro UltraSpeed超高速模型,每秒输出超1000 Token

MiMo推出V2.5 Pro UltraSpeed超高速模型版本,每秒输出超1000 Token,号称全球首个达此速度的万亿参数模型。实测显示:复杂3D小游戏TPS 804 Token/s(峰值810),首次响应4.71秒;官网3D动画峰值1426 Token/s,首次响应0.83秒,32秒输出25624 Token(1000行代码);另一复杂官网3D效果TPS 1136,首次响应4.5秒。相比此前超高速推理方案常见能力下降,MiMo未出现此类迹象。该模型主要面向效率要求极高的ToB客户,在Agent和Sub-Agent并发场景下效率提升明显。

智能体推理模型发布
16:18
歸藏(guizang.ai)@op7418
54
据报道,Anthropic 将于明天发布新 AI 模型"Mythos"。主推文猜测这可能伴随着强制 KYC 措施。

Polymarket Money: JUST IN: Anthropic will reportedly release its new AI model "Mythos" tomorrow.

Anthropic模型发布
15:26
IT之家(RSS)
52
Anthropic 明日发布公开版 Mythos 网络安全模型(Fable 5)

Anthropic 计划以“Fable 5”之名推出公开版 Mythos 网络安全模型。公开版将配备严格安全防护措施,网络操作权限低于“玻璃之翼”(Project Glasswing)合作伙伴专供版本。该版本在长周期、多步骤任务方面带来显著性能提升,能更高效执行复杂工作。Mythos 于今年 4 月发布,最初仅对经审核的机构开放。

Anthropic安全/对齐模型发布
15:26
IT之家(RSS)
78
小米MiMo发布V2.5-Pro-UltraSpeed模式,突破万亿参数模型千tokens/s输出速度

小米与TileRT联合推出MiMo-V2.5-Pro的UltraSpeed模式,在1万亿参数模型上首次达到超1000 tokens/s输出速度。UltraSpeed API同步上线,定价为原版的3倍,输出速度提升约10倍。由于资源有限,采取申请制限时开放,通过用户可在2026年6月9日至6月23日23:59接入API体验,并获限时免费Chat。试用规则:每账号每日最多成功进入队列10次,单次会话上限30分钟,空闲超5分钟自动释放资源。

推理模型发布部署/工程
15:20
🚨 AI News | TestingCatalog@testingcatalog
66
ANTHROPIC 🔥: Claude Mythos 计划作为 Claude Fable 5 发布,根据 Dev Mode 检测到的检查点、Hacker News 报道和消息源。 Anthropic 还将于明天在日本举办第三届开发者活动。 快了?👀

M1: New Claude model checkpoints (Possibly Mythos GA) - Claude Fable 5 - Claude Fruitcake EAP The new checkpoints were detec...

Anthropic模型发布
11:40
公众号:小米 MiMo
精选80
小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s

小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro-UltraSpeed 模式,使 1T 参数旗舰模型输出速度首次突破 1000 tokens/s。模型侧采用 FP4 混合量化(仅量化 MoE Expert)与 DFlash 块级 masked 并行推测解码(coding 场景平均接受长度 6.30 tokens);系统侧 TileRT 引入常驻内核引擎与异构流水线协作。API 限时开放(2026 年 6 月 9 日至 23 日),定价为 MiMo-V2.5-Pro 的 3 倍,速度提升约 10 倍。FP4 权重与 DFlash 模型 checkpoint 已开源至 HuggingFace。

开源生态推理模型发布部署/工程

推荐理由:万亿模型首次在通用GPU上突破1000 tokens/s,不是专用硬件的胜利而是模型与系统Codesign的胜利,做实时AI应用的都应该盯紧这一套方案。
07:21
IT之家(RSS)
67
苹果回应"套壳 Gemini"猜测:iOS 27 版 Siri AI AFM 自研打造

苹果在 2026 年 WWDC 主题演讲后回应,Apple Foundation Models(AFM)并非 Gemini 套壳,而是完全自主控制。AFM 体系包含 5 个模型:端侧 AFM Core(基础 AI)、AFM Core Advanced(原生多模态、稀疏架构)、云端 AFM Cloud(高负载)、AFM Cloud Image(图像生成与编辑)、AFM Cloud Pro(智能体工具与重负载任务)。每个模型针对 Apple Silicon 定制,训练使用专有数据并结合 Gemini 蒸馏优化。用户不接触谷歌代码或 Gemini 智能体。AFM Cloud Pro 采用 Google 云服务器与 NVIDIA GPU 资源,但保持 Private Cloud Compute 认证。

多模态模型发布端侧
05:15
Apple Machine Learning Research(RSS)
精选79
苹果发布第三代 Apple Foundation Models(AFM)

苹果推出第三代 Apple Foundation Models(AFM)基础模型家族,与 Google 合作定制,包含五个模型,覆盖从设备端到基于 Private Cloud Compute 的服务器端模型。这些模型旨在驱动 Apple Intelligence 功能,包括全新 Siri 和智能工具,以用户为中心深度融合操作系统,隐私为核心设计原则。

Google多模态模型发布端侧
关联讨论 1 条Hacker News 热门(buzzing.cc 中文翻译)
推荐理由:Apple与Google罕见联手推出的第三代基础模型,直接为下一代Siri和系统级AI功能铺路,标志着消费级AI的深度整合,产品经理和iOS开发者必须关注。
04:16
Artificial Analysis@ArtificialAnlys
68
xAI发布grok-imagine-video-1.5-preview,在AI视频生成评测中位列第二

xAI推出视频生成模型grok-imagine-video-1.5-preview,目前在Artificial Analysis Video Arena的Image to Video (With Audio)排行榜中排名第二,仅次于字节跳动Seedance 2.0。该模型支持图像转视频并原生生成音频,最长可生成15秒视频。在无音频排行榜中位列第三,紧随Seedance 2.0和自家的grok-imagine-video。模型定价为每分钟视频$8.40,现已通过xAI API提供,并将逐步在Grok app和X上线。

xAI模型发布视频评测/基准
02:11
The Decoder:AI News(RSS)
61
微软研究院的Lens:详细描述比原始规模更能训练高效图像生成器

微软研究院推出Lens,一个仅3.8B参数的文本到图像模型。依靠由GPT-4.1生成的8亿条详细图像标题,而非模糊的网页替代文本,Lens在基准测试上匹配了规模更大的竞品,训练成本仅一小部分。代码和权重以开源许可证公开可用。

Microsoft图像生成开源生态数据/训练
01:01
Hacker News 热门(buzzing.cc 中文翻译)
77
小米 MiMo-v2.5-Pro-UltraSpeed 发布:1T 参数模型,每秒 1000 token

小米在 6 月 8 日发布 MiMo-v2.5-Pro-UltraSpeed 模型,拥有 1T 参数规模,推理速度达到每秒 1000 个 token。该模型来自小米旗下的 mimo.xiaomi.com 项目。

推理模型发布部署/工程
6月8日
22:46
OpenBMB@OpenBMB
精选75
VoxCPM2 技术报告发布

面壁智能 OpenBMB 发布 VoxCPM2 技术报告。该模型为最新语音生成模型,拥有 2B 参数,基于超 200 万小时多语言语音数据训练,支持 30 种语言和 9 种中文方言。具备自然语言语音设计、可控及高保真延续性语音克隆能力。技术报告涵盖架构设计、统一序列公式、AudioVAE 高保真语音重建、大规模训练评估,以及零样本和指令跟随 TTS 基准结果。采用 16kHz 语义编码 + 48kHz 波形重建,在公开 TTS 基准上达到 SOTA 或极具竞争力。模型权重、微调代码和推理工具以 Apache 2.0 开源。

多模态开源/仓库模型发布语音

推荐理由:面壁把语音生成压进2B参数,支持30种语言加方言克隆,还附完整技术报告和Apache 2.0开源,做语音产品的可以直接拉代码跑起来了。
22:40
Xiaomi MiMo@XiaomiMiMo
精选82
小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型

小米 MiMo 联合 TileRT_AI 发布 MiMo-V2.5-Pro-UltraSpeed,首次在 1 万亿参数 MoE 模型上实现超过 1,000 tokens/s 输出速度,仅用单台标准 8-GPGPU 节点(非 Cerebras 或 Groq 方案)。提供限时免费聊天体验,UltraSpeed API 价格为 3 倍,输出体验提升约 10 倍。申请时间为 6 月 8 日至 23 日(PDT),企业可邮件联系 business-mimo@xiaomi.com。

推理模型发布部署/工程

推荐理由:小米用单节点8卡标准GPU在1T MoE模型上跑出1000+ tokens/s,没有走晶圆级或专用芯片的路子,直接把推理成本门槛拉低了一大截,做实时对话和Agent的可以申请免费聊天先上手感受一下。
18:10
Alibaba Cloud@alibaba_cloud
精选77
🔥 Qwen3.7-Plus 发布特惠:现在享受八折! ✅ 多模态交互式智能体 ✅ 编程与生产力助手 ✅ 视觉智能体 ✅ 跨任务泛化 不要错过升级机会。👇 https://int.alibabacloud.com/m/1000414123/ #Qwen #AI #Multimodal #AlibabaCloud #AgenticAI
智能体多模态模型发布编码
关联讨论 1 条公众号:通义实验室(千问)
推荐理由:Qwen3.7-Plus 把多模态交互和视觉代理整合得挺顺,对做 AI 工程化落地的团队来说是个务实选项,新发布折扣让试错成本更低,值得用起来看看。
17:08
MarkTechPost(RSS)
60
Microsoft AI 推出 MAI-Transcribe-1.5 语音转文本模型

Microsoft AI 发布 MAI-Transcribe-1.5,其自研语音转文本模型的第二代。该模型支持 43 种语言,新增关键词(实体)偏置功能,可针对领域特定术语优化。在 Artificial Analysis 排行榜上词错误率(WER)为 2.4%,在 FLEURS 基准上达到最佳准确率。转录一小时音频耗时不到 15 秒,长音频转录速度提升达 5 倍。MAI-Transcribe-1.5 已通过 Azure AI Foundry 提供。

Microsoft模型发布语音
14:20
IT之家(RSS)
精选73
全球首个:高德发布3D原生城市世界模型ABot-Earth0.5

阿里巴巴旗下高德发布全球首个3D原生城市世界模型ABot-Earth0.5,已建成覆盖190多个国家和地区的3D地图。用户输入卫星图或文字描述,10分钟即可在消费级GPU上生成公里级3D城市,输出可编辑3DGS格式,可直接导入Unity等引擎。制图成本为传统百分之一,效率提升约千倍,可为具身智能、低空经济、应急救援等提供支撑。目前已开放内测,可前往abot-earth.amap.com提交申请。

具身智能多模态模型发布

推荐理由:第一个把分钟级 3D 城市重建拉进消费级 GPU 的世界模型,成本打到了传统方案的百分之一,对具身智能和低空经济是底层能力补全,值得内测试试。
08:59
Berryxia.AI@berryxia
54
Mac-1模型:6.6B本地运行,487个Mac原生工具

CJ Zafir团队发布Mac-1模型(6.6B参数),可在任何Mac本地运行,仅需7GB内存(12GB更佳)。它支持487个MacOS原生工具,能执行多工具链式调用,推理开启,输出速度约65 tok/s。应用层基于Mac原生UI/UX设计。作者认为这种本地小模型+原生工具的组合直接挑战云端SaaS agent,甚至可能抢了苹果Siri的活儿。

CJ Zafir: Here's a teaser of our Mac-1 model. > 6.6B model > runs locally (on any Mac) > requires 7GB RAM (12GB ideal) > can use 4...

智能体MCP/工具模型发布端侧
6月7日
14:34
MarkTechPost(RSS)
精选73
Harness-1:基于强化学习训练的有状态搜索20B检索子智能体

UIUC与Chroma联合推出Harness-1,一个20B参数的检索子智能体。它通过强化学习在一个有状态搜索框架中训练,该框架维护候选池、重要性标注集、证据图和验证记录,由策略决定搜索、筛选、验证及停止的时机。Harness-1在8个基准测试上达到0.730平均curated recall,比下一个最佳开源子智能体高出11.4个百分点,仅落后于Opus-4.6。模型权重和框架代码均已公开。

检索增强搜索模型发布

推荐理由:UIUC和Chroma放出的这个20B检索子代理,用RL训练出了0.73的平均召回,把开源竞品甩开11.4分,只比Opus-4.6低一点。权重、Harness全开源,搞RAG的可以真刀真枪试试了。
6月6日
21:02
Chubby♨️@kimmonismus
55
天哪,发布就在眼前了。它将被命名为"Claude Mythos 5",是比 Opus 更高一级的模型。 我感觉下周会非常重磅。

Mirochill: 👀 Mythos est apparu quelques secondes chez Anthropic ! Son nom sera Claude Mythos 5 : La meilleure classe de modèle ne ...

Anthropic模型发布
20:38
🚨 AI News | TestingCatalog@testingcatalog
69
BREAKING 🔥: 开发者模式下发现一个新的 Claude Mythos 5 模型 slug。 Claude Mythos 计划作为自己的模型类别发布,与 Haiku、Sonnet 和 Opus 模型系列并列。 很快?👀
Anthropic模型发布
18:59
The Decoder:AI News(RSS)
68
Audio Interaction:开源语音模型持续监听,每0.4秒决定是否说话或保持沉默

Audio Interaction是一个开源语音模型,持续监听环境,每0.4秒判断是否应该说话或保持沉默。与GPT-4o或Qwen3.5-Omni不同,它无需等待录音结束,可在单个流中同时进行翻译、转录、对话并识别咳嗽等日常噪音。代码和模型权重已在GitHub上以Apache 2.0开源许可发布,训练数据稍后公布。

开源/仓库模型发布语音
15:58
MarkTechPost(RSS)
69
NVIDIA 发布 Nemotron 3.5 ASR:600M 参数缓存感知流式模型,实时转录 40 种语言-地区

NVIDIA 发布 Nemotron 3.5 ASR,一个 600M 参数的缓存感知流式模型,支持从单个检查点实时转录 40 种语言-地区。

模型发布语音
14:58
The Decoder:AI News(RSS)
66
Qwen3.7-Plus:阿里巴巴将多模态AI打造成完全自主智能体

阿里巴巴Qwen团队发布Qwen3.7-Plus,一个将视觉感知、GUI操作和编码能力整合到单一智能体循环中的多模态智能体模型。在演示中,基于该模型的智能体自主开发了一款词汇学习应用,生成了超过10,000行代码,共执行了1,000次智能体调用,耗时11小时。该模型在Qwen自主基准测试的屏幕理解任务上领先,但整体性能表现参差不齐。Qwen3.7-Plus为闭源模型,价格远低于西方前沿模型。

智能体多模态模型发布编码
11:16
IT之家(RSS)
55
全球海洋现象智能预报大模型"琅琊"2.0发布

6月6日,中国科学院海洋研究所发布“琅琊”2.0,在1.0基础上从海洋状态变量预报拓展至台风、降水、风暴潮、海冰等六类复杂海洋现象,开发了6个垂直模型。台风模型融合大气海洋环境场、卫星云图和历史演变信息,提升24小时路径与强度预报;降水模型基于卫星数据学习时空演变预测未来变化;海冰模型面向北极航道,实现3公里分辨率、月尺度以上快速预测,支撑航道安全研判。

数据/训练模型发布
07:59
Rohan Paul@rohanpaul_ai
68
Google 发布 Gemma 4 QAT 检查点,最小模型从 11.4GB 压缩至 1.1GB

Google 发布 Gemma 4 的 QAT(量化感知训练)检查点,将最小模型从 11.4GB 缩小至 1.1GB(纯文本版 0.84GB),便于手机和笔记本运行。常规 PTQ(训练后量化)因模型未学会应对舍入而损伤质量;QAT 在训练中模拟压缩,让模型在权重被挤压时学习,压缩版不易丢失推理能力。Google 还构建了移动端优化格式,包含静态激活、通道量化、定向 2-bit 量化及 KV 缓存优化,减少手机缩放计算并防止长对话过快消耗内存。

Google开源/仓库模型发布端侧
03:27
MarkTechPost(RSS)
50
Google DeepMind 发布 Gemma 4 QAT 检查点:Q4_0 和新的移动格式降低设备端内存

Google DeepMind 推出 Gemma 4 量化感知训练(QAT)检查点,包含 Q4_0 格式和一种新的移动端格式,旨在降低设备端内存占用。对比 BF16、Q4_0 QAT 和移动版 QAT 三种边缘端格式,官方公布了各格式的内存数据与设计权衡。

DeepMindGoogle多模态模型发布
03:21
Hacker News 热门(buzzing.cc 中文翻译)
70
Gemma 4 QAT 模型:优化压缩以提升移动设备和笔记本电脑的能效

Google 发布 Gemma 4 QAT 模型,该模型通过量化感知训练(QAT)技术优化压缩,旨在提升移动设备和笔记本电脑上的运行效率与能效。文章来源于 Google 官方博客,介绍了这一面向移动端和笔记本端的模型优化方案。

Google模型发布端侧部署/工程
关联讨论 5 条Google Developers Blog(RSS)The Decoder:AI News(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Jeff Dean (@JeffDean)X:Google AI for Developers (@googleaidevs)
02:30
Chubby♨️@kimmonismus
71
Gemma 4 QAT 模型发布:本地设备内存需求低至 1GB

Google DeepMind 发布 Gemma 4 QAT 量化感知训练模型,专为本地 / 设备端优化。通过量化感知训练减少内存占用,同时相比标准训练后量化保留更多质量。支持 Q4_0 格式及新的移动专用量化格式。Gemma 4 E2B 版本可运行于约 1GB 内存,纯文本版本甚至低于 1GB,使手机、笔记本、边缘设备和消费级 GPU 上的本地 AI 更实用。

DeepMindGoogle模型发布端侧
01:11
OpenRouter@OpenRouter
60
在OpenRouter上线:来自@Sourceful的Riverflow 2.5。 首个具有独立评分标准的图像模型,你可控制该标准以引导其思维和编辑,并具备可控的推理努力,可在速度与质量之间进行权衡。 免费至6月9日(周二)。Fast和Pro见下方🧵。
图像生成模型发布
关联讨论 1 条X:OpenRouter (@OpenRouter)
‹ 上一页
123456…27
下一页 ›