AIHOT

全部动态

全部一手资讯 X 论文

6月11日周四

6月10日周三

6月11日

08:30

IT之家（RSS）

63

因安全顾虑，Anthropic 最强 AI 模型 Claude Fable 5 拒绝回答基础生物问题

Anthropic 昨日推出最强 AI 模型 Claude Fable 5（Mythos 级），其在生物学领域能力突出，但为防范生物武器风险，设置极为保守的安全限制，导致模型拒绝回答“细胞膜”“线粒体”等大量基础生物问题，仅“什么是癌症”等极少数问题获回复，被拒提问转由 Claude Opus 4.8 解答。化学、网络安全类问题接纳度较高。Anthropic 表示此防护策略为临时取舍，未来计划面向生物专业群体推出解除限制的 Mythos 级模型。

Anthropic安全/对齐模型发布

07:30

IT之家（RSS）

65

谷歌推出 DiffusionGemma 文本扩散模型：本地 AI 推理速度提升 4 倍

谷歌6月11日发布开源文本扩散模型DiffusionGemma，本地推理速度较自回归模型提升4倍。采用Apache 2.0许可证，可从Hugging Face下载权重。采样速度1479 tokens/秒，开销0.84秒。代码生成HumanEval达89.6%，数学AIME 2025达23.3%超越对比模型。在H100 GPU上每秒生成1000 token，DGX Station上可达2000 token。

Google开源生态推理模型发布

07:09

Berryxia.AI@berryxia

64

Google DiffusionGemma：4倍速文本生成开源模型

Google 发布实验性开源模型 DiffusionGemma（Apache 2.0），采用并行 diffusion 方式代替传统自回归“逐词预测”，可同时起草、纠错和精炼整块文本，生成速度达 4 倍提升（1000+ token/s）。模型在 18GB 消费级显卡即可本地运行，适用于代码、数学、复杂编辑等任务，已开源权重至 Hugging Face。

Google: Meet DiffusionGemma ⚡ Our latest experimental open model (Apache 2.0) that generates text up to 4x faster. Instead of pr...

Google开源生态模型发布部署/工程

05:47

Chubby♨️@kimmonismus

49

OpenAI 首席科学家 Jakub Pachocki 在 Slack 消息中写道，GPT-5.6 将比 GPT-5.5 有"有意义的改进"。 GPT-5.5 很棒，是我在 Codex 中的日常伴侣。一次重大飞跃将受到欢迎。但事实是：OpenAI 需要自己的神话/传说。来源：The Information

OpenAI模型发布

04:23

Simon Willison 博客

68

DiffusionGemma 发布：Google 开源 26B 参数扩散模型，NVIDIA 免费托管

Google 将去年 5 月短暂发布的 Gemini Diffusion 研究成果转化为开放权重的 Gemma 模型，模型名为 google/diffusiongemma-26B-A4B-it，采用 Apache 2 许可证开源。NVIDIA 正通过其 NIM 云 API 免费托管该模型。实测生成 2,409 个模型 token 仅需 4.4 秒，速度至少达到 500 token/s。

Google多模态开源生态模型发布

03:56

Ars Technica：AI（RSS）

64

Google DeepMind 发布 DiffusionGemma，本地 AI 推理速度提升 4 倍

Google DeepMind 发布 DiffusionGemma，一款利用扩散模型加速文本输出的新模型，本地 AI 推理速度达到传统模型的 4 倍。

DeepMindGoogle开源/仓库模型发布

03:22

The Decoder：AI News（RSS）

56

Google 新开源模型 DiffusionGemma：从噪声生成文本，而非逐字逐词

Google 发布 260 亿参数的 DiffusionGemma 模型，文本生成方式不再逐 token 预测，而是通过扩散过程从噪声直接生成，类似图像 AI 将噪声转化为图片。Nvidia 测试显示，该模型在单块 H100 GPU 上可达约每秒 1,000 tokens，速度约为可比自回归模型的四倍。代价是输出质量较低，因此 Google 目前将其定位为面向开发者的实验性工具。模型已开源。

Google多模态开源生态模型发布

02:52

MarkTechPost（RSS）

70

Google AI 发布 DiffusionGemma：基于文本扩散的 26B MoE 开源模型，生成速度最高提升 4 倍

Google DeepMind 发布实验性开源模型 DiffusionGemma，参数量 26B，采用混合专家（MoE）架构，通过文本扩散（text diffusion）技术实现在 GPU 上最高 4 倍生成速度提升。模型权重已开放。

Google开源生态推理模型发布

关联讨论 1 条

02:48

xAI@xai

精选74

Grok Voice 提供最先进的性能，具有类人的时机、语调和温暖感。而且价格仅为竞争对手的一小部分。查看详情：http：//x.ai/api/voice

ServiceNow AI Research: 🚀 Grok Voice Think Fast 1.0 (@xAI) lands on the Pareto frontier on EVA-Bench - no system in the eval beats it on accura...

xAI模型发布语音

推荐理由：语音AI的SOTA这次不是OpenAI了，Grok Voice在EVA-Bench上无死角领先，价格还打到对手十分之一，做语音产品的可以认真看看这个帕累托前沿选手。

02:16

Hacker News 热门（buzzing.cc 中文翻译）

80

DiffusionGemma：文本生成速度提升4倍

DiffusionGemma 是 Google 推出的文本生成模型，其文本生成速度相比前代提升 4 倍。该模型详情已发布在 Google 官方博客。

Google推理模型发布

关联讨论 1 条

01:53

Rohan Paul@rohanpaul_ai

70

Google 发布开源扩散模型 DiffusionGemma

Google 推出开源实验性模型 DiffusionGemma，基于 Gemma 4 的文本扩散研究。该模型为 26B MoE 架构，仅激活 3.8B 参数，量化后可适配 18GB VRAM。核心突破在于每轮前向传播并行生成 256 个 token，实现推理速度提升 4 倍：H100 上可达 1000+ tokens/s，RTX 5090 达 700+ tokens/s。DiffusionGemma 通过初始化随机占位符画布并运行多轮并行去噪，同时生成整段文本，许可证为 Apache 2.0。

Sundar Pichai: DiffusionGemma is an open, experimental model that brings our text diffusion research to Gemma 4. It's a racehorse 🏇ach...

Google开源生态推理模型发布

01:25

elvis@omarsar0

67

Cohere发布了其首个开源编程模型North Mini Code。该模型小巧高效，专为智能体性能设计，并欢迎社区反馈。Elvis Saravia对此赞叹不已，期待尽快将其与自己的DAIR.AI编程智能体配合使用。

Cohere: Introducing Cohere's first open-source coding model: North Mini Code Small & efficient, designed for agentic performance...

开源生态模型发布编码

01:02

🚨 AI News | TestingCatalog@testingcatalog

77

Google发布了实验性开源模型DiffusionGemma，采用Apache 2.0许可。该模型不再逐token预测，而是同时生成整块文本，速度提升高达4倍。它能在生成过程中自我纠正，并实时格式化复杂Markdown。性能与Gemma 4相当。

Google Gemma: Meet DiffusionGemma! An experimental open model that explores a fast approach to text generation, released under an Apac...

Google开源生态模型发布

关联讨论 1 条

00:44

Google AI Developers@googleaidevs

67

Google AI 发布实验性开源模型 DiffusionGemma

Google AI 发布实验性开源模型 DiffusionGemma，采用 Apache 2.0 许可证。该模型基于文本扩散方法，将生成瓶颈从内存带宽转向计算，在专用 GPU 上 token 输出速度最高提升 4 倍。推理时仅激活 3.8B 参数，量化后可适配 24GB VRAM 消费级 GPU。并行 token 生成支持自我纠错，适用于代码填充、行内编辑等非线性结构。DiffusionGemma 优先速度而非极致质量，生产场景仍推荐标准 Gemma 4。

Google开源生态模型发布编码

关联讨论 1 条

00:43

fofr@fofrAI

69

DiffusionGemma，大语言模型一次性选出所有词。速度快4倍。你可以从这里获取权重和说明开始使用： https：//huggingface.co/google/diffusiongemma-26B-A4B-it

GoogleHugging Face推理模型发布

00:40

Google DeepMind：Blog（RSS）

精选84

DiffusionGemma：文本生成速度提升4倍的开源扩散模型

Google DeepMind 发布开源实验模型 DiffusionGemma，采用文本扩散技术，突破自回归逐 token 生成方式，每次前向并行生成 256 个 token。该 26B MoE 模型推理时仅激活 3.8B 参数，量化后适配 18GB 显存消费级 GPU。在 H100 上达 1000+ tokens/s，RTX 5090 上 700+ tokens/s，速度提升 4 倍。具备双向注意力和自我修正能力，面向内联编辑、代码填充等本地交互工作流，以 Apache 2.0 许可证开放。

Hugging Face开源/仓库推理模型发布

关联讨论 1 条

推荐理由：DiffusionGemma 用扩散方式把推理速度拉到 4 倍，这是把本地部署的瓶颈从内存带宽转向了计算，对于实时编辑、代码补全这类场景，这个思路比单纯提升模型质量更有价值。

00:39

Google Developers Blog（RSS）

78

DiffusionGemma 开发者指南

DiffusionGemma 是 Google 基于 Gemma 4 架构的实验性文本生成模型，采用扩散式并行生成替代逐 token 自回归，实现更快推理、双向上下文感知和实时自我修正，并可在消费级 GPU 上部署。模型通过迭代去噪并行生成并细化 256-token 块，在处理数独等复杂约束任务上优于传统语言模型，且微调效果显著。它已集成 vLLM 等推理框架，为开发者提供一种高性能、高效长上下文扩展且易于定制部署的非自回归新方法。

Google推理模型发布部署/工程

关联讨论 1 条

00:24

elvis@omarsar0

71

太棒了！我最近花了很多时间在研究扩散大语言模型上，所以这个时机恰到好处。我觉得文本扩散领域还有很多未被充分探索的研究问题。权重已在 HuggingFace 上可用。

Google DeepMind: DiffusionGemma is our new experimental open model with up to 4x faster output on dedicated GPUs. Instead of predicting w...

Google推理模型发布

00:23

AK@_akhaliq

46

ABot-Earth 0.5 生成式3D地球模型

多模态模型发布

00:20

Sundar Pichai@sundarpichai

75

DiffusionGemma 是一个开放的实验性模型，它将我们的文本扩散研究引入 Gemma 4。它是一匹赛马 🏇，通过同时生成整块文本（而非逐 token（逐词）预测输出）实现高达 4 倍更快的推理速度！

Google开源/仓库推理模型发布

关联讨论 1 条

00:12

Google DeepMind@GoogleDeepMind

72

DiffusionGemma 是我们新的实验性开放模型，在专用 GPU 上输出速度最高可提升 4 倍。它不是逐词预测，而是同时生成整块文本。这让模型能够自我纠正，并实时格式化复杂 Markdown。

DeepMind开源/仓库模型发布

关联讨论 1 条

6月10日

21:48

The Decoder：AI News（RSS）

76

Claude Fable 5：首个 Mythos 模型--强大、昂贵且经过严格过滤

Anthropic 发布 Claude Fable 5，这是新 Mythos 类别的首个模型。该模型在 SWE-bench Verified 上达到 95%，几乎在所有基准测试中领先，但成本是 Opus 4.8 的两倍，每百万 token 价格为 10 美元或 50 美元。严格的安全过滤器会阻止约 9% 的请求，同时新增 30 天数据保留政策，即使签订零数据保留合同也适用。

Anthropic安全/对齐推理模型发布

关联讨论 27 条

21:16

TechCrunch：AI（RSS）

65

Decart 发布 Oasis 3：实时世界模型可模拟数小时逼真驾驶场景

Decart 推出 Oasis 3，一个实时世界模型，能够生成逼真的驾驶环境用于自动驾驶车辆测试，现已通过 API 向开发者开放。

模型发布视频

16:46

MarkTechPost（RSS）

62

Anthropic 发布 Claude Fable 5 和 Claude Mythos 5：同款基础模型，不同安全防护，新增 Mythos 级层次

Anthropic 正式推出 Claude Fable 5，附带分类器，全面开放使用；同时发布 Claude Mythos 5，仍保持受限访问，但通过 Project Glasswing 解除了网络安全防护。两款模型基于同一底层模型，区别在于安全机制配置，并新增了 Mythos-Class 层级。

Anthropic安全/对齐模型发布

16:45

小互@xiaohu

67

Google 发布实时翻译模型 Gemini 3.5 Live Translate

Google 推出 Gemini 3.5 Live Translate，支持 70 多种语言的实时边听边译，保留说话人的语调、节奏和音高，延迟仅数秒。模型具备自动语言检测，无需预先指定源语言和目标语言。同时自动滤除噪音，嘈杂环境可用。Google Translate App 新增「听筒模式」，贴耳即可听翻译。开发者可通过 Gemini Live API 和 Google AI Studio 调用。

Google模型发布语音

16:28

IT之家（RSS）

精选72

摩尔线程开源 MusaCoder 代码大模型，9B/27B 参数基于国产 GPU 全链路训练

摩尔线程发布并开源 MusaCoder 代码大模型，含 9B 和 27B 两个参数规模，是业内首个基于国产 GPU 算力底座完成全链路训练与验证的开源模型。后训练流程在基于 MTT S5000 的夸娥智算集群上完成，支持从 PyTorch 标准算子自动生成高性能 CUDA/MUSA 原生 Kernel 代码。在 KernelBench 评测中，MusaCoder-27B-RL 以 Overall Pass@8 93.2%、Avg.@8 88.60% 超越 Claude Opus、DeepSeek-V4 Pro、GLM-5.1、Kimi K2.6 等主流 SOTA 代码模型。

开源生态模型发布编码

推荐理由：摩尔线程这个模型直接瞄准GPU底层算子，KernelBench分数压过了不少主流大模型，虽然场景窄，但在国产硬件自建软件生态的路上，迈出了挺关键一步。

09:48

meng shao@shao__meng

73

Cohere 发布首个开源编程模型 North Mini Code

Cohere 推出首个开源编程模型 North Mini Code（MoE 30B/3B，128 专家，每 token 激活 8 个），支持 256K 输入/64K 输出，最低 1×H100（FP8）。训练采用三阶段后训练：级联 SFT（含 Agent 工具调用与推理数据）→ RLVR（CISPO 算法，异步采样，Terminal+SWE 双环境联合训练）→ 跨脚手架泛化。Agent 编程方面，Artificial Analysis Coding Index 达 33.4，同量级开源中领先 Qwen3.5 35B-A3B、Gemma 4 等，超过 Nemotron 3 Super 120B，稍低于 Qwen3.6 35B-A3B（约 35.2）。推理速度对比 Devstral Small 2 最高约 2.8×，词间延迟约 -30%。非编程 Agent 任务偏弱。推荐 temperature=1.0、top_p=0.95。

Cohere: Introducing Cohere's first open-source coding model: North Mini Code Small & efficient, designed for agentic performance...

智能体开源/仓库模型发布编码

08:40

Logan Kilpatrick@OfficialLoganK

63

祝贺 Anthropic 团队推出 Fable！！

Anthropic模型发布

08:22

Artificial Analysis@ArtificialAnlys

76

Claude Fable 5 登顶 Artificial Analysis Intelligence 指数

Claude Fable 5 发布即位列 Artificial Analysis Intelligence Index 第一，得分 64.9，领先第二名的 GPT-5.5 约 5 分。该模型采用自适应推理（最大努力模式）并以 Opus 4.8 作为回退模型。在 AA-Omniscience 知识测试中得分 40，领先此前最高分的 Gemini 3.1 Pro Preview 7 分；HLE 得分 53%，领先 Opus 4.8 超 7 个百分点。约 9% 任务触发安全护栏并回退。定价 $10/$50 每百万输入/输出 token（Opus 4.8 的两倍），缓存读写 $12.50/$1；上下文窗口保持 1M token。通过 Pro、Max、Team 等计划可用至 6 月 22 日，之后需消耗积分。

Anthropic推理模型发布

关联讨论 27 条

08:07

Berryxia.AI@berryxia

77

Google Gemini 3.5 Live Translate 公开预览，支持70+种语言

Google 推出 Gemini 3.5 Live Translate 实时翻译模型，已进入公开预览阶段，通过 Gemini API 提供低延迟语音到语音翻译，覆盖 70+ 种语言、2000 种语言对，包括大量冷门小语种。开发者可将该能力集成到实时对话、客服、直播、跨国会议等场景中。主推文指出该发布被 Anthropic Fable 5 刷屏抢了风头，并提及阿里 Qwen 系列小语种模型的可比性。

Google for Developers: Gemini 3.5 Live Translate is now in Public Preview via the Gemini API, delivering low-latency speech-to-speech translati...

Google模型发布语音

关联讨论 9 条

07:27

IT之家（RSS）

72

Anthropic 发布 Claude Fable 5 与 Mythos 5

Anthropic 于 6 月 9 日推出 Claude Fable 5 和 Mythos 5。Fable 5 面向普通用户，是目前公开最强的 Claude 模型，在软件工程、知识工作、视觉、科学研究等领域优于 Opus，自主运行时间更长。Mythos 5 通过 Project Glasswing 向网络安全防御方和基础设施提供商开放，具备全球最强网络安全能力，并在药物设计、分子生物学和基因组学中表现突出。两款模型本质相同，仅安全护栏不同。Fable 5 采用新分类器拦截网络安全、生物化学和蒸馏请求，命中后转由 Claude Opus 4.8 响应。定价均为每百万输入 10 美元、每百万输出 50 美元。Fable 5 已全面上线，Mythos 5 暂限 Glasswing 合作伙伴及少量生物研究者。

Anthropic多模态推理模型发布

关联讨论 27 条

07:07

Berryxia.AI@berryxia

78

Anthropic 推出安全版 Mythos 级模型 Claude Fable 5

Anthropic 发布 Claude Fable 5，这是经过安全处理的 Mythos 级模型，能力超越以往任何公开发布模型。它在软件工程、知识工作、科研和视觉等基准测试中几乎全线 SOTA，长任务越复杂领先越明显。在网络、生物化学、蒸馏等高风险领域，模型会自动回退至 Opus 4.8，平均每 20 次对话触发一次。同时，Anthropic 向少数可信的网络安全与关键基础设施团队开放完全版 Mythos 5，后续将扩大受信任访问。此举证明顶尖 AI 可在能力与安全之间同时达到极致。

Claude: Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...

Anthropic安全/对齐推理模型发布

关联讨论 27 条

07:07

Berryxia.AI@berryxia

72

Cohere开源North Mini Code：3B参数专攻Agentic Coding

Cohere推出North Mini Code开源模型，总参数30B，活跃参数仅3B，采用Apache 2.0许可。该模型在Artificial Analysis Coding Index上跑出33.4分，与同量级模型竞争，专为智能体编程（agentic coding）优化，支持本地运行、自由修改和迭代。开发者首次能完全掌控coding agent，而非依赖云端黑盒。

Cohere: Small: 30 billion parameters, 3B active. Efficient: Benchmarks to 33.4 on the Artificial Analysis Coding Index, competit...

智能体开源生态模型发布编码

07:06

Orange AI@oran_ge

67

A社Claude新模型被禁用于LLM开发

Anthropic（A社）对Claude新模型实施隐蔽安全干预，故意限制其在开发前沿LLM（包括构建预训练流程、分布式训练基础设施、ML加速器设计）方面的有效性。该干预通过提示修改、引导向量或参数高效微调（PEFT）实现，对用户不可见，仅影响约0.03%流量及不到0.1%组织。引用指出这意在削弱模型对前沿LLM研究的能力，对研究社区造成恶劣影响。

elie: mythos will be bad ON PURPOSE on ai "frontier llm research" tasks, this is very very sad for the research community also...

Anthropic安全/对齐模型发布

06:06

Orange AI@oran_ge

74

今天 Claude Fable 5 正式上线，基于 Mythos 的底座，但增加了安全护栏。

Claude Fable 5 基于 Mythos 底座并增加安全护栏，是自 4.5 以来最重大进步。在软件工程、知识工作等基准中领先，任务越复杂优势越明显。价格：输入 10 美金、输出 50 美金、缓存输入 1 美金，长文本一句话可达 10 美金。已原价上线 Cola。

Anthropic推理模型发布评测/基准

05:52

Artificial Analysis@ArtificialAnlys

67

HiDream O1-Image-1.5 在 Artificial Analysis 文生图排行榜中位列第三，超越 Google Nano Banana 2

HiDream 发布 O1-Image-1.5，在 Artificial Analysis 文生图排行榜中位列第三，超越 Google Nano Banana 2。该闭源模型可生成高达 2K 分辨率图像，基于自研 Unified Transformer（UiT）架构，将原始像素、文本和任务条件编码到统一 token 空间。质量仅次于 OpenAI，与 GPT Image 1.5 (high)、Nano Banana 2（Gemini 3.1 Flash Image Preview）及 Cosmos3-Super-Text2Image 相当。定价 $80/千张，现可通过 HiHarness 及 Vivago 平台使用。

图像生成模型发布评测/基准

05:43

TechCrunch：AI（RSS）

77

Anthropic 发布 Claude Fable 5，首个面向公众的 Mythos 级模型

Anthropic 推出 Claude Fable 5，这是其首个向公众开放的 Mythos 级大语言模型。该模型配备了内容护栏，可在网络安全和生物学等高危领域阻止生成响应。

Anthropic安全/对齐模型发布

关联讨论 27 条

04:55

Hugging Face：Blog（RSS）

精选73

Cohere发布North Mini Code：面向开发者的开源编码模型

Cohere发布North Mini Code，一款30B参数MoE模型（3B活跃参数），Apache 2.0开源。在Artificial Analysis Coding Index上得分33.4，超越Qwen3.5、Gemma 4等同类模型。后训练采用两阶段SFT和RLVR，在SWE-Bench Verified上pass@10达80.2%，Terminal-Bench v2上达55.1%。支持64K/128K上下文长度，专为智能体编码任务优化。

智能体开源生态模型发布编码

关联讨论 1 条

推荐理由：Cohere的新编码模型North Mini Code以30B参数MoE架构，在SWE-bench pass@1达到61%，Apache 2.0开源，是小模型在agent coding领域真正可用的信号。

04:24

🚨 AI News | TestingCatalog@testingcatalog

81

Mythos Fable 5 的基准测试结果非常巨大 👀 此外，Claude Mythos 5（一个具有增强安全措施的独立模型版本）已向一小群网络防御者和基础设施提供商发布。

Claude: Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...

Anthropic推理模型发布

关联讨论 27 条

03:29

ClaudeDevs@ClaudeDevs

76

Claude Fable 5 是我们首个普遍可用的 Mythos-class 模型。它搭载了新的安全分类器，可能会标记网络和生物等双重用途领域的某些提示词。我们增加了回退机制：被拒绝的请求会在 Claude Opus 4.8 上重试，而不是直接终止。

Anthropic安全/对齐模型发布

关联讨论 27 条