AIHOT

全部动态

全部一手资讯 X 论文

6月6日周六

6月5日周五

6月4日周四

6月6日

00:59

Google AI Developers@googleaidevs

精选72

谷歌发布 Gemma 4 QAT 检查点，支持消费级 GPU 和移动设备本地运行

谷歌发布 Gemma 4 量化感知训练 (QAT) 检查点，支持在消费级 GPU 和移动设备上本地运行，质量损失极小。新检查点提供 GGUF（Q4_0）格式，覆盖所有尺寸及起草模型，实现最佳本地性能。自定义移动模式采用混合精度方案，将 Gemma 4 压缩至 1GB 以下，包含 2-bit 解码层、优化 KV 缓存和静态激活。通过在训练中模拟压缩（而非训练后量化），大幅降低内存占用并加速解码，同时保持推理质量。

Google开源/仓库模型发布端侧

关联讨论 4 条

推荐理由：Gemma 4 的量化版把模型压到 1GB 以下，手机本地跑大模型的门槛又低了一大截。Google 这次没用传统的训练后量化，而是把压缩直接嵌进训练里，效果比 PTQ 好一截，搞端侧部署的可以拿 checkpoint 试起来了。

00:30

Chubby♨️@kimmonismus

最近发现的"Oceanus"检查点输出预览曝光，据传闻这是 Anthropic 即将发布的 Mythos 模型的一个版本，计划在"几周内"公开发布。

🚨 AI News | TestingCatalog: MYTHOS 🔥: Another early preview of recently spotted "Oceanus" checkpoint output. "Oceanus" is rumored to be a version o...

Anthropic模型发布

6月5日

23:36

🚨 AI News | TestingCatalog@testingcatalog

MYTHOS 🔥：近期发现的"Oceanus"检查点输出的另一个早期预览。 "Oceanus"被传是即将推出的Mythos模型的一个版本，根据Anthropic，计划在"数周内"公开发布。 "Oceanus"提示词 👀

Anthropic模型发布

15:58

Chubby♨️@kimmonismus

@Lentils80 分享了两段来自 Claude Mythos 的惊人输出，零样本且几乎无需费力。这是自 2025 年 10 月 Gemini A/B 模型以来，针对该提示词我看到的最佳输出。主推文感叹：Claude Mythos 将进入完全不同的水准，这些输出太疯狂了。

Lentils: Seeing as Claude Mythos is releasing soon, I have two VERY astonishing outputs to share from it. 👀 ZERO-SHOT and LOW ef...

Anthropic模型发布

15:40

Elon Musk@elonmusk

精选67

更新后的 Grok-build 模型（仍是 0.5T 那个）比以前好很多。它不那么偷懒、更自主、更准确。我们仍在改进长时任务。请期待并在我们漂亮的 TUI 中使用新的使用限制！🚀

Bill Yuchen Lin: The updated Grok-build model (still the 0.5T one) is much better than before. It's less lazy, more autonomous, and more ...

xAI模型发布

推荐理由：马斯克亲口确认Grok模型更新，虽然还是0.5T参数，但改进后更自主、更准确，做长期任务的开发者可以看看。

14:14

IT之家（RSS）

谷歌推出 Magenta RealTime 2 本地实时音乐 AI 模型：延迟降低至 1/15

谷歌 Magenta 团队昨日发布 Magenta RealTime 2（MRT2）模型，免费放出乐器应用 Jam 及 DAW 插件 MRT2。MRT2 提供两种规模：高质量模型 mrt2_base（24 亿参数）和高速模型 mrt2_small（2.3 亿参数），均针对苹果 Apple Silicon 优化，mrt2_small 可在 M1 及以上芯片 Mac 实时运行。相较前代延迟约 3 秒，MRT2 改为逐帧生成（每帧 40 毫秒），控制延迟约 200 毫秒，降低至 15 分之一。支持文本和音频风格提示、MIDI 音符与鼓开关控制及 Auto-Strum 模式。技术基于 Codec Language Model，采用 SpectroStream 编解码器处理 48kHz 立体声音频。

Google多模态模型发布

13:27

公众号：京东JoyAI

精选72

京东开源JoyAI-Echo长音视频生成框架

6月3日，京东开源JoyAI-Echo框架，解决长视频生成中角色身份崩坏、音色突变和生成缓慢三大难题。该框架通过跨模态音视频记忆库保持5分钟内角色外观与音色一致，记忆驱动后训练结合DMD技术带来约7.5倍推理加速。新增Director Agent支持自然语言对话式局部修订，无需重跑整条视频。配套轻量化实时超分模块，支持736×1280→1152×1920及1472×2560两档分辨率。评测集显示，语音内容准确率0.8646，用户偏好多项领先。代码与权重已开源至GitHub。

GitHub多模态模型发布

推荐理由：长视频生成一直被角色崩塌和龟速生成卡死，JoyAI-Echo 开源给出了角色一致性方案和 7.5 倍加速，Director Agent 对话式编辑的思路很先进，做 AI 视频的朋友可以直接去 GitHub 开跑。