AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
5月8日周五
05:49OpenAI:官网动态(RSS · 排除企业/客户案例)74精选Scaling Trusted Access for Cyber with GPT-5.5 and GPT-5.5-Cyber04:35Artificial Analysis73OpenAI发布GPT-Realtime-2语音模型,在多项基准测试中领先03:42TestingCatalog News 🗞59AVM 2开发中,或于谷歌I/O前发布03:12TestingCatalog News 🗞64Gemini 3.1 Flash Lite 全面开放使用03:10Sam Altman79GPT-Realtime-2 API上线 语音交互成趋势03:10The Decoder:AI News(RSS)70OpenAI发布新语音模型,为实时对话带来GPT-5级推理能力02:05Greg Brockman87OpenAI发布GPT-Realtime-2语音推理模型,助力构建新一代语音智能体02:01Chubby♨️75OpenAI发布三款全新实时语音模型,并预告ChatGPT语音功能即将更新01:42TestingCatalog News 🗞81OpenAI发布三款新实时模型,或预示语音模式升级01:40OpenAI86GPT-Realtime-2 API上线 语音智能新突破01:36OpenAI Developers78语音智能体能力迎来重大升级:OpenAI发布新一代实时模型01:18OpenAI:官网动态(RSS · 排除企业/客户案例)86精选通过 API 中的新模型推进语音智能
5月7日周四
23:06Ant Ling76精选万亿参数指令模型Ling-2.6-1T发布20:34Rohan Paul65BACH 1.0实现AI视频角色面部多镜头一致性19:31Chubby♨️66ZAYA1-8B小模型展现超强推理能力,采用AMD全栈方案18:16IT之家(RSS)69小米开源 OmniVoice 多语言语音克隆 TTS,号称一个模型搞定 600 余种语言10:01公众号:腾讯混元32腾讯混元 Hy3 preview 上线两周 Token 调用增长 10 倍
5月6日周三
22:36SenseTime71精选SenseNova-U1开源8步蒸馏LoRA,推理速度大幅提升22:16IT之家(RSS)71精选豆包大模型家族首款全模态理解模型:字节跳动 Doubao-Seed-2.0-lite 升级22:04meng shao57Luma Uni-1 为图像生成模型增加可编程推理层20:36向阳乔木63豆包大模型Doubao-Seed-2.0-lite实现全模态理解与能力提升19:54公众号:火山引擎49豆包基础模型 Doubao-Seed-2.0-lite 升级,支持全模态理解18:07Xiaomi MiMo59小米MiMo V2.5跻身设计竞技场第六10:20歸藏(guizang.ai)79精选OpenAI 将 GPT-5.5 Instant 设为 ChatGPT 默认模型09:34karminski-牙医73Google发布Gemma 4草稿专用模型,推理速度提升三倍09:34meng shao77精选全球首个基于SSA架构的模型SubQ实现1200万token上下文窗口,效率大幅领先08:17Berryxia.AI66Gemma 4借助MTP草稿机实现3倍速推理08:17Berryxia.AI67今天这个tts有点东西啊!08:17Berryxia.AI75O社的 GPT-5.5 Instant 开始在 ChatGPT 中推出。 这是一个重大升级,让你获得更智能、更清晰、更个性化的回答,语气更温暖、更自然。08:15IT之家(RSS)75OpenAI ChatGPT 默认 AI 模型升至 GPT-5.5 Instant:幻觉最高减少 52.5%、回复更简洁06:28Rohan Paul76OpenAI将GPT-5.5 Instant设为ChatGPT默认模型,减少错误、缩短回答并增强个性化05:59Eric43如果是真的就厉害了 (其实很小)05:27Chubby♨️66实时语音AI响应速度是关键,TTS-2模型突破延迟瓶颈04:33ChatGPT73精选向我们所有使用新即时模型的用户致以热烈的祝贺。04:31Sam Altman49特别是当速度、智能、个性以及强大的记忆/个性化功能这些改进结合在一起时,它们共同作用所产生的效果,感觉像是超越了各部分简单相加的总和 【引用 @sama】:chatgpt中的新即时模型真是太棒了 如果你已经有一段时间只使用思考模型,不妨试试它!04:28Greg Brockman91精选重大ChatGPT升级现正推出,形式为GPT-5.5 Instant: 这是一次重大升级,以更温暖自然的语调提供更智能、更清晰、更个性化的答案。 同时它也更简洁,这正是我们所了解到的用户需求。我们相信你会喜欢与它对话。03:57Elon Musk83精选Grok 4.3 【引用 @xai】:Grok 4.3 现已在 xAI API 上线。这是我们迄今为止最快、最智能的模型。 它在 @ArtificialAnlys 排行榜的智能体工具调用和指令遵循方面位居榜首,并在 @ValsAI 的企业领域(如案例法和公司金融)中排名第一。 Grok 4.3 支持 100 万 token 的上下文窗口,定价为输入每百万 token 1.25 美元,输出每百万 token 2.50 美元。 创建 API 密钥并开始构建:http://console.x.ai/team/default/api-keys03:32TestingCatalog News 🗞71Google为Gemma 4系列发布了多令牌预测(MTP)草稿模型。它在不损失性能的情况下带来了3倍的速度提升。 期待在Mac Mini上测试带有MTP草稿模型的量化版Gemma 4!02:31TestingCatalog News 🗞77精选GPT-5.5即时版全面推送 更简洁智能02:30The Decoder:AI News(RSS)72精选ChatGPT 更新推出 GPT-5.5 Instant 模型,幻觉减少且答案更个性化
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月8日
05:49
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选74
Scaling Trusted Access for Cyber with GPT-5.5 and GPT-5.5-Cyber

OpenAI扩展了网络安全领域的可信访问计划,推出了GPT-5.5和专门针对网络安全的GPT-5.5-Cyber模型。此举旨在帮助经过验证的网络安全防御者加速漏洞研究,并加强对关键基础设施的保护。新模型将为安全专业人员提供更强大的AI工具支持。

OpenAI安全/对齐模型发布

推荐理由:GPT-5.5 正式登场,首秀是给安全防御者用的,Trusted Access 机制把模型和真实漏洞环境连起来,做网络安全的可以关注,其他人先看看。
04:35
Artificial Analysis@ArtificialAnlys
73
OpenAI发布GPT-Realtime-2语音模型,在多项基准测试中领先

OpenAI发布新一代旗舰语音模型GPT-Realtime-2。其在语音推理基准Big Bench Audio上取得96.6%的成绩,与Gemini 3.1 Flash持平,较此前最佳结果提升约13%。该模型同时在对话动态基准中保持领先,最小推理努力变体得分96.1%,尤其在停顿处理和轮转测试中表现突出。新模型支持从最小到xHigh的可调节推理努力等级,上下文窗口从32K增至128K,并支持文本、音频和图像输入,音频定价保持不变。

OpenAI推理模型发布语音
关联讨论 7 条IT之家(RSS)X:Tibo (@thsottiaux)X:宝玉 (@dotey)X:Greg Brockman (@gdb)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)X:Eric Mitchell (@ericmitchellai)
03:42
TestingCatalog News 🗞@testingcatalog
59
AVM 2 目前正在开发中 🚧 历史上,AVM 更新都安排在 Google I/O 的前一天 快了吗?@sama 👀👀👀

TestingCatalog News 🗞: OPENAI 🚨: 3 new models are now available on OpenAI Playground and APIs. - gpt-realtime 2 - gpt-realtime-whisper - gpt-r...

OpenAI模型发布语音
03:12
TestingCatalog News 🗞@testingcatalog
64
GOOGLE 🚨: Gemini 3.1 Flash Lite 现已全面开放!用户也可以在 AI Studio 上测试此模型。 > Flash-Lite 专为超低延迟、高吞吐量任务和无可比拟的成本效益而设计,已经在改变大规模应用的构建方式。

Google AI Studio: gemini 3.1 flash-lite is here it's our most cost-efficient model, optimized for high-volume agentic tasks, translation, ...

智能体Google模型发布
03:10
Sam Altman@sama
79
人们真的开始用语音与AI互动了,尤其是在需要输入大量上下文时。 GPT-Realtime-2今天登陆API;这是相当大的一步前进。 (我们正在改进聊天中的语音功能。)
OpenAI模型发布语音
关联讨论 7 条IT之家(RSS)X:Tibo (@thsottiaux)X:宝玉 (@dotey)X:Greg Brockman (@gdb)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)X:Eric Mitchell (@ericmitchellai)
03:10
The Decoder:AI News(RSS)
70
OpenAI发布新语音模型,为实时对话带来GPT-5级推理能力

OpenAI发布了三款新型语音模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper。其中,GPT-Realtime-2具备与GPT-5相匹配的实时推理能力,旨在实现更流畅、智能的实时对话交互。GPT-Realtime-Translate支持超过70种语言的实时翻译,而GPT-Realtime-Whisper则专注于实时语音转写功能。这一系列模型标志着OpenAI在实时音频处理和交互领域的重要进展,有望显著提升跨语言沟通和语音应用的体验。

OpenAI推理模型发布语音
关联讨论 7 条IT之家(RSS)X:Tibo (@thsottiaux)X:宝玉 (@dotey)X:Greg Brockman (@gdb)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)X:Eric Mitchell (@ericmitchellai)
02:05
Greg Brockman@gdb
87
OpenAI在API中正式推出具备GPT-5同级推理能力的GPT-Realtime-2语音模型,标志着语音智能体实现重大突破。该模型使语音智能体能作为实时协作者,在对话中动态完成聆听、推理与解决复杂任务。此次更新同时推出了GPT-Realtime-Translate和GPT-Realtime-Whisper等流式模型,共同构成了一套面向下一代语音界面的全新音频能力组合,为开发者构建卓越的实时语音交互应用提供了强大工具。

OpenAI: Introducing GPT-Realtime-2 in the API: our most intelligent voice model yet, bringing GPT-5-class reasoning to voice age...

智能体OpenAI推理模型发布
关联讨论 7 条IT之家(RSS)X:Tibo (@thsottiaux)X:宝玉 (@dotey)X:Greg Brockman (@gdb)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)X:Eric Mitchell (@ericmitchellai)
02:01
Chubby♨️@kimmonismus
75
OpenAI近日发布了三款新的实时语音模型:GPT-Realtime-2具备近似GPT-5的推理能力,允许语音助手在对话中实时思考;GPT-Realtime-Translate支持超过70种语言的实时翻译;GPT-Realtime-Whisper则能实现流式语音转文本。与此同时,OpenAI官方通过引用推文暗示,用户期待已久的ChatGPT语音功能更新正在积极准备中,即将正式推出。这预示着ChatGPT很可能在近期迎来全新的高级语音模式,进一步提升其交互体验与应用能力。

OpenAI: We know you're eager for voice updates in ChatGPT. Stay tuned, we're cooking.

OpenAI多模态模型发布语音
关联讨论 7 条IT之家(RSS)X:Tibo (@thsottiaux)X:宝玉 (@dotey)X:Greg Brockman (@gdb)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)X:Eric Mitchell (@ericmitchellai)
01:42
TestingCatalog News 🗞@testingcatalog
81
OpenAI在Playground和API中推出了三款新模型:GPT-Realtime-2、GPT-Realtime-Whisper和GPT-Realtime-Translate。其中,GPT-Realtime-2被描述为迄今最智能的语音模型,为语音智能体带来了GPT-5级别的推理能力,使其能作为实时协作者,在对话中聆听、推理并解决复杂问题。这些模型共同构成了一套面向下一代语音界面的新音频能力集,也预示着ChatGPT的语音模式可能即将迎来重要更新。

OpenAI: Introducing GPT-Realtime-2 in the API: our most intelligent voice model yet, bringing GPT-5-class reasoning to voice age...

OpenAI推理模型发布语音
关联讨论 7 条IT之家(RSS)X:Tibo (@thsottiaux)X:宝玉 (@dotey)X:Greg Brockman (@gdb)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)X:Eric Mitchell (@ericmitchellai)
01:40
OpenAI@OpenAI
86
在API中推出GPT-Realtime-2:我们迄今为止最智能的语音模型,为语音助手带来GPT-5级别的推理能力。 语音助手现已成为实时协作者,能够在对话展开时倾听、推理并解决复杂问题。 现已在API中与流式模型GPT-Realtime-Translate和GPT-Realtime-Whisper同步上线--为新一代语音界面提供全新的音频功能套件。
OpenAI推理模型发布语音
关联讨论 7 条IT之家(RSS)X:Tibo (@thsottiaux)X:宝玉 (@dotey)X:Greg Brockman (@gdb)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)X:Eric Mitchell (@ericmitchellai)
01:36
OpenAI Developers@OpenAIDevs
78
OpenAI通过API正式发布了新一代实时语音模型系列,显著增强了语音智能体的能力。其核心GPT-Realtime-2具备媲美GPT-5的推理水平,使语音智能体能作为实时协作者,在对话中聆听、思考并解决复杂问题。同时推出的GPT-Realtime-Translate支持70种输入语言到13种输出语言的实时翻译,GPT-Realtime-Whisper则提供了更快的语音转录速度。这一系列模型为下一代语音交互界面奠定了全新的音频能力基础。

OpenAI: Introducing GPT-Realtime-2 in the API: our most intelligent voice model yet, bringing GPT-5-class reasoning to voice age...

智能体OpenAI推理模型发布
关联讨论 7 条IT之家(RSS)X:Tibo (@thsottiaux)X:宝玉 (@dotey)X:Greg Brockman (@gdb)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)X:Eric Mitchell (@ericmitchellai)
01:18
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选86
通过 API 中的新模型推进语音智能

OpenAI API 推出了新的实时语音模型,能够进行推理、翻译和语音转录。这些模型显著提升了语音交互的自然度与智能水平,支持实时处理与多语言转换。新功能旨在为开发者提供更强大的工具,以构建更流畅、更智能的语音应用体验。

OpenAI多模态模型发布语音
关联讨论 7 条IT之家(RSS)X:Tibo (@thsottiaux)X:宝玉 (@dotey)X:Greg Brockman (@gdb)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)X:Eric Mitchell (@ericmitchellai)
推荐理由:语音模型不再只是‘听写’,开始能推理和翻译了,OpenAI这次API更新的几个新模型把语音智能推向更实用的阶段,做语音产品的值得赶紧试试。
5月7日
23:06
Ant Ling@AntLingAGI
精选76
inclusionAI宣布Ling-2.6-1T现已在OpenRouter上线。🚀 这款万亿参数旗舰指令模型专为现实世界智能体打造。它采用"快速思考"方法,在保持AIME26和SWE-bench Verified基准测试顶尖性能的同时,将成本降低约75%。适用于: - 高级编程 - 复杂推理 - 大规模智能体工作流
智能体推理模型发布编码
关联讨论 6 条蚂蚁百灵:Developer Blog(网页)X:阿易 AI Notes (@AYi_AInotes)X:Artificial Analysis (@ArtificialAnlys)蚂蚁 inclusionAI:HuggingFace 新模型X:蚂蚁百灵 (@AntLingAGI)IT之家(RSS)
推荐理由:万亿参数专攻Agent,成本还直降75%,对狂烧token费的AI Agent团队来说是个真信号。蚂蚁终于不玩虚的,OpenRouter上就能试。
20:34
Rohan Paul@rohanpaul_ai
65
由@video_rebirth新推出的BACH 1.0解决了AI视频模型中最棘手的难题之一:在不同角度和镜头切换中保持同一角色面部的一致性。 不仅是单个优质特写镜头。它实现了同一身份的真实多镜头一致性,而这正是多数图像转视频模型仍会失效的环节。 BACH擅长表现角色的面部情绪。 整体而言,其输出极具电影感且达到制作水准。 目前在Artificial Anlysis全球榜单中位列第六。 🧵 1.
多模态模型发布
19:31
Chubby♨️@kimmonismus
66
ZAYA1-8B小模型展现超强推理能力,采用AMD全栈方案

Zyphra发布ZAYA1-8B模型,其活跃参数不足10亿,却在数学、编程和推理基准测试中媲美更大的开源及专有系统。其亮点不仅在于小尺寸,更在于全栈技术方案:完全基于AMD基础设施训练,采用了新的架构选择和大规模强化学习。此外,模型应用了一种名为Markovian RSA的测试时计算方法,通过并行推理和递归聚合,显著提升了复杂数学问题的解决能力。

推理模型发布端侧
18:16
IT之家(RSS)
69
小米开源 OmniVoice 多语言语音克隆 TTS,号称一个模型搞定 600 余种语言

小米AI实验室开源多语言语音克隆TTS模型OmniVoice,覆盖600余种语言。该模型采用极简双向Transformer架构,无需复杂结构即可实现文本到语音的直接转换。其语音合成质量超越同类主流模型,训练速度可达一天10万小时。关键设计包括全码本随机掩蔽策略和引入大语言模型预训练参数,显著提升训练效率与语音可懂度。测试显示,在多种语言中其相似度与可懂度超越多款商用系统,并对低资源小语种也能实现高质量合成。模型还支持自定义音色、带噪音频适配等实用功能。

arXivGitHub多模态开源生态
10:01
公众号:腾讯混元
32
腾讯混元 Hy3 preview 上线两周 Token 调用增长 10 倍

腾讯混元推出的 Hy3 preview 模型上线仅两周,Token 调用量即增长 10 倍,其中代码和智能体类场景的 Token 调用增长尤为明显。

智能体模型发布编码
5月6日
22:36
SenseTime@SenseTime_AI
精选71
🚀 SenseNova-U1 更新: ⚡ 开源8步蒸馏LoRA:100 NFE降至8 NFE,H100推理时间从23秒缩短至2秒 🧩 现已支持ComfyUI,提供文生图、图像编辑和交错生成的即用工作流 试用链接 👇 https://github.com/OpenSenseNova/SenseNova-U1/
图像生成开源/仓库推理模型发布
关联讨论 1 条X:Berry Xia (@berryxia)
推荐理由:从100步到8步,23秒压到2秒,商汤这个蒸馏LoRA把U1的推理成本打下来了,做实时图像应用的可以认真看看,ComfyUI一接就能跑。
22:16
IT之家(RSS)
精选71
豆包大模型家族首款全模态理解模型:字节跳动 Doubao-Seed-2.0-lite 升级

字节跳动火山引擎发布豆包大模型家族首款全模态理解模型 Doubao-Seed-2.0-lite 升级版。该模型原生统一支持视频、图像、音频和文本理解,并能进行跨模态联合推理,在物理、医疗等学科推理及细粒度感知上表现超越此前Pro版本。音频方面支持19种语种转写及多语种互译,多项基准测试优于Gemini-3.1-Pro。同时,其Agent、Coding与GUI能力升级,能更稳定处理长任务、胜任深度开发,并实现界面理解与操作执行的闭环。新版本已在火山方舟上线,旨在为企业提供高性价比的全模态任务部署方案。

智能体多模态推理模型发布

推荐理由:豆包Seed 2.0 lite把视频、音频、图片、文字原生塞进一个模型,还顺手强化了Agent和GUI操作,对需要全模态处理的企业来说,这可能是目前性价比最高的选择。
22:04
meng shao@shao__meng
57
Luma发布的Uni-1图像生成模型在提示词与像素生成之间引入了一个显式推理步骤,用于解读创意方向并消除歧义。这一关键推理层现已通过API对外可编程开放,使其不再是黑盒,允许开发者将Uni-1作为智能基础设施集成到生产流程中。主要应用模式包括嵌入产品作为创作引擎、构建自定义多阶段工作流或开发独立工具。API提供的核心能力涵盖基于参考图像的风格或角色约束生成、在模型层面强制保持视觉一致性,以及通过自然语言指令进行精准编辑。

Sumanth: Luma just released Uni-1, an image generation model that reasons first! The shift: image generation models typically wor...

图像生成推理模型发布
20:36
向阳乔木@vista8
63
豆包大模型Doubao-Seed-2.0-lite实现全模态理解与能力提升

Doubao-Seed-2.0-lite 0428 内测版本升级,新增音频理解功能,能同时支持图片、视频、音频和文本四种输入,成为豆包大模型家族首款全模态理解模型。该版本在 Agent、Coding 和 GUI 能力上也有明显提升。通过 API 测试,验证了其在前端动效复刻、视频Hooks建议和字幕识别等场景的应用潜力,具体案例详见后续推文线程。

多模态模型发布
19:54
公众号:火山引擎
49
豆包基础模型 Doubao-Seed-2.0-lite 升级,支持全模态理解

豆包基础模型 Doubao-Seed-2.0-lite 完成升级,新增全模态理解能力。升级后的模型支持全模态理解,可处理多种信息形式。此为火山引擎旗下模型的最新升级。

多模态模型发布
18:07
Xiaomi MiMo@XiaomiMiMo
59
MiMo V2.5 🥰🥰 【引用 @Designarena】:突发:小米MiMo-V2.5在设计竞技场开放权重模型中综合排名第六! 其Elo评分为1297,与@Kimi_Moonshot的Kimi K2.5(思考版)处于同一性能区间。 祝贺@XiaomiMiMo团队发布成功!

Design Arena: BREAKING: MiMo-V2.5 by @Xiaomi is #6 overall out of open weight models on Design Arena! This has an Elo of 1297 and is i...

开源/仓库模型发布评测/基准
10:20
歸藏(guizang.ai)@op7418
精选79
OpenAI 将 GPT-5.5 Instant 设为 ChatGPT 默认模型

OpenAI 已全量发布 GPT-5.5 Instant 模型,并将其设为 ChatGPT 的默认模型。此次升级显著提升了模型的实时准确性和日常任务处理能力,特别是在法律、金融和医学等领域有效降低了幻觉率。同时,模型在图片理解与文档解析方面表现更佳。其回答风格变得更加简洁、聚焦要点,并增强了清晰度、个性化以及温暖自然的语调。此外,GPT 引入了记忆来源功能,允许用户可视化查看并编辑记忆的来源。本次更新未包含 Codex 模型。

OpenAI: GPT-5.5 Instant is starting to roll out in ChatGPT. It's a big upgrade, giving you smarter, clearer, and more personaliz...

OpenAI推理模型发布
关联讨论 20 条X:Testing Catalog (@testingcatalog)Simon Willison 博客X:swyx (@swyx)X:Greg Brockman (@gdb)The Decoder:AI News(RSS)X:Vista (@vista8)X:Rohan Paul (@rohanpaul_ai)X:Sam Altman (@sama)X:Tibo (@thsottiaux)OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)X:宝玉 (@dotey)X:OpenAI (@OpenAI)Ethan Mollick:One Useful Thing(RSS)X:Satya Nadella (@satyanadella)X:Artificial Analysis (@ArtificialAnlys)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)X:Eric Mitchell (@ericmitchellai)X:ChatGPT (@ChatGPTapp)
推荐理由:GPT-5.5 Instant 成为默认模型,解决的是日常最痛的啰嗦和幻觉,记忆来源可视化也把黑盒变透明了,对普通用户是实实在在的提升。
09:34
karminski-牙医@karminski3
73
Google发布Gemma 4草稿专用模型,推理速度提升三倍

Google发布了Gemma 4系列模型的专用草稿模型,用于推测性解码优化。31B Dense模型搭配草稿模型速度提升3倍,仅增加1G显存开销;Gemma4-26B和Gemma4-E4B分别提升1.5倍和3.1倍速度。新草稿模型如gemma-4-31B-it-assistant体积仅939 MB,专门优化后接受率高,相比之前使用非专用草稿模型(如gemma-4-E2B-it-UD-Q4_K_XL)提速更明显。作者呼吁Qwen尽快推出类似优化模型(如Qwen3.6-27B-assistant),以应对高性能需求。

Google推理模型发布
关联讨论 2 条X:Berry Xia (@berryxia)X:宝玉 (@dotey)
09:34
meng shao@shao__meng
精选77
全球首个基于SSA架构的模型SubQ实现1200万token上下文窗口,效率大幅领先

前沿模型SubQ基于创新的Subquadratic Sparse Attention架构,实现了1200万token的实用上下文窗口。其核心技术SSA通过内容依赖的选择机制,让每个查询仅动态计算与相关键的注意力,使计算和内存成本随序列长度线性增长,而非传统Transformer的二次方增长。实测在100万token时比FlashAttention-2快52.2倍,成本低于Opus的5%。该模型针对需要一次性处理完整代码库、长文档等企业真实长上下文场景优化,旨在弥合“名义上下文”与“功能上下文”窗口的差距。

Alexander Whedon: Introducing SubQ - a major breakthrough in LLM intelligence. It is the first model built on a fully sub-quadratic sparse...

数据/训练模型发布编码
关联讨论 1 条X:Rohan Paul (@rohanpaul_ai)
推荐理由:这是第一个真正把子二次方注意力用到前沿模型上的突破,12M 上下文窗口不再只是参数,而是能用起来的真窗口,长上下文场景的成本逻辑要重写了。
08:17
Berryxia.AI@berryxia
66
Gemma 4借助MTP草稿机实现3倍速推理

Google通过为Gemma 4引入MTP drafters(多token预测草稿机),在不增加参数、不改变架构和模型质量的前提下,实现了最高3倍的推理速度提升。该技术让模型能一次预测多个token,突破了传统自回归解码的串行瓶颈,极大提升了GPU利用率。这显著增强了本地部署的实时性,并使Agent、代码生成等场景受益,进一步放大了开源模型在性价比和本地运行方面的优势。

Google for Developers: Gemma 4: Now up to 3x Faster. ⚡ Same quality, way more speed. Our new MTP drafters allow Gemma 4 to predict multiple tok...

Google开源生态推理模型发布
08:17
Berryxia.AI@berryxia
67
今天这个tts有点东西啊!

Inworld AI 发布了新一代实时对话语音模型 Realtime TTS-2,突破了传统TTS仅追求拟人化的竞争框架。该模型能够实时倾听完整对话,捕捉情绪、语气与节奏,动态决定回应方式,成为一个“会倾听、会共情、会适配”的对话伙伴。其关键创新包括:支持用自然语言语音指令像指挥大语言模型一样调整声音;同一声音身份可跨100多种语言保持一致性;还能通过文字描述生成全新声音并保存复用。这标志着语音AI从机械的“语音输出”迈向更贴近真人互动的“实时对话”时代。

Inworld AI: Introducing Realtime TTS-2, a new generation of voice model built for realtime conversation. It is the first voice model...

多模态模型发布语音
08:17
Berryxia.AI@berryxia
75
O社的 GPT-5.5 Instant 开始在 ChatGPT 中推出。 这是一个重大升级,让你获得更智能、更清晰、更个性化的回答,语气更温暖、更自然。
OpenAI推理模型发布
关联讨论 20 条X:Testing Catalog (@testingcatalog)Simon Willison 博客X:swyx (@swyx)X:Greg Brockman (@gdb)The Decoder:AI News(RSS)X:Vista (@vista8)X:Rohan Paul (@rohanpaul_ai)X:Sam Altman (@sama)X:Tibo (@thsottiaux)OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)X:宝玉 (@dotey)X:OpenAI (@OpenAI)Ethan Mollick:One Useful Thing(RSS)X:Satya Nadella (@satyanadella)X:Artificial Analysis (@ArtificialAnlys)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)X:Eric Mitchell (@ericmitchellai)X:ChatGPT (@ChatGPTapp)
08:15
IT之家(RSS)
75
OpenAI ChatGPT 默认 AI 模型升至 GPT-5.5 Instant:幻觉最高减少 52.5%、回复更简洁

OpenAI于5月5日将ChatGPT默认模型升级为GPT-5.5 Instant,重点提升准确性与简洁性。新模型在医疗、法律、金融等高风险领域,幻觉声明较前代减少52.5%;在用户标记的事实错误测试中,不准确声明降低37.3%。回复内容更简洁,减少了不必要的表情符号和冗长格式。所有用户即日起开始获得更新,付费用户可继续使用GPT-5.3 Instant三个月。

OpenAI推理模型发布
关联讨论 20 条X:Testing Catalog (@testingcatalog)Simon Willison 博客X:swyx (@swyx)X:Greg Brockman (@gdb)The Decoder:AI News(RSS)X:Vista (@vista8)X:Rohan Paul (@rohanpaul_ai)X:Sam Altman (@sama)X:Tibo (@thsottiaux)OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)X:宝玉 (@dotey)X:OpenAI (@OpenAI)Ethan Mollick:One Useful Thing(RSS)X:Satya Nadella (@satyanadella)X:Artificial Analysis (@ArtificialAnlys)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)X:Eric Mitchell (@ericmitchellai)X:ChatGPT (@ChatGPTapp)
06:28
Rohan Paul@rohanpaul_ai
76
OpenAI将GPT-5.5 Instant设为ChatGPT默认模型,减少错误、缩短回答并增强个性化

OpenAI已将GPT-5.5 Instant设置为ChatGPT的默认模型。该模型在医学、法律和金融等关键提示上的虚假陈述比前代减少52.5%,在用户标记过事实错误的困难对话中不准确陈述降低37.3%。回答更简洁,用词和行数减少约30%。同时,模型增强了图像和STEM处理能力,并能从记忆、过往对话、文件及连接的Gmail中提取上下文以实现深度个性化。OpenAI表示,此次升级旨在提供更智能、清晰、个性化且语气自然温暖的回答。

OpenAI: GPT-5.5 Instant is starting to roll out in ChatGPT. It's a big upgrade, giving you smarter, clearer, and more personaliz...

OpenAI多模态推理模型发布
关联讨论 20 条X:Testing Catalog (@testingcatalog)Simon Willison 博客X:swyx (@swyx)X:Greg Brockman (@gdb)The Decoder:AI News(RSS)X:Vista (@vista8)X:Rohan Paul (@rohanpaul_ai)X:Sam Altman (@sama)X:Tibo (@thsottiaux)OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)X:宝玉 (@dotey)X:OpenAI (@OpenAI)Ethan Mollick:One Useful Thing(RSS)X:Satya Nadella (@satyanadella)X:Artificial Analysis (@ArtificialAnlys)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)X:Eric Mitchell (@ericmitchellai)X:ChatGPT (@ChatGPTapp)
05:59
Eric@ericmitchellai
43
如果是真的就厉害了 (其实很小)

Chris: Holy shit GPT 5.5 instant 1. Doesn't yap 2. Talks like a human 3. Brings relevant things into the convo (I was having ai...

OpenAI模型发布
05:27
Chubby♨️@kimmonismus
66
主推文强调语音代理的首次音频响应时间(TTFA)低于200毫秒至关重要,超过300毫秒即可感知延迟。引用推文介绍了专为实时对话设计的Realtime TTS-2新一代语音模型,该模型能理解对话内容、接受自然语言语音指令、在超过100种语言中保持同一声音身份,并能模拟人类专注的说话方式,最终实现听觉与体验俱佳的语音AI效果。

Inworld AI: Introducing Realtime TTS-2, a new generation of voice model built for realtime conversation. It is the first voice model...

智能体模型发布语音
04:33
ChatGPT@ChatGPTapp
精选73
向我们所有使用新即时模型的用户致以热烈的祝贺。
OpenAI模型发布
关联讨论 20 条X:Testing Catalog (@testingcatalog)Simon Willison 博客X:swyx (@swyx)X:Greg Brockman (@gdb)The Decoder:AI News(RSS)X:Vista (@vista8)X:Rohan Paul (@rohanpaul_ai)X:Sam Altman (@sama)X:Tibo (@thsottiaux)OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)X:宝玉 (@dotey)X:OpenAI (@OpenAI)Ethan Mollick:One Useful Thing(RSS)X:Satya Nadella (@satyanadella)X:Artificial Analysis (@ArtificialAnlys)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)X:Eric Mitchell (@ericmitchellai)X:ChatGPT (@ChatGPTapp)
推荐理由:OpenAI突然发了一个「Instant模型」,推文只有一句庆祝,没给任何能力指标。如果真是主打实时响应,那对聊天体验是实打实的提升,但现在啥也看不出来。
04:31
Sam Altman@sama
49
特别是当速度、智能、个性以及强大的记忆/个性化功能这些改进结合在一起时,它们共同作用所产生的效果,感觉像是超越了各部分简单相加的总和 【引用 @sama】:chatgpt中的新即时模型真是太棒了 如果你已经有一段时间只使用思考模型,不妨试试它!

Sam Altman: the new instant model in chatgpt is so good damn if you have been thinking-model-only for awhile, give it a try!

OpenAI模型发布
04:28
Greg Brockman@gdb
精选91
重大ChatGPT升级现正推出,形式为GPT-5.5 Instant: 这是一次重大升级,以更温暖自然的语调提供更智能、更清晰、更个性化的答案。 同时它也更简洁,这正是我们所了解到的用户需求。我们相信你会喜欢与它对话。

OpenAI: GPT-5.5 Instant is starting to roll out in ChatGPT. It's a big upgrade, giving you smarter, clearer, and more personaliz...

OpenAI模型发布
关联讨论 20 条X:Testing Catalog (@testingcatalog)Simon Willison 博客X:swyx (@swyx)X:Greg Brockman (@gdb)The Decoder:AI News(RSS)X:Vista (@vista8)X:Rohan Paul (@rohanpaul_ai)X:Sam Altman (@sama)X:Tibo (@thsottiaux)OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)X:宝玉 (@dotey)X:OpenAI (@OpenAI)Ethan Mollick:One Useful Thing(RSS)X:Satya Nadella (@satyanadella)X:Artificial Analysis (@ArtificialAnlys)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)X:Eric Mitchell (@ericmitchellai)X:ChatGPT (@ChatGPTapp)
推荐理由:ChatGPT终于迎来一次真正的代际升级,GPT-5.5 Instant把聪明和人性化揉在一起,而且更简洁了,之前那些因为啰嗦被嫌弃的对话可以翻篇了。
03:57
Elon Musk@elonmusk
精选83
Grok 4.3 【引用 @xai】:Grok 4.3 现已在 xAI API 上线。这是我们迄今为止最快、最智能的模型。 它在 @ArtificialAnlys 排行榜的智能体工具调用和指令遵循方面位居榜首,并在 @ValsAI 的企业领域(如案例法和公司金融)中排名第一。 Grok 4.3 支持 100 万 token 的上下文窗口,定价为输入每百万 token 1.25 美元,输出每百万 token 2.50 美元。 创建 API 密钥并开始构建:http://console.x.ai/team/default/api-keys

xAI: Grok 4.3 is now live on the xAI API. It's our fastest, most intelligent model to date. It tops the @ArtificialAnlys lead...

智能体xAI推理模型发布
关联讨论 5 条X:OpenRouter (@OpenRouter)X:xAI (@xai)X:Artificial Analysis (@ArtificialAnlys)Hacker News 热门(buzzing.cc 中文翻译)X:Elon Musk (@elonmusk, xAI)
推荐理由:Grok 4.3 把 agentic tool calling 和指令遵循两个榜单压在脚下,百万上下文配上亲民价格,对做自动化 agent 的团队是个够分量的信号。
03:32
TestingCatalog News 🗞@testingcatalog
71
Google为Gemma 4系列发布了多令牌预测(MTP)草稿模型。它在不损失性能的情况下带来了3倍的速度提升。 期待在Mac Mini上测试带有MTP草稿模型的量化版Gemma 4!

Google for Developers: Gemma 4: Now up to 3x Faster. ⚡ Same quality, way more speed. Our new MTP drafters allow Gemma 4 to predict multiple tok...

Google推理模型发布
关联讨论 2 条X:Berry Xia (@berryxia)X:宝玉 (@dotey)
02:31
TestingCatalog News 🗞@testingcatalog
精选77
OPENAI 🚨: GPT-5.5 Instant 正在向所有 ChatGPT 用户推出!"gpt-5.5-chat-latest" 也将进入 API。 > 更加简洁。更好的记忆。更个性化。 即时测试时间 👀

OpenAI: GPT-5.5 Instant is starting to roll out in ChatGPT. It's a big upgrade, giving you smarter, clearer, and more personaliz...

OpenAI模型发布
关联讨论 20 条X:Testing Catalog (@testingcatalog)Simon Willison 博客X:swyx (@swyx)X:Greg Brockman (@gdb)The Decoder:AI News(RSS)X:Vista (@vista8)X:Rohan Paul (@rohanpaul_ai)X:Sam Altman (@sama)X:Tibo (@thsottiaux)OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)X:宝玉 (@dotey)X:OpenAI (@OpenAI)Ethan Mollick:One Useful Thing(RSS)X:Satya Nadella (@satyanadella)X:Artificial Analysis (@ArtificialAnlys)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)X:Eric Mitchell (@ericmitchellai)X:ChatGPT (@ChatGPTapp)
推荐理由:GPT-5.5 Instant这版从语气到长度都在优化,免费用户终于能摸到GPT-5.5的门槛了,实际体验可能会比参数更重要。
02:30
The Decoder:AI News(RSS)
精选72
ChatGPT 更新推出 GPT-5.5 Instant 模型,幻觉减少且答案更个性化

OpenAI 将 ChatGPT 的默认模型更新为 GPT-5.5 Instant。内部测试显示,该模型在医学和法律等高风险主题上产生的幻觉声称减少了 52.5%。新功能“记忆来源”允许用户查看影响特定回答的存储上下文。该模型正立即向所有用户推出,但基于过去聊天记录、文件和 Gmail 的个性化功能将首先在网页版上向 Plus 和 Pro 用户开放。此次更新旨在提升回答的准确性和个性化体验。

OpenAI产品更新安全/对齐
关联讨论 20 条X:Testing Catalog (@testingcatalog)Simon Willison 博客X:swyx (@swyx)X:Greg Brockman (@gdb)The Decoder:AI News(RSS)X:Vista (@vista8)X:Rohan Paul (@rohanpaul_ai)X:Sam Altman (@sama)X:Tibo (@thsottiaux)OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)X:宝玉 (@dotey)X:OpenAI (@OpenAI)Ethan Mollick:One Useful Thing(RSS)X:Satya Nadella (@satyanadella)X:Artificial Analysis (@ArtificialAnlys)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)X:Eric Mitchell (@ericmitchellai)X:ChatGPT (@ChatGPTapp)
推荐理由:GPT-5.5 Instant换到默认模型,减少一半幻觉是个硬指标进步,记忆源让用户知道ChatGPT为什么这样回答,透明度这块终于追上了。
‹ 上一页
1…1718192021…27
下一页 ›