AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
最新一期2026-06-12
2026 年 6 月12
  • 12 日Gemini Omni Flash 视频任务达 SOTA
  • 11 日DiffusionGemma:文本生成速度提升4倍的开源扩散模型
  • 10 日Claude Fable 5 和 Claude Mythos 5
  • 9 日小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型
  • 8 日Harness-1:基于强化学习训练的有状态搜索20B检索子智能体
  • 7 日GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码
  • 6 日Riverflow 2.5:可控制评分标准的图像模型
  • 5 日Nemotron 3.5 Content Safety:面向全球企业AI的可定制多模态安全
  • 4 日Grok Imagine 1.5 预览版发布
  • 3 日微软首款高级推理AI模型MAI-Thinking-1发布
  • 2 日MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型
  • 1 日OpenAI发布生物防御AI工具Rosalind
2026 年 5 月31
  • 31 日Nano Banana Pro与Nano Banana 2正式发布
  • 30 日OpenAI推出实时翻译模型,支持70+语言输入
  • 29 日Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级
  • 28 日Runway 推出 Model Context Protocol 服务器
  • 27 日谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题
  • 26 日面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN
  • 25 日Luma Agents 实现规模化真实 UGC 广告生成
  • 24 日StepAudio 2.5实时语音发布:副语言感知与人格化交互
  • 23 日首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布
  • 22 日Aleph 2.0 与 Edit Studio
  • 21 日Qwen3.7:智能体前沿
  • 20 日I/O 2026: 欢迎来到自主的 Gemini 时代
  • 19 日阿里云推出HappyHorse视频生成模型
  • 18 日Grok Imagine图像生成功能正式发布
  • 17 日社区协作再创佳绩,vLLM支持万亿级模型
  • 16 日MiniMax M2.7模型上线OrcaRouter平台
  • 15 日SenseNova U1技术报告发布,基于MoE架构开放模型权重
  • 14 日Hy3预览版登陆GMI,开源最强模型领跑
  • 13 日Claude Opus 4.7快速模式开放研究预览
  • 12 日SenseNova U1图像生成模型登陆ComfyUI平台
  • 11 日OpenCode x Ring 2.6 1T限时免费开放
  • 10 日ERNIE 5.1发布,预训练成本仅需对标模型6%
  • 9 日Ring-2.6-1T发布:万亿参数思维模型专为复杂任务设计
  • 8 日通过 API 中的新模型推进语音智能
  • 7 日SenseNova-U1开源8步蒸馏LoRA,推理速度大幅提升
  • 6 日GPT-5.5 Instant:更智能、更清晰、更个性化
  • 5 日语音克隆技术上线 真假难辨
  • 4 日从单张图像构建实时视频智能体:Runway Characters技术解析
  • 3 日模型别名新增"-latest"指向最新版本
  • 2 日GPT-5.5发布一周创营收新高
  • 1 日AntLingAGI开源Ling-2.6-1T模型,登陆Hugging Face平台
2026 年 4 月9
  • 30 日旗舰指令模型快速高效执行的秘诀:可靠基础设施与优化
  • 29 日Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体
  • 28 日小米开源MiMo-V2.5双模型,支持百万上下文与商用
  • 27 日Mistral AI 发布 Workflows 公开预览版,为企业AI工作流提供编排支持
  • 26 日DeepSeek V4模型限时2.5折优惠
  • 25 日迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源
  • 24 日OpenAI 最智能 AI 模型:GPT-5.5 登场,Token 成本降至 1/35、每兆瓦输出提升 50 倍
  • 23 日inclusionAI/LLaDA2.0-Uni
  • 22 日inclusionAI/DR-Venus-4B-RL 发布
全部日报 →
AI 日报每早八时
6月12日6月11日6月10日更早
AIHOT DAILY
2026年5月24日 · 周日

1产品发布/更新

StepAudio 2.5实时语音发布:副语言感知与人格化交互

StepAudio 2.5 Realtime是一款实时语音模型,能够深度理解用户语音中的语气、语速、停顿乃至微表情等副语言特征。它支持通过API接入自定义人格,允许设定个性、背景故事和语言风格,并提供了上万种原生人格选项,可组合出数百万种特征。产品还内置了5个可直接体验的预设人格,并经过RLHF调优,确保在复杂的角色扮演压力测试中也能保持角色一致性。该模型支持中文和英文。

X:阶跃星辰 StepFun (@StepFun_ai)
Models.dev:一个关于人工智能模型规格、定价和功能的开源数据库

近期发布了开源数据库Models.dev,专门收录人工智能模型的各项规格、定价及功能信息。该项目在GitHub公开,便于开发者查询和比较不同AI模型。其在Hacker News社区获得101点关注度,显示出技术社区对这类集中化、透明化的模型信息资源的较大兴趣。

Hacker News 热门(buzzing.cc 中文翻译)
Replit Agent与Squidler集成,实现全自动化AI质量保障

Replit Agent与Squidler已完成集成,形成一套完整的AI驱动质量保障闭环。用户可通过自然语言描述应用功能,由Replit Agent负责构建。构建完成后,Squidler会像真实用户一样对线上应用进行自动化测试,无需编写任何测试脚本。测试中发现的问题会自动反馈给Replit Agent进行修复。该流程已通过Squidler加入Replit的MCP库正式上线,实现了从构建、测试到修复的全自动化,显著降低了应用测试与维护的门槛。

X:Replit (@Replit)
v2.1.150版本更新

v2.1.150版本包含内部基础设施优化。此次更新主要聚焦于后台系统的改进,未引入任何用户可见的功能、界面或体验变更。

Claude Code:GitHub Releases(RSS)

2行业动态

微软称,使用人工智能的成本高于支付人工工资

微软发布报告指出,在特定工作场景中,部署和使用人工智能(AI)的成本目前已高于支付相应的人工工资。报告分析了基于“tokens”(令牌)和“agents”(智能体)的AI使用模式,发现其综合开销超过了雇佣人类员工完成同类任务的费用。这一发现揭示了当前企业应用AI技术面临的现实经济挑战。

Hacker News 热门(buzzing.cc 中文翻译)
消息称 Anthropic 最快下周完成逾 300 亿美元融资,有望推动估值反超 OpenAI

据彭博社报道,Anthropic即将完成一轮超300亿美元的融资,最快可能于下周敲定。此轮融资将使其估值突破9000亿美元,正式超越OpenAI,成为全球估值最高的AI初创企业。融资的迅速推进反映了市场的强烈追捧。同时,公司营收高速增长,预计第二季度营收将达109亿美元,环比增长超一倍,有望迎来首个盈利季度。

IT之家(RSS)
AI 替代入门级工作:科技行业受裁员冲击最重,74% CEO 冻结或缩减招聘

奥纬咨询研究发现,AI工具正被广泛用于入门级任务,导致企业招聘重心转向高级岗位,年轻人求职难度加大。科技行业受冲击最严重,74%的CEO已冻结或缩减招聘。计划削减初级岗位的比例从17%跃升至43%,而招聘转向中层岗位的比例则升至30%。尽管超90%的企业在部署AI,但多数仍处试点阶段。报告警告,过快裁员或忽视初级人才储备,可能对人才梯队造成长远风险。

IT之家(RSS)
加倍投入科学以赢得工业AI

Mistral AI宣布与物理AI先驱Emmi AI达成最终收购协议,旨在加强其在工业AI领域的领导地位。通过整合Emmi AI在物理仿真与数字孪生方面的专长,Mistral AI将提升其工程解决方案能力,并加速科学研发路线。Emmi AI的30余名研究员与工程师将加入Mistral AI团队,共同构建由物理AI驱动的综合技术栈。此次合作将为航空航天、汽车等高风险行业提供实时仿真与复杂问题解决平台,推动工业研发的突破性进展。

Mistral AI:News(网页)
Kling AI亮相戛纳,推动AI赋能电影制作

Kling AI在戛纳电影市场(Marché du Film)举办官方会议,首次登上这一世界顶级电影舞台。会议汇集全球电影专业人士,共同探讨AI如何融入实际电影制作流程。Kling AI已证明其能力可服务于动画长片、好莱坞剧集、实验短片及影院电影等多种创作形式。未来,Kling AI将继续推进电影级AI影像技术,与全球创作者合作,将更多“不可能”的故事呈现在银幕上。

X:可灵 Kling AI (@Kling_ai)
扩大与新加坡合作,推动AI安全规模化部署

我们正在扩大与新加坡的合作,以帮助安全地大规模部署AI。🇸🇬 与各国专家合作,我们的新项目将重点加速科学发现、加强大流行病防范并改善医疗保健。 了解更多 → https://goo.gle/49jGwjv

X:Google DeepMind (@GoogleDeepMind)

3论文研究

Nemotron-Labs 扩散语言模型实现光速级文本生成

NVIDIA 在 Hugging Face 发布了关于 Nemotron-Labs 扩散语言模型的技术博客。该研究聚焦于通过扩散语言模型架构大幅提升文本生成速度,目标是逼近“光速级”生成效率。文章可能介绍了该模型在生成速度上的突破,以及相较于传统自回归模型在延迟和吞吐量方面的性能优势。具体技术细节或对比数据需参考原文。

Hugging Face:Blog(RSS)

4技巧与观点

飞书-Claude Code桥接开源项目

feishu-claude-code-bridge是一个开源项目,可实现飞书与本机Claude Code CLI的双向连接。用户能从飞书消息中直接指挥Claude Code执行任务,Claude也能读取飞书中的工作上下文并创建、编辑飞书文档。其工作原理是将飞书消息转为Prompt通过命令行调用Claude CLI,并将流式输出实时同步回飞书。该模式可扩展连接Codex等其他本地工具。需注意,2026年6月15日起,Claude订阅计划对`claude -p`模式将独立计费。

X:宝玉 (@dotey)
12今日事件
7一手报道
0新模型
10信源
← 前一日历史后一日 →
VOL.2026.05.24·12 STORIES·AI HOT DAILY

AIHOT日报

二〇二六年五月二十四日 星期日DAILY · 每早八时
01

产品发布/更新

Product
4 篇

StepAudio 2.5实时语音发布:副语言感知与人格化交互

官方·XX:阶跃星辰 StepFun (@StepFun_ai)

StepAudio 2.5 Realtime是一款实时语音模型,能够深度理解用户语音中的语气、语速、停顿乃至微表情等副语言特征。它支持通过API接入自定义人格,允许设定个性、背景故事和语言风格,并提供了上万种原生人格选项,可组合出数百万种特征。产品还内置了5个可直接体验的预设人格,并经过RLHF调优,确保在复杂的角色扮演压力测试中也能保持角色一致性。该模型支持中文和英文。

Models.dev:一个关于人工智能模型规格、定价和功能的开源数据库

综合资讯Hacker News 热门(buzzing.cc 中文翻译)

近期发布了开源数据库Models.dev,专门收录人工智能模型的各项规格、定价及功能信息。该项目在GitHub公开,便于开发者查询和比较不同AI模型。其在Hacker News社区获得101点关注度,显示出技术社区对这类集中化、透明化的模型信息资源的较大兴趣。

Replit Agent与Squidler集成,实现全自动化AI质量保障

官方·XX:Replit (@Replit)

Replit Agent与Squidler已完成集成,形成一套完整的AI驱动质量保障闭环。用户可通过自然语言描述应用功能,由Replit Agent负责构建。构建完成后,Squidler会像真实用户一样对线上应用进行自动化测试,无需编写任何测试脚本。测试中发现的问题会自动反馈给Replit Agent进行修复。该流程已通过Squidler加入Replit的MCP库正式上线,实现了从构建、测试到修复的全自动化,显著降低了应用测试与维护的门槛。

v2.1.150版本更新

官方Claude Code:GitHub Releases(RSS)

v2.1.150版本包含内部基础设施优化。此次更新主要聚焦于后台系统的改进,未引入任何用户可见的功能、界面或体验变更。

02

行业动态

Industry
6 篇

微软称,使用人工智能的成本高于支付人工工资

综合资讯Hacker News 热门(buzzing.cc 中文翻译)

微软发布报告指出,在特定工作场景中,部署和使用人工智能(AI)的成本目前已高于支付相应的人工工资。报告分析了基于“tokens”(令牌)和“agents”(智能体)的AI使用模式,发现其综合开销超过了雇佣人类员工完成同类任务的费用。这一发现揭示了当前企业应用AI技术面临的现实经济挑战。

消息称 Anthropic 最快下周完成逾 300 亿美元融资,有望推动估值反超 OpenAI

综合资讯IT之家(RSS)

据彭博社报道,Anthropic即将完成一轮超300亿美元的融资,最快可能于下周敲定。此轮融资将使其估值突破9000亿美元,正式超越OpenAI,成为全球估值最高的AI初创企业。融资的迅速推进反映了市场的强烈追捧。同时,公司营收高速增长,预计第二季度营收将达109亿美元,环比增长超一倍,有望迎来首个盈利季度。

AI 替代入门级工作:科技行业受裁员冲击最重,74% CEO 冻结或缩减招聘

综合资讯IT之家(RSS)

奥纬咨询研究发现,AI工具正被广泛用于入门级任务,导致企业招聘重心转向高级岗位,年轻人求职难度加大。科技行业受冲击最严重,74%的CEO已冻结或缩减招聘。计划削减初级岗位的比例从17%跃升至43%,而招聘转向中层岗位的比例则升至30%。尽管超90%的企业在部署AI,但多数仍处试点阶段。报告警告,过快裁员或忽视初级人才储备,可能对人才梯队造成长远风险。

加倍投入科学以赢得工业AI

官方Mistral AI:News(网页)

Mistral AI宣布与物理AI先驱Emmi AI达成最终收购协议,旨在加强其在工业AI领域的领导地位。通过整合Emmi AI在物理仿真与数字孪生方面的专长,Mistral AI将提升其工程解决方案能力,并加速科学研发路线。Emmi AI的30余名研究员与工程师将加入Mistral AI团队,共同构建由物理AI驱动的综合技术栈。此次合作将为航空航天、汽车等高风险行业提供实时仿真与复杂问题解决平台,推动工业研发的突破性进展。

Kling AI亮相戛纳,推动AI赋能电影制作

官方·XX:可灵 Kling AI (@Kling_ai)

Kling AI在戛纳电影市场(Marché du Film)举办官方会议,首次登上这一世界顶级电影舞台。会议汇集全球电影专业人士,共同探讨AI如何融入实际电影制作流程。Kling AI已证明其能力可服务于动画长片、好莱坞剧集、实验短片及影院电影等多种创作形式。未来,Kling AI将继续推进电影级AI影像技术,与全球创作者合作,将更多“不可能”的故事呈现在银幕上。

扩大与新加坡合作,推动AI安全规模化部署

官方·XX:Google DeepMind (@GoogleDeepMind)

我们正在扩大与新加坡的合作,以帮助安全地大规模部署AI。🇸🇬 与各国专家合作,我们的新项目将重点加速科学发现、加强大流行病防范并改善医疗保健。 了解更多 → https://goo.gle/49jGwjv

03

论文研究

Research
1 篇

Nemotron-Labs 扩散语言模型实现光速级文本生成

官方Hugging Face:Blog(RSS)

NVIDIA 在 Hugging Face 发布了关于 Nemotron-Labs 扩散语言模型的技术博客。该研究聚焦于通过扩散语言模型架构大幅提升文本生成速度,目标是逼近“光速级”生成效率。文章可能介绍了该模型在生成速度上的突破,以及相较于传统自回归模型在延迟和吞吐量方面的性能优势。具体技术细节或对比数据需参考原文。

04

技巧与观点

Tips & Takes
1 篇

飞书-Claude Code桥接开源项目

X·KOLX:宝玉 (@dotey)

feishu-claude-code-bridge是一个开源项目,可实现飞书与本机Claude Code CLI的双向连接。用户能从飞书消息中直接指挥Claude Code执行任务,Claude也能读取飞书中的工作上下文并创建、编辑飞书文档。其工作原理是将飞书消息转为Prompt通过命令行调用Claude CLI,并将流式输出实时同步回飞书。该模式可扩展连接Codex等其他本地工具。需注意,2026年6月15日起,Claude订阅计划对`claude -p`模式将独立计费。

12
今日事件
7
一手报道
0
新模型
10
信源
← 前一日查看历史后一日 →
AI HOT · 编辑系统自动生成