AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
最新一期2026-06-12
2026 年 6 月12
  • 12 日Gemini Omni Flash 视频任务达 SOTA
  • 11 日DiffusionGemma:文本生成速度提升4倍的开源扩散模型
  • 10 日Claude Fable 5 和 Claude Mythos 5
  • 9 日小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型
  • 8 日Harness-1:基于强化学习训练的有状态搜索20B检索子智能体
  • 7 日GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码
  • 6 日Riverflow 2.5:可控制评分标准的图像模型
  • 5 日Nemotron 3.5 Content Safety:面向全球企业AI的可定制多模态安全
  • 4 日Grok Imagine 1.5 预览版发布
  • 3 日微软首款高级推理AI模型MAI-Thinking-1发布
  • 2 日MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型
  • 1 日OpenAI发布生物防御AI工具Rosalind
2026 年 5 月31
  • 31 日Nano Banana Pro与Nano Banana 2正式发布
  • 30 日OpenAI推出实时翻译模型,支持70+语言输入
  • 29 日Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级
  • 28 日Runway 推出 Model Context Protocol 服务器
  • 27 日谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题
  • 26 日面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN
  • 25 日Luma Agents 实现规模化真实 UGC 广告生成
  • 24 日StepAudio 2.5实时语音发布:副语言感知与人格化交互
  • 23 日首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布
  • 22 日Aleph 2.0 与 Edit Studio
  • 21 日Qwen3.7:智能体前沿
  • 20 日I/O 2026: 欢迎来到自主的 Gemini 时代
  • 19 日阿里云推出HappyHorse视频生成模型
  • 18 日Grok Imagine图像生成功能正式发布
  • 17 日社区协作再创佳绩,vLLM支持万亿级模型
  • 16 日MiniMax M2.7模型上线OrcaRouter平台
  • 15 日SenseNova U1技术报告发布,基于MoE架构开放模型权重
  • 14 日Hy3预览版登陆GMI,开源最强模型领跑
  • 13 日Claude Opus 4.7快速模式开放研究预览
  • 12 日SenseNova U1图像生成模型登陆ComfyUI平台
  • 11 日OpenCode x Ring 2.6 1T限时免费开放
  • 10 日ERNIE 5.1发布,预训练成本仅需对标模型6%
  • 9 日Ring-2.6-1T发布:万亿参数思维模型专为复杂任务设计
  • 8 日通过 API 中的新模型推进语音智能
  • 7 日SenseNova-U1开源8步蒸馏LoRA,推理速度大幅提升
  • 6 日GPT-5.5 Instant:更智能、更清晰、更个性化
  • 5 日语音克隆技术上线 真假难辨
  • 4 日从单张图像构建实时视频智能体:Runway Characters技术解析
  • 3 日模型别名新增"-latest"指向最新版本
  • 2 日GPT-5.5发布一周创营收新高
  • 1 日AntLingAGI开源Ling-2.6-1T模型,登陆Hugging Face平台
2026 年 4 月9
  • 30 日旗舰指令模型快速高效执行的秘诀:可靠基础设施与优化
  • 29 日Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体
  • 28 日小米开源MiMo-V2.5双模型,支持百万上下文与商用
  • 27 日Mistral AI 发布 Workflows 公开预览版,为企业AI工作流提供编排支持
  • 26 日DeepSeek V4模型限时2.5折优惠
  • 25 日迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源
  • 24 日OpenAI 最智能 AI 模型:GPT-5.5 登场,Token 成本降至 1/35、每兆瓦输出提升 50 倍
  • 23 日inclusionAI/LLaDA2.0-Uni
  • 22 日inclusionAI/DR-Venus-4B-RL 发布
全部日报 →
AI 日报每早八时
6月12日6月11日6月10日更早
AIHOT DAILY
2026年4月26日 · 周日

1模型发布/更新

DeepSeek V4模型限时2.5折优惠

DeepSeek推出V4模型限时2.5折优惠,其Pro版百万Token输出成本仅6元。模型分为Pro版(总参数1.6T)和Flash版(总参数284B),预训练数据均为32T。在应用中,专家模式对应Pro版,快速模式对应Flash版。测评显示其性能与Claude Opus 4.6持平,Agent能力与世界知识显著增强,并采用新注意力机制以降低计算需求。

X:歸藏 (@op7418)
DeepSeek-V4预览版正式发布,开启百万上下文高性价比时代

DeepSeek团队正式推出并开源了DeepSeek-V4预览版模型,标志着高性价比的百万上下文长度时代到来。该系列包含两个模型:DeepSeek-V4-Pro拥有1.6万亿总参数和490亿活跃参数,性能媲美顶级闭源模型;DeepSeek-V4-Flash则拥有2840亿总参数和130亿活跃参数,主打快速、高效与经济。模型现已在官方平台通过专家模式和即时模式开放试用,API也已同步更新。完整的技术报告和模型权重已在Hugging Face平台发布,供社区研究和应用。

X:swyx (@swyx)

2产品发布/更新

进化协调器TRINITY:动态组合前沿大模型,无需修改权重

Sakana AI在ICLR2026发表论文,提出TRINITY系统。该系统通过一个仅含不到2万参数、由无梯度进化算法优化出的轻量级协调器,在推理时动态组合多个专精大语言模型(如GPT-5、Gemini 2.5-Pro)。协调器在每轮对话中为外部模型分配“思考者”、“执行者”或“验证者”角色,协同解决复杂问题。TRINITY在LiveCodeBench上创造了86.2% pass@1的新纪录,并能零样本泛化至多个未见任务,平均表现超越所有单个组成模型。该研究体现了构建协同、多样化AI生态系统的愿景。

X:Sakana AI (@SakanaAILabs)
DeepSeek-V4-Pro API限时75折优惠

🔥DeepSeek-V4-Pro API 限时75折优惠,截止至2026年5月5日15:59(UTC时间)!切勿错过此次大幅折扣。 🛠️集成更新: 🔹Claude Code:将模型设置为 deepseek-v4-pro[1m] 即可解锁100万上下文! 🔹OpenCode:请更新至 v1.14.24+ 🔹OpenClaw:请更新至 v2026.4.24+ 查看最新官方API文档获取完整详情:https://api-docs.deepseek.com/quick_start/pricing

X:DeepSeek (@deepseek_ai)

3行业动态

耦合横断面与纵向非负矩阵分解揭示48,949名个体中主导的大脑衰老轨迹

研究团队开发了一种名为“耦合横断面与纵向非负矩阵分解”的新机器学习方法,通过同时分析横断面和纵向神经影像数据来捕捉主导的大脑衰老模式。该方法应用于来自iSTAGING研究的48,949名个体的神经影像数据,识别出七种独特、可重复且具有生物学相关性的神经解剖模式。量化个体对这些模式表达程度的负载系数,与认知、遗传和生活方式因素显示出显著关联。研究还开发了一个基于回归的工具,可在不重新运行整个框架的情况下估算外部队列的负载系数。这些发现有望改善神经退行性疾病的风险评估和治疗效果评价。该框架虽基于结构MRI演示,但可推广至其他成像模式和生物标志物类型。

Nature:Machine Learning 主题(RSS)
LEAF滤波器组初始化与噪声增强的频率分析

本研究深入分析了可学习前端LEAF的滤波器组初始化效果,覆盖语音识别、情感识别、声学场景分类和鸟类检测四项任务。实验表明,只要初始化覆盖整个频谱,性能即可保持高位,但滤波器参数几乎不调整;而均匀初始化虽会引起参数变化,性能却始终较低。这一现象与任务中的频率信息分布无关,凸显了初始化策略与LEAF固有归纳偏置的关键作用,对其在不同场景下的适应性与可解释性提出了质疑。实验代码已公开。

Nature:Machine Learning 主题(RSS)

4论文研究

对齐存在“幻想曲”问题:当AI将不完整提示视为完整意图时

当前AI助手训练基于用户能清晰表达目标的假设,但行为研究表明,人们常在目标未成形时就开始交互,导致AI将不完整提示视为完整意图,产生名为“幻想曲交互”的对齐失败。作者主张,对齐研究需转向将AI设计为能主动帮助用户随时间形成和细化意图的认知支持系统,而非视用户为理性预言者。这需要融合机器学习、界面设计与行为科学的跨学科方法。现有干预措施不足,本文提出了新的研究议程,以设计和评估能更好帮助人类应对任务不确定性的AI系统。

arXiv:cs.AI(全量分类)
大型语言模型经济因果推理中的意识形态偏见

研究通过扩展EconCausal基准,引入1,056个意识形态争议案例,系统评估了20个先进大型语言模型。这些案例源于10,490个经实证验证的因果三元组,涉及干预导向与市场导向观点的分歧。结果显示,争议问题的准确率普遍较低,且在18个模型中,当实证因果方向符合干预导向预期时,模型准确率显著更高。模型的错误预测也明显偏向干预导向,且单样本提示未能消除此倾向。这表明LLMs在意识形态争议经济问题上不仅准确性下降,而且在一个方向上系统性更不可靠,凸显了在高风险经济政策场景中进行方向感知评估的必要性。

arXiv:cs.AI(全量分类)
为黑盒划定边界:面向AI风险监管的统计认证框架

当前AI系统已在贷款审批、刑事调查标记、自动驾驶刹车等高风险领域做出决策,欧盟《人工智能法案》等监管框架要求系统在部署前证明安全性,但均未界定“可接受风险”的量化标准,也缺乏验证是否达标的可行方法。研究借鉴航空认证范式,提出一个两阶段统计认证框架:第一阶段由主管机构明确设定可接受失败概率δ与操作输入域ε;第二阶段通过RoMA与gRoMA统计验证工具,在不依赖模型内部结构的前提下,计算出系统真实失败率的可审计上限。该框架适用于任意架构的黑盒模型,能将监管责任前移至开发方,并与现有法律体系衔接。

arXiv:cs.AI(全量分类)

5技巧与观点

GPT-5.5 提示指南

OpenAI 针对新发布的 GPT-5.5 API 模型发布了详细的提示指南。核心建议包括:在处理多步骤任务时,应在调用工具前先向用户发送简短的状态更新,以提升交互体验。官方强调 GPT-5.5 应被视为一个需要重新调优的新模型系列,而非 GPT-5.2 或 GPT-5.4 的直接替代品,建议从零开始构建提示,而非沿用旧有提示。开发者可通过 `openai-docs` 技能使用 `$openai-docs migrate this project to gpt-5.5` 命令来辅助代码迁移,官方升级指南中还包含了轻量的提示词改写建议。

Simon Willison 博客
10今日事件
7一手报道
2新模型
7信源
← 前一日历史后一日 →
VOL.2026.04.26·10 STORIES·AI HOT DAILY

AIHOT日报

二〇二六年四月二十六日 星期日DAILY · 每早八时
01

模型发布/更新

Model Releases
2 篇

DeepSeek V4模型限时2.5折优惠

X·KOLX:歸藏 (@op7418)

DeepSeek推出V4模型限时2.5折优惠,其Pro版百万Token输出成本仅6元。模型分为Pro版(总参数1.6T)和Flash版(总参数284B),预训练数据均为32T。在应用中,专家模式对应Pro版,快速模式对应Flash版。测评显示其性能与Claude Opus 4.6持平,Agent能力与世界知识显著增强,并采用新注意力机制以降低计算需求。

DeepSeek-V4预览版正式发布,开启百万上下文高性价比时代

X·KOLX:swyx (@swyx)

DeepSeek团队正式推出并开源了DeepSeek-V4预览版模型,标志着高性价比的百万上下文长度时代到来。该系列包含两个模型:DeepSeek-V4-Pro拥有1.6万亿总参数和490亿活跃参数,性能媲美顶级闭源模型;DeepSeek-V4-Flash则拥有2840亿总参数和130亿活跃参数,主打快速、高效与经济。模型现已在官方平台通过专家模式和即时模式开放试用,API也已同步更新。完整的技术报告和模型权重已在Hugging Face平台发布,供社区研究和应用。

02

产品发布/更新

Product
2 篇

进化协调器TRINITY:动态组合前沿大模型,无需修改权重

官方·XX:Sakana AI (@SakanaAILabs)

Sakana AI在ICLR2026发表论文,提出TRINITY系统。该系统通过一个仅含不到2万参数、由无梯度进化算法优化出的轻量级协调器,在推理时动态组合多个专精大语言模型(如GPT-5、Gemini 2.5-Pro)。协调器在每轮对话中为外部模型分配“思考者”、“执行者”或“验证者”角色,协同解决复杂问题。TRINITY在LiveCodeBench上创造了86.2% pass@1的新纪录,并能零样本泛化至多个未见任务,平均表现超越所有单个组成模型。该研究体现了构建协同、多样化AI生态系统的愿景。

DeepSeek-V4-Pro API限时75折优惠

官方·XX:DeepSeek (@deepseek_ai)

🔥DeepSeek-V4-Pro API 限时75折优惠,截止至2026年5月5日15:59(UTC时间)!切勿错过此次大幅折扣。 🛠️集成更新: 🔹Claude Code:将模型设置为 deepseek-v4-pro[1m] 即可解锁100万上下文! 🔹OpenCode:请更新至 v1.14.24+ 🔹OpenClaw:请更新至 v2026.4.24+ 查看最新官方API文档获取完整详情:https://api-docs.deepseek.com/quick_start/pricing

03

行业动态

Industry
2 篇

耦合横断面与纵向非负矩阵分解揭示48,949名个体中主导的大脑衰老轨迹

官方Nature:Machine Learning 主题(RSS)

研究团队开发了一种名为“耦合横断面与纵向非负矩阵分解”的新机器学习方法,通过同时分析横断面和纵向神经影像数据来捕捉主导的大脑衰老模式。该方法应用于来自iSTAGING研究的48,949名个体的神经影像数据,识别出七种独特、可重复且具有生物学相关性的神经解剖模式。量化个体对这些模式表达程度的负载系数,与认知、遗传和生活方式因素显示出显著关联。研究还开发了一个基于回归的工具,可在不重新运行整个框架的情况下估算外部队列的负载系数。这些发现有望改善神经退行性疾病的风险评估和治疗效果评价。该框架虽基于结构MRI演示,但可推广至其他成像模式和生物标志物类型。

LEAF滤波器组初始化与噪声增强的频率分析

官方Nature:Machine Learning 主题(RSS)

本研究深入分析了可学习前端LEAF的滤波器组初始化效果,覆盖语音识别、情感识别、声学场景分类和鸟类检测四项任务。实验表明,只要初始化覆盖整个频谱,性能即可保持高位,但滤波器参数几乎不调整;而均匀初始化虽会引起参数变化,性能却始终较低。这一现象与任务中的频率信息分布无关,凸显了初始化策略与LEAF固有归纳偏置的关键作用,对其在不同场景下的适应性与可解释性提出了质疑。实验代码已公开。

04

论文研究

Research
3 篇

对齐存在“幻想曲”问题:当AI将不完整提示视为完整意图时

学术论文arXiv:cs.AI(全量分类)

当前AI助手训练基于用户能清晰表达目标的假设,但行为研究表明,人们常在目标未成形时就开始交互,导致AI将不完整提示视为完整意图,产生名为“幻想曲交互”的对齐失败。作者主张,对齐研究需转向将AI设计为能主动帮助用户随时间形成和细化意图的认知支持系统,而非视用户为理性预言者。这需要融合机器学习、界面设计与行为科学的跨学科方法。现有干预措施不足,本文提出了新的研究议程,以设计和评估能更好帮助人类应对任务不确定性的AI系统。

大型语言模型经济因果推理中的意识形态偏见

学术论文arXiv:cs.AI(全量分类)

研究通过扩展EconCausal基准,引入1,056个意识形态争议案例,系统评估了20个先进大型语言模型。这些案例源于10,490个经实证验证的因果三元组,涉及干预导向与市场导向观点的分歧。结果显示,争议问题的准确率普遍较低,且在18个模型中,当实证因果方向符合干预导向预期时,模型准确率显著更高。模型的错误预测也明显偏向干预导向,且单样本提示未能消除此倾向。这表明LLMs在意识形态争议经济问题上不仅准确性下降,而且在一个方向上系统性更不可靠,凸显了在高风险经济政策场景中进行方向感知评估的必要性。

为黑盒划定边界:面向AI风险监管的统计认证框架

学术论文arXiv:cs.AI(全量分类)

当前AI系统已在贷款审批、刑事调查标记、自动驾驶刹车等高风险领域做出决策,欧盟《人工智能法案》等监管框架要求系统在部署前证明安全性,但均未界定“可接受风险”的量化标准,也缺乏验证是否达标的可行方法。研究借鉴航空认证范式,提出一个两阶段统计认证框架:第一阶段由主管机构明确设定可接受失败概率δ与操作输入域ε;第二阶段通过RoMA与gRoMA统计验证工具,在不依赖模型内部结构的前提下,计算出系统真实失败率的可审计上限。该框架适用于任意架构的黑盒模型,能将监管责任前移至开发方,并与现有法律体系衔接。

05

技巧与观点

Tips & Takes
1 篇

GPT-5.5 提示指南

综合资讯Simon Willison 博客

OpenAI 针对新发布的 GPT-5.5 API 模型发布了详细的提示指南。核心建议包括:在处理多步骤任务时,应在调用工具前先向用户发送简短的状态更新,以提升交互体验。官方强调 GPT-5.5 应被视为一个需要重新调优的新模型系列,而非 GPT-5.2 或 GPT-5.4 的直接替代品,建议从零开始构建提示,而非沿用旧有提示。开发者可通过 `openai-docs` 技能使用 `$openai-docs migrate this project to gpt-5.5` 命令来辅助代码迁移,官方升级指南中还包含了轻量的提示词改写建议。

10
今日事件
7
一手报道
2
新模型
7
信源
← 前一日查看历史后一日 →
AI HOT · 编辑系统自动生成