AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
最新一期2026-06-12
2026 年 6 月12
  • 12 日Gemini Omni Flash 视频任务达 SOTA
  • 11 日DiffusionGemma:文本生成速度提升4倍的开源扩散模型
  • 10 日Claude Fable 5 和 Claude Mythos 5
  • 9 日小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型
  • 8 日Harness-1:基于强化学习训练的有状态搜索20B检索子智能体
  • 7 日GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码
  • 6 日Riverflow 2.5:可控制评分标准的图像模型
  • 5 日Nemotron 3.5 Content Safety:面向全球企业AI的可定制多模态安全
  • 4 日Grok Imagine 1.5 预览版发布
  • 3 日微软首款高级推理AI模型MAI-Thinking-1发布
  • 2 日MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型
  • 1 日OpenAI发布生物防御AI工具Rosalind
2026 年 5 月31
  • 31 日Nano Banana Pro与Nano Banana 2正式发布
  • 30 日OpenAI推出实时翻译模型,支持70+语言输入
  • 29 日Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级
  • 28 日Runway 推出 Model Context Protocol 服务器
  • 27 日谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题
  • 26 日面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN
  • 25 日Luma Agents 实现规模化真实 UGC 广告生成
  • 24 日StepAudio 2.5实时语音发布:副语言感知与人格化交互
  • 23 日首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布
  • 22 日Aleph 2.0 与 Edit Studio
  • 21 日Qwen3.7:智能体前沿
  • 20 日I/O 2026: 欢迎来到自主的 Gemini 时代
  • 19 日阿里云推出HappyHorse视频生成模型
  • 18 日Grok Imagine图像生成功能正式发布
  • 17 日社区协作再创佳绩,vLLM支持万亿级模型
  • 16 日MiniMax M2.7模型上线OrcaRouter平台
  • 15 日SenseNova U1技术报告发布,基于MoE架构开放模型权重
  • 14 日Hy3预览版登陆GMI,开源最强模型领跑
  • 13 日Claude Opus 4.7快速模式开放研究预览
  • 12 日SenseNova U1图像生成模型登陆ComfyUI平台
  • 11 日OpenCode x Ring 2.6 1T限时免费开放
  • 10 日ERNIE 5.1发布,预训练成本仅需对标模型6%
  • 9 日Ring-2.6-1T发布:万亿参数思维模型专为复杂任务设计
  • 8 日通过 API 中的新模型推进语音智能
  • 7 日SenseNova-U1开源8步蒸馏LoRA,推理速度大幅提升
  • 6 日GPT-5.5 Instant:更智能、更清晰、更个性化
  • 5 日语音克隆技术上线 真假难辨
  • 4 日从单张图像构建实时视频智能体:Runway Characters技术解析
  • 3 日模型别名新增"-latest"指向最新版本
  • 2 日GPT-5.5发布一周创营收新高
  • 1 日AntLingAGI开源Ling-2.6-1T模型,登陆Hugging Face平台
2026 年 4 月9
  • 30 日旗舰指令模型快速高效执行的秘诀:可靠基础设施与优化
  • 29 日Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体
  • 28 日小米开源MiMo-V2.5双模型,支持百万上下文与商用
  • 27 日Mistral AI 发布 Workflows 公开预览版,为企业AI工作流提供编排支持
  • 26 日DeepSeek V4模型限时2.5折优惠
  • 25 日迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源
  • 24 日OpenAI 最智能 AI 模型:GPT-5.5 登场,Token 成本降至 1/35、每兆瓦输出提升 50 倍
  • 23 日inclusionAI/LLaDA2.0-Uni
  • 22 日inclusionAI/DR-Venus-4B-RL 发布
全部日报 →
AI 日报每早八时
6月12日6月11日6月10日更早
AIHOT DAILY
2026年5月2日 · 周六

1模型发布/更新

GPT-5.5发布一周创营收新高

GPT-5.5发布已有一周,这已经是我们迄今为止最强大的模型发布。 API收入增长速度比以往任何版本都快两倍以上,而随着企业对智能编码工具的需求持续攀升,Codex在不到七天内收入翻倍。

X:OpenAI (@OpenAI)

2产品发布/更新

可用ChatGPT账户登录OpenClaw

现在你可以用你的ChatGPT账户登录OpenClaw,并在那里使用你的订阅服务! 祝你捕龙虾愉快。

X:Sam Altman (@sama)
Runway全平台上线 移动端创作无界限

创造一切。无论身处何地。使用任何设备。Runway 现已登陆 Android 和 iOS 平台。 通过下方链接开始使用。

X:Runway (@runwayml)
就是这么简单。

就是这么简单。

X:OpenAI Developers (@OpenAIDevs)
Introducing Dynamic Workflows:可随租户流转的持久执行功能

Dynamic Workflows 是一个函数库,支持将持久执行实时路由至租户提供的代码。该库基于 Dynamic Workers 构建,使平台能够以近乎零闲置成本为数百万个独特工作流提供服务。它允许平台根据租户需求动态分配执行资源,实现了工作流与特定租户代码的即时绑定,大幅降低了多租户场景下的运营开销和资源浪费。

Cloudflare Blog
为高频聊天主题创建专属笔记本

为你最常聊的话题安个家。🗂️ 滑动了解如何在Gemini中使用记事本保持条理,并在回复中告诉我们你如何使用它们。

X:Gemini (@GeminiApp)
Claude Desktop v2.1.126 版本更新

本次更新增强了模型网关集成,当配置指向兼容网关时,可直接在模型选择器中列出可用模型。新增了 `claude project purge` 命令,用于彻底清理项目状态数据。OAuth登录流程得到优化,支持在浏览器回调失败时手动粘贴授权码,并修复了多种网络环境下的登录问题。安全方面,修复了 `allowManagedDomainsOnly` 等设置可能被忽略的漏洞。此外,还解决了图像粘贴过大导致会话中断、远程会话误报“流空闲超时”、Windows系统下特定文本渲染乱码以及多项工具在特定场景下不可用等数十项错误。

Claude Code:GitHub Releases(RSS)

3行业动态

Claude开发者大会下周回归

Code with Claude,我们的开发者大会,下周回归。 无论你是刚刚开始使用 Claude Code,还是已经构建了一段时间,都有适合你的环节。 注册观看直播:http://claude.com/code-with-claude

X:Claude (@claudeai)
谷歌I/O舞台征集创意编程作品

认为你的氛围编程和创意能登上#GoogleIO主舞台吗?展示给我们看。 随着我们进入节目开始的倒计时,使用@GeminiApp或@GoogleAIStudio构建的最佳创意将被重点展示——比如蛋白质模拟器、物理引擎或基于数学的艺术。🔢

X:Google DeepMind (@GoogleDeepMind)

4论文研究

强化智能体:面向工具调用智能体的推理时反馈机制

本文提出一种将评估机制嵌入工具调用智能体实时执行循环的新方法。通过引入一个专门的评审员智能体,在推理时对主智能体的中间决策轨迹进行即时评估,并生成结构化反馈。这使得主智能体能在单次运行中动态调整其工具选择与参数调用,无需依赖传统的提示调整或模型重训练。该实时干预机制旨在直接纠正错误,提升了工具使用的准确性与可靠性,突破了传统后验评估无法在运行中修正行为的局限。本工作已被ACL 2026的自然语言生成、评估与指标研讨会接收。

Apple Machine Learning Research(RSS)

5技巧与观点

2026 年的 AI 提示方式与 2022 年 ChatGPT 推出时大不相同。

吴恩达(Andrew Ng)推出新课程《人人皆可的 AI 提示技巧》,旨在帮助不同水平的用户成为 AI 高级使用者。课程教授适用于 ChatGPT、Gemini、Claude 等工具的通用提示技巧,核心内容包括:利用深度研究模式生成复杂问题的详尽报告;为 AI 提供远超常人认知的丰富文档与图像上下文;在重要决策时让 AI 进行长时间深度思考;以及使用 AI 生成图像、分析数据、构建简单游戏和网站。课程还将剖析大模型的工作原理,帮助学员判断何时可信赖 AI 的答案。

X:小北 (@frxiaobei)
GPT-Image-2.0反讽提示词爆红,模仿拙劣鼠标绘图

GPT-Image-2.0近期因一系列提示词再度引发关注,其中一条要求AI以“笨拙、潦草、极其拙劣”的方式重绘图像,并模仿MS Paint鼠标绘图的低质量像素感,形成刻意粗糙的反差效果。该提示词通过强调“糟糕到可笑”的指令,利用AI精准执行反讽式需求,迅速在社交平台形成病毒式传播,展现了用户对AI图像生成工具创意玩法的探索。

X:歸藏 (@op7418)
强化学习双刃剑效应:已知领域提升性能,未知领域易致模型幻觉

强化学习在已知领域能提升模型性能,但在未知领域可能导致模型产生幻觉,误以为在执行其他训练过的任务。这一现象在GPT-5.5等大模型的ARC AGI 3基准测试中有所体现,其得分仅为0.43%,与Claude 4.6、Gemini 3.1等模型表现相近。分析指出GPT-5.5的主要失败原因包括:局部效应正确但世界模型错误、从训练数据中提取的抽象层级不当,以及虽解决问题却未强化奖励机制。深入分析此类失败案例,有助于全面理解大模型在特定模态上的能力局限与改进方向。

X:Francois Chollet (@fchollet)
玻璃骏马展现超现实艺术境界

哇,这匹玻璃马简直达到了不同层次的超现实感 🐴🤯 顺便特别感谢 @MrDasOnX 在 PixVerse 上用 HappyHorse 完美创作了这件马主题作品!☺️

X:PixVerse (@PixVerse_)
安装孵化宠物技能创造专属宠物

要创建你自己的宠物,请安装hatch-pet技能:

X:OpenAI Developers (@OpenAIDevs)
本周的积极信号:AI在医疗、教育、农业与科研领域的突破性进展

近期多项进展展现了AI的巨大积极影响。医疗领域,Mayo Clinic的AI能通过常规CT提前最多三年检测胰腺癌,强生利用AI将新药线索生成时间减半。教育方面,哈佛研究显示AI导师使学生学习效果翻倍,泰国培训16万名教师惠及330万学生。农业上,AI能以约88%准确率预测害虫爆发。科研中,AI快速筛查NASA数据,新发现超一万颗系外行星候选。此外,香港推出AI洪水预报系统,Atlassian和Twilio等公司也因AI驱动业绩增长并上调预期。这些案例平衡了AI风险,凸显其创新潜力。

Tomer Tunguz 博客(VC 分析)
能生成通过测试的代码模型,不等于能产出正确、安全、可维护、架构良好软件的模型
17今日事件
13一手报道
1新模型
16信源
← 前一日历史后一日 →
VOL.2026.05.02·17 STORIES·AI HOT DAILY

AIHOT日报

二〇二六年五月二日 星期六DAILY · 每早八时
01

模型发布/更新

Model Releases
1 篇

GPT-5.5发布一周创营收新高

官方·XX:OpenAI (@OpenAI)

GPT-5.5发布已有一周,这已经是我们迄今为止最强大的模型发布。 API收入增长速度比以往任何版本都快两倍以上,而随着企业对智能编码工具的需求持续攀升,Codex在不到七天内收入翻倍。

02

产品发布/更新

Product
6 篇

可用ChatGPT账户登录OpenClaw

X·KOLX:Sam Altman (@sama)

现在你可以用你的ChatGPT账户登录OpenClaw,并在那里使用你的订阅服务! 祝你捕龙虾愉快。

Runway全平台上线 移动端创作无界限

官方·XX:Runway (@runwayml)

创造一切。无论身处何地。使用任何设备。Runway 现已登陆 Android 和 iOS 平台。 通过下方链接开始使用。

就是这么简单。

官方·XX:OpenAI Developers (@OpenAIDevs)

就是这么简单。

当前大量代码由AI生成,但其实际意义需审慎评估。能生成可通过给定测试的代码模型,与能产出真正正确、安全、可维护且架构良好软件的模型存在本质区别。AI生成的代码可能在特定测试用例下运行成功,却未必满足软件工程对长期维护性、安全性、架构设计及潜在边界情况处理的高标准要求。这一差距揭示了当前AI编程工具的核心局限,提醒开发者需以批判性眼光看待其输出,而非完全替代专业开发实践。

Gary Marcus:The Road to AI We Can Trust(RSS)

Introducing Dynamic Workflows:可随租户流转的持久执行功能

官方Cloudflare Blog

Dynamic Workflows 是一个函数库,支持将持久执行实时路由至租户提供的代码。该库基于 Dynamic Workers 构建,使平台能够以近乎零闲置成本为数百万个独特工作流提供服务。它允许平台根据租户需求动态分配执行资源,实现了工作流与特定租户代码的即时绑定,大幅降低了多租户场景下的运营开销和资源浪费。

为高频聊天主题创建专属笔记本

官方·XX:Gemini (@GeminiApp)

为你最常聊的话题安个家。🗂️ 滑动了解如何在Gemini中使用记事本保持条理,并在回复中告诉我们你如何使用它们。

Claude Desktop v2.1.126 版本更新

官方Claude Code:GitHub Releases(RSS)

本次更新增强了模型网关集成,当配置指向兼容网关时,可直接在模型选择器中列出可用模型。新增了 `claude project purge` 命令,用于彻底清理项目状态数据。OAuth登录流程得到优化,支持在浏览器回调失败时手动粘贴授权码,并修复了多种网络环境下的登录问题。安全方面,修复了 `allowManagedDomainsOnly` 等设置可能被忽略的漏洞。此外,还解决了图像粘贴过大导致会话中断、远程会话误报“流空闲超时”、Windows系统下特定文本渲染乱码以及多项工具在特定场景下不可用等数十项错误。

03

行业动态

Industry
2 篇

Claude开发者大会下周回归

官方·XX:Claude (@claudeai)

Code with Claude,我们的开发者大会,下周回归。 无论你是刚刚开始使用 Claude Code,还是已经构建了一段时间,都有适合你的环节。 注册观看直播:http://claude.com/code-with-claude

谷歌I/O舞台征集创意编程作品

官方·XX:Google DeepMind (@GoogleDeepMind)

认为你的氛围编程和创意能登上#GoogleIO主舞台吗?展示给我们看。 随着我们进入节目开始的倒计时,使用@GeminiApp或@GoogleAIStudio构建的最佳创意将被重点展示——比如蛋白质模拟器、物理引擎或基于数学的艺术。🔢

04

论文研究

Research
1 篇

强化智能体:面向工具调用智能体的推理时反馈机制

学术机构Apple Machine Learning Research(RSS)

本文提出一种将评估机制嵌入工具调用智能体实时执行循环的新方法。通过引入一个专门的评审员智能体,在推理时对主智能体的中间决策轨迹进行即时评估,并生成结构化反馈。这使得主智能体能在单次运行中动态调整其工具选择与参数调用,无需依赖传统的提示调整或模型重训练。该实时干预机制旨在直接纠正错误,提升了工具使用的准确性与可靠性,突破了传统后验评估无法在运行中修正行为的局限。本工作已被ACL 2026的自然语言生成、评估与指标研讨会接收。

05

技巧与观点

Tips & Takes
7 篇

2026 年的 AI 提示方式与 2022 年 ChatGPT 推出时大不相同。

X·KOLX:小北 (@frxiaobei)

吴恩达(Andrew Ng)推出新课程《人人皆可的 AI 提示技巧》,旨在帮助不同水平的用户成为 AI 高级使用者。课程教授适用于 ChatGPT、Gemini、Claude 等工具的通用提示技巧,核心内容包括:利用深度研究模式生成复杂问题的详尽报告;为 AI 提供远超常人认知的丰富文档与图像上下文;在重要决策时让 AI 进行长时间深度思考;以及使用 AI 生成图像、分析数据、构建简单游戏和网站。课程还将剖析大模型的工作原理,帮助学员判断何时可信赖 AI 的答案。

GPT-Image-2.0反讽提示词爆红,模仿拙劣鼠标绘图

X·KOLX:歸藏 (@op7418)

GPT-Image-2.0近期因一系列提示词再度引发关注,其中一条要求AI以“笨拙、潦草、极其拙劣”的方式重绘图像,并模仿MS Paint鼠标绘图的低质量像素感,形成刻意粗糙的反差效果。该提示词通过强调“糟糕到可笑”的指令,利用AI精准执行反讽式需求,迅速在社交平台形成病毒式传播,展现了用户对AI图像生成工具创意玩法的探索。

强化学习双刃剑效应:已知领域提升性能,未知领域易致模型幻觉

X·KOLX:Francois Chollet (@fchollet)

强化学习在已知领域能提升模型性能,但在未知领域可能导致模型产生幻觉,误以为在执行其他训练过的任务。这一现象在GPT-5.5等大模型的ARC AGI 3基准测试中有所体现,其得分仅为0.43%,与Claude 4.6、Gemini 3.1等模型表现相近。分析指出GPT-5.5的主要失败原因包括:局部效应正确但世界模型错误、从训练数据中提取的抽象层级不当,以及虽解决问题却未强化奖励机制。深入分析此类失败案例,有助于全面理解大模型在特定模态上的能力局限与改进方向。

玻璃骏马展现超现实艺术境界

官方·XX:PixVerse (@PixVerse_)

哇,这匹玻璃马简直达到了不同层次的超现实感 🐴🤯 顺便特别感谢 @MrDasOnX 在 PixVerse 上用 HappyHorse 完美创作了这件马主题作品!☺️

安装孵化宠物技能创造专属宠物

官方·XX:OpenAI Developers (@OpenAIDevs)

要创建你自己的宠物,请安装hatch-pet技能:

本周的积极信号:AI在医疗、教育、农业与科研领域的突破性进展

大咖博客Tomer Tunguz 博客(VC 分析)

近期多项进展展现了AI的巨大积极影响。医疗领域,Mayo Clinic的AI能通过常规CT提前最多三年检测胰腺癌,强生利用AI将新药线索生成时间减半。教育方面,哈佛研究显示AI导师使学生学习效果翻倍,泰国培训16万名教师惠及330万学生。农业上,AI能以约88%准确率预测害虫爆发。科研中,AI快速筛查NASA数据,新发现超一万颗系外行星候选。此外,香港推出AI洪水预报系统,Atlassian和Twilio等公司也因AI驱动业绩增长并上调预期。这些案例平衡了AI风险,凸显其创新潜力。

能生成通过测试的代码模型,不等于能产出正确、安全、可维护、架构良好软件的模型

大咖博客Gary Marcus:The Road to AI We Can Trust(RSS)

当前大量代码由AI生成,但其实际意义需审慎评估。能生成可通过给定测试的代码模型,与能产出真正正确、安全、可维护且架构良好软件的模型存在本质区别。AI生成的代码可能在特定测试用例下运行成功,却未必满足软件工程对长期维护性、安全性、架构设计及潜在边界情况处理的高标准要求。这一差距揭示了当前AI编程工具的核心局限,提醒开发者需以批判性眼光看待其输出,而非完全替代专业开发实践。

17
今日事件
13
一手报道
1
新模型
16
信源
← 前一日查看历史后一日 →
AI HOT · 编辑系统自动生成