AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
最新一期2026-06-12
2026 年 6 月12
  • 12 日Gemini Omni Flash 视频任务达 SOTA
  • 11 日DiffusionGemma:文本生成速度提升4倍的开源扩散模型
  • 10 日Claude Fable 5 和 Claude Mythos 5
  • 9 日小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型
  • 8 日Harness-1:基于强化学习训练的有状态搜索20B检索子智能体
  • 7 日GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码
  • 6 日Riverflow 2.5:可控制评分标准的图像模型
  • 5 日Nemotron 3.5 Content Safety:面向全球企业AI的可定制多模态安全
  • 4 日Grok Imagine 1.5 预览版发布
  • 3 日微软首款高级推理AI模型MAI-Thinking-1发布
  • 2 日MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型
  • 1 日OpenAI发布生物防御AI工具Rosalind
2026 年 5 月31
  • 31 日Nano Banana Pro与Nano Banana 2正式发布
  • 30 日OpenAI推出实时翻译模型,支持70+语言输入
  • 29 日Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级
  • 28 日Runway 推出 Model Context Protocol 服务器
  • 27 日谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题
  • 26 日面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN
  • 25 日Luma Agents 实现规模化真实 UGC 广告生成
  • 24 日StepAudio 2.5实时语音发布:副语言感知与人格化交互
  • 23 日首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布
  • 22 日Aleph 2.0 与 Edit Studio
  • 21 日Qwen3.7:智能体前沿
  • 20 日I/O 2026: 欢迎来到自主的 Gemini 时代
  • 19 日阿里云推出HappyHorse视频生成模型
  • 18 日Grok Imagine图像生成功能正式发布
  • 17 日社区协作再创佳绩,vLLM支持万亿级模型
  • 16 日MiniMax M2.7模型上线OrcaRouter平台
  • 15 日SenseNova U1技术报告发布,基于MoE架构开放模型权重
  • 14 日Hy3预览版登陆GMI,开源最强模型领跑
  • 13 日Claude Opus 4.7快速模式开放研究预览
  • 12 日SenseNova U1图像生成模型登陆ComfyUI平台
  • 11 日OpenCode x Ring 2.6 1T限时免费开放
  • 10 日ERNIE 5.1发布,预训练成本仅需对标模型6%
  • 9 日Ring-2.6-1T发布:万亿参数思维模型专为复杂任务设计
  • 8 日通过 API 中的新模型推进语音智能
  • 7 日SenseNova-U1开源8步蒸馏LoRA,推理速度大幅提升
  • 6 日GPT-5.5 Instant:更智能、更清晰、更个性化
  • 5 日语音克隆技术上线 真假难辨
  • 4 日从单张图像构建实时视频智能体:Runway Characters技术解析
  • 3 日模型别名新增"-latest"指向最新版本
  • 2 日GPT-5.5发布一周创营收新高
  • 1 日AntLingAGI开源Ling-2.6-1T模型,登陆Hugging Face平台
2026 年 4 月9
  • 30 日旗舰指令模型快速高效执行的秘诀:可靠基础设施与优化
  • 29 日Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体
  • 28 日小米开源MiMo-V2.5双模型,支持百万上下文与商用
  • 27 日Mistral AI 发布 Workflows 公开预览版,为企业AI工作流提供编排支持
  • 26 日DeepSeek V4模型限时2.5折优惠
  • 25 日迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源
  • 24 日OpenAI 最智能 AI 模型:GPT-5.5 登场,Token 成本降至 1/35、每兆瓦输出提升 50 倍
  • 23 日inclusionAI/LLaDA2.0-Uni
  • 22 日inclusionAI/DR-Venus-4B-RL 发布
全部日报 →
AI 日报每早八时
6月12日6月11日6月10日更早
AIHOT DAILY
2026年5月18日 · 周一

1产品发布/更新

Grok Imagine图像生成功能正式发布

Grok Imagine 现已正式发布 所有人都可使用 基于我们最新的文本到图像模型 能够生成逼真、高质量的图像 支持多种宽高比 现在可在 X 上使用

X:Elon Musk (@elonmusk, xAI)
手机端ChatGPT应用集成Codex构建功能

你可以在手机端通过ChatGPT应用中的Codex直接构建项目

X:Greg Brockman (@gdb)
Zerostack——一款采用纯Rust语言编写、受Unix启发的编程代理

Zerostack是一款采用纯Rust语言编写、受Unix哲学启发的编程代理工具,已正式发布1.0.0版本并在Rust包管理平台crates.io上提供。该发布在技术社区Hacker News上获得115点关注,反映出开发者对其的高度兴趣。Rust语言以内存安全和性能见称,Unix设计强调简洁与模块化,Zerostack结合两者优势,旨在提升编程效率,为代码辅助领域带来新选择。

Hacker News 热门(buzzing.cc 中文翻译)

2论文研究

Anthropic Claude 5天攻破Apple M5 macOS内核漏洞:5年数十亿防线,被AI一举击穿

Anthropic的Claude Mythos Preview在5天内,协助安全团队Calif成功构建并演示了首个公开的、针对Apple M5芯片macOS内核的内存破坏提权利用链。该攻击绕过了苹果耗时5年、投入数十亿美元打造的MIE硬件级内存完整性防护,从普通用户权限通过纯数据操作即可获得root权限。苹果已在后续更新中修复漏洞并致谢。此事件标志着AI驱动的安全研究能力已能极速突破顶尖硬件防护,显著改变了攻防的速度与平衡。

X:Berry Xia (@berryxia)
研究揭示LLM智能体记忆重写机制损害可靠性

伊利诺伊大学与清华大学等机构的研究发现,LLM智能体虽能从经验中学习,但其通过LLM将原始经历压缩成书面教训的记忆重写机制会损害记忆可靠性。在网页购物、模拟世界及ARC风格谜题等任务测试中,反复重写记忆会导致错误分组、规则过度泛化或过拟合,使智能体遗忘细节或混淆任务类型。例如,GPT-4在无记忆时可100%解决小型ARC-AGI问题集,而建立记忆并流式更新后,性能降至约54%。研究主张智能体记忆系统应重视原始经历作为关键证据,而非自动将所有经验重写为摘要,保留原始证据并选择性摘要效果更佳。

X:Rohan Paul (@rohanpaul_ai)

3技巧与观点

开源微信读书数据可视化工具yao-weread-skill发布

开发者姚老师开源了微信读书Skill——yao-weread-skill。该工具能将用户的微信读书数据生成本地可视化报告,核心功能包括分析近两年的阅读时长与节律、书架书籍构成、阅读分类与作者偏好,并对笔记和想法进行语义分析。报告最终通过词云、热力图、雷达图等26种图表形式呈现,所有代码已在GitHub公开。

X:Vista (@vista8)
Anthropic CEO预言软件免费化与职业结构巨变

Anthropic CEO Dario Amodei在《华尔街日报》YouTube频道采访中表示,软件成本将急剧下降,可能基本免费,传统软件需百万用户分摊成本的前提将不再成立。同时,数十年来建立的许多工作和职业可能消失。Amodei认为社会能够应对并适应这种变化,但他警告人们目前完全未意识到即将到来的变革及其巨大规模。

X:Rohan Paul (@rohanpaul_ai)
微软AI CEO预测18个月内AI自动化所有白领工作

微软AI CEO Mustafa Suleyman预测,AI将在18个月内实现人类水平的性能,自动化大多数专业任务,包括会计、法律、营销和项目管理。他在Fortune采访中指出,所有涉及“坐在电脑前”的白领工作都将被AI完全取代。Suleyman透露自己的使命是构建“超级智能”,并展望未来创建新AI模型将像制作播客或写博客一样便捷。

X:Kim (@kimmonismus)
让 Codex 自己做了一条视频介绍了一下这个视频生成方案

该方案整合了藏师傅的PPT Skill(视觉与动效)、HyperFrames(时间线与渲染)、Listenhub Skill(配音)以及即梦CLI(补充片段)。核心在于,用户可通过Codex直接基于文本提示生成带动效的解释视频,并能在聊天界面内预览,极大提升了制作效率,特别适合产品介绍等视频内容。

X:歸藏 (@op7418)
Garry Tan发布的GBrain直接捅破个人AI天花板

Garry Tan开源的GBrain是一个知识系统,而非简单的RAG工具。它通过8层结构解决AI Agent的记忆缺陷:前4层升级基础检索,后4层实现终身记忆和自我进化,使如OpenClaw、Hermes等Agent能持续追踪用户的人际关系、决策轨迹和认知演化。该系统已在生产环境中处理大量数据,用户可通过安装链接或命令行快速集成,并以Markdown为最高优先级数据源,推动个人AI成为可能。

X:阿易 AI Notes (@AYi_AInotes)
微信读书Skill安装与使用指南

❤️ [引用 @vista8]:微信读书Cli安装和配置教程。 1. 官方指令,复制发给Codex或Claude Code 下载 https://cdn.weread.qq.com/skills/weread-skills.zip 安装 skill 2. 或者用 X 上网友 @eviljer 做的优化版Skill npx skills add jerlinn/jerlin-weread 3. 如果需要API key,访问微信官方这个页面获取 https://weread.qq.com/r/weread-skills 4. 使用案例 直接跟AI说:“调用微信读书skill 查看被讨厌勇气的高亮划线”

X:Berry Xia (@berryxia)
12今日事件
1一手报道
0新模型
10信源
← 前一日历史后一日 →
VOL.2026.05.18·12 STORIES·AI HOT DAILY

AIHOT日报

二〇二六年五月十八日 星期一DAILY · 每早八时
01

产品发布/更新

Product
3 篇

Grok Imagine图像生成功能正式发布

X·KOLX:Elon Musk (@elonmusk, xAI)

Grok Imagine 现已正式发布 所有人都可使用 基于我们最新的文本到图像模型 能够生成逼真、高质量的图像 支持多种宽高比 现在可在 X 上使用

手机端ChatGPT应用集成Codex构建功能

X·KOLX:Greg Brockman (@gdb)

你可以在手机端通过ChatGPT应用中的Codex直接构建项目

Zerostack——一款采用纯Rust语言编写、受Unix启发的编程代理

综合资讯Hacker News 热门(buzzing.cc 中文翻译)

Zerostack是一款采用纯Rust语言编写、受Unix哲学启发的编程代理工具,已正式发布1.0.0版本并在Rust包管理平台crates.io上提供。该发布在技术社区Hacker News上获得115点关注,反映出开发者对其的高度兴趣。Rust语言以内存安全和性能见称,Unix设计强调简洁与模块化,Zerostack结合两者优势,旨在提升编程效率,为代码辅助领域带来新选择。

02

论文研究

Research
2 篇

Anthropic Claude 5天攻破Apple M5 macOS内核漏洞:5年数十亿防线,被AI一举击穿

X·KOL
生成式AI的幻觉、超大规模投入的狂热与世界模型及神经符号AI的路径

近期访谈指出,当前大语言模型存在“幻觉”问题,答案常不可靠。业界对“超大规模”的巨额投入可能陷入非理性狂热。作为替代路径,“世界模型”旨在让AI理解物理规律,“神经符号AI”则尝试结合深度学习与符号推理,以提升可靠性、可解释性与逻辑能力,为下一代AI奠定基础。

Gary Marcus:The Road to AI We Can Trust(RSS)
X:Berry Xia (@berryxia)

Anthropic的Claude Mythos Preview在5天内,协助安全团队Calif成功构建并演示了首个公开的、针对Apple M5芯片macOS内核的内存破坏提权利用链。该攻击绕过了苹果耗时5年、投入数十亿美元打造的MIE硬件级内存完整性防护,从普通用户权限通过纯数据操作即可获得root权限。苹果已在后续更新中修复漏洞并致谢。此事件标志着AI驱动的安全研究能力已能极速突破顶尖硬件防护,显著改变了攻防的速度与平衡。

研究揭示LLM智能体记忆重写机制损害可靠性

X·KOLX:Rohan Paul (@rohanpaul_ai)

伊利诺伊大学与清华大学等机构的研究发现,LLM智能体虽能从经验中学习,但其通过LLM将原始经历压缩成书面教训的记忆重写机制会损害记忆可靠性。在网页购物、模拟世界及ARC风格谜题等任务测试中,反复重写记忆会导致错误分组、规则过度泛化或过拟合,使智能体遗忘细节或混淆任务类型。例如,GPT-4在无记忆时可100%解决小型ARC-AGI问题集,而建立记忆并流式更新后,性能降至约54%。研究主张智能体记忆系统应重视原始经历作为关键证据,而非自动将所有经验重写为摘要,保留原始证据并选择性摘要效果更佳。

03

技巧与观点

Tips & Takes
7 篇

开源微信读书数据可视化工具yao-weread-skill发布

X·KOLX:Vista (@vista8)

开发者姚老师开源了微信读书Skill——yao-weread-skill。该工具能将用户的微信读书数据生成本地可视化报告,核心功能包括分析近两年的阅读时长与节律、书架书籍构成、阅读分类与作者偏好,并对笔记和想法进行语义分析。报告最终通过词云、热力图、雷达图等26种图表形式呈现,所有代码已在GitHub公开。

Anthropic CEO预言软件免费化与职业结构巨变

X·KOLX:Rohan Paul (@rohanpaul_ai)

Anthropic CEO Dario Amodei在《华尔街日报》YouTube频道采访中表示,软件成本将急剧下降,可能基本免费,传统软件需百万用户分摊成本的前提将不再成立。同时,数十年来建立的许多工作和职业可能消失。Amodei认为社会能够应对并适应这种变化,但他警告人们目前完全未意识到即将到来的变革及其巨大规模。

微软AI CEO预测18个月内AI自动化所有白领工作

X·KOLX:Kim (@kimmonismus)

微软AI CEO Mustafa Suleyman预测,AI将在18个月内实现人类水平的性能,自动化大多数专业任务,包括会计、法律、营销和项目管理。他在Fortune采访中指出,所有涉及“坐在电脑前”的白领工作都将被AI完全取代。Suleyman透露自己的使命是构建“超级智能”,并展望未来创建新AI模型将像制作播客或写博客一样便捷。

让 Codex 自己做了一条视频介绍了一下这个视频生成方案

X·KOLX:歸藏 (@op7418)

该方案整合了藏师傅的PPT Skill(视觉与动效)、HyperFrames(时间线与渲染)、Listenhub Skill(配音)以及即梦CLI(补充片段)。核心在于,用户可通过Codex直接基于文本提示生成带动效的解释视频,并能在聊天界面内预览,极大提升了制作效率,特别适合产品介绍等视频内容。

Garry Tan发布的GBrain直接捅破个人AI天花板

X·KOLX:阿易 AI Notes (@AYi_AInotes)

Garry Tan开源的GBrain是一个知识系统,而非简单的RAG工具。它通过8层结构解决AI Agent的记忆缺陷:前4层升级基础检索,后4层实现终身记忆和自我进化,使如OpenClaw、Hermes等Agent能持续追踪用户的人际关系、决策轨迹和认知演化。该系统已在生产环境中处理大量数据,用户可通过安装链接或命令行快速集成,并以Markdown为最高优先级数据源,推动个人AI成为可能。

微信读书Skill安装与使用指南

X·KOLX:Berry Xia (@berryxia)

❤️ [引用 @vista8]:微信读书Cli安装和配置教程。 1. 官方指令,复制发给Codex或Claude Code 下载 https://cdn.weread.qq.com/skills/weread-skills.zip 安装 skill 2. 或者用 X 上网友 @eviljer 做的优化版Skill npx skills add jerlinn/jerlin-weread 3. 如果需要API key,访问微信官方这个页面获取 https://weread.qq.com/r/weread-skills 4. 使用案例 直接跟AI说:“调用微信读书skill 查看被讨厌勇气的高亮划线”

生成式AI的幻觉、超大规模投入的狂热与世界模型及神经符号AI的路径

大咖博客Gary Marcus:The Road to AI We Can Trust(RSS)

近期访谈指出,当前大语言模型存在“幻觉”问题,答案常不可靠。业界对“超大规模”的巨额投入可能陷入非理性狂热。作为替代路径,“世界模型”旨在让AI理解物理规律,“神经符号AI”则尝试结合深度学习与符号推理,以提升可靠性、可解释性与逻辑能力,为下一代AI奠定基础。

12
今日事件
1
一手报道
0
新模型
10
信源
← 前一日查看历史后一日 →
AI HOT · 编辑系统自动生成