AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
最新一期2026-06-12
2026 年 6 月12
  • 12 日Gemini Omni Flash 视频任务达 SOTA
  • 11 日DiffusionGemma:文本生成速度提升4倍的开源扩散模型
  • 10 日Claude Fable 5 和 Claude Mythos 5
  • 9 日小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型
  • 8 日Harness-1:基于强化学习训练的有状态搜索20B检索子智能体
  • 7 日GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码
  • 6 日Riverflow 2.5:可控制评分标准的图像模型
  • 5 日Nemotron 3.5 Content Safety:面向全球企业AI的可定制多模态安全
  • 4 日Grok Imagine 1.5 预览版发布
  • 3 日微软首款高级推理AI模型MAI-Thinking-1发布
  • 2 日MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型
  • 1 日OpenAI发布生物防御AI工具Rosalind
2026 年 5 月31
  • 31 日Nano Banana Pro与Nano Banana 2正式发布
  • 30 日OpenAI推出实时翻译模型,支持70+语言输入
  • 29 日Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级
  • 28 日Runway 推出 Model Context Protocol 服务器
  • 27 日谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题
  • 26 日面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN
  • 25 日Luma Agents 实现规模化真实 UGC 广告生成
  • 24 日StepAudio 2.5实时语音发布:副语言感知与人格化交互
  • 23 日首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布
  • 22 日Aleph 2.0 与 Edit Studio
  • 21 日Qwen3.7:智能体前沿
  • 20 日I/O 2026: 欢迎来到自主的 Gemini 时代
  • 19 日阿里云推出HappyHorse视频生成模型
  • 18 日Grok Imagine图像生成功能正式发布
  • 17 日社区协作再创佳绩,vLLM支持万亿级模型
  • 16 日MiniMax M2.7模型上线OrcaRouter平台
  • 15 日SenseNova U1技术报告发布,基于MoE架构开放模型权重
  • 14 日Hy3预览版登陆GMI,开源最强模型领跑
  • 13 日Claude Opus 4.7快速模式开放研究预览
  • 12 日SenseNova U1图像生成模型登陆ComfyUI平台
  • 11 日OpenCode x Ring 2.6 1T限时免费开放
  • 10 日ERNIE 5.1发布,预训练成本仅需对标模型6%
  • 9 日Ring-2.6-1T发布:万亿参数思维模型专为复杂任务设计
  • 8 日通过 API 中的新模型推进语音智能
  • 7 日SenseNova-U1开源8步蒸馏LoRA,推理速度大幅提升
  • 6 日GPT-5.5 Instant:更智能、更清晰、更个性化
  • 5 日语音克隆技术上线 真假难辨
  • 4 日从单张图像构建实时视频智能体:Runway Characters技术解析
  • 3 日模型别名新增"-latest"指向最新版本
  • 2 日GPT-5.5发布一周创营收新高
  • 1 日AntLingAGI开源Ling-2.6-1T模型,登陆Hugging Face平台
2026 年 4 月9
  • 30 日旗舰指令模型快速高效执行的秘诀:可靠基础设施与优化
  • 29 日Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体
  • 28 日小米开源MiMo-V2.5双模型,支持百万上下文与商用
  • 27 日Mistral AI 发布 Workflows 公开预览版,为企业AI工作流提供编排支持
  • 26 日DeepSeek V4模型限时2.5折优惠
  • 25 日迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源
  • 24 日OpenAI 最智能 AI 模型:GPT-5.5 登场,Token 成本降至 1/35、每兆瓦输出提升 50 倍
  • 23 日inclusionAI/LLaDA2.0-Uni
  • 22 日inclusionAI/DR-Venus-4B-RL 发布
全部日报 →
AI 日报每早八时
6月12日6月11日6月10日更早
AIHOT DAILY
2026年5月27日 · 周三

1模型发布/更新

谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题

IT之家(RSS)
面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上

面壁智能开源其新一代端侧大语言模型MiniCPM5-1B。该模型仅1B参数,在AA-Index榜单上超越所有2B参数以下模型,相比3个月前的Qwen3.5-2B效果更优且参数量减半。经INT4量化后权重仅0.5GB,支持在手机和浏览器上运行。其Base Model版本由面壁智能自主研发的AI训练框架ForgeTrain预训练完成,现已全面开源模型权重、训练数据集与部署方案。

IT之家(RSS)
腾讯混元新翻译模型双榜亮眼,小程序发布

腾讯混元发布翻译模型 Hy-MT2,在 Hugging Face 开源模型趋势排行榜上表现突出:1.8B 版本排名第一,30B-A3B(MoE)版本排名第四,下载量已超 7K。官方同步推出了基于该模型的“腾讯混译”微信小程序,支持语音输入与离线翻译,并可自定义翻译风格与指令。模型代码与权重已开源。

X:腾讯混元 (@TencentHunyuan)
Qwen3.7-Max 成为全球第二AI编程模型

Qwen3.7-Max 正式成为全球第二大 AI 编程模型。在 Code Arena 上得分 1541,仅次于 Claude。专为生产环境打造:可运行 35 小时任务、1000+ 次工具调用,并在数小时内交付两周的项目。

X:阿里云 / Alibaba Cloud (@alibaba_cloud)

2产品发布/更新

MiMo 2.5 Pro大幅降价,与DeepSeek V4 Pro同价

小米MiMo-V2.5系列API价格永久下调,最高降幅达99%,现与DeepSeek V4 Pro同价。Token套餐同步升级,同等价格下可用token量增加5-8倍,计费规则更简单透明。所有现有用户套餐额度将全额重置。此次降价源于MiMo全栈推理优化与服务效率提升,后续将发布技术博客详述细节。MiMo-V2.5-TTS限时免费,新定价于5月26日生效。

X:Kim (@kimmonismus)
Claude Code推出安全漏洞识别插件

我们为Claude Code发布了一个安全指导插件,可在编写代码时帮助识别和修复漏洞。 所有Claude Code用户均可使用。从插件市场(/plugins)安装。

X:Claude Devs (@ClaudeDevs)
Replit 应用添加登录的两种方式

在 Replit 上为你的应用添加登录有两种方式: → Replit Auth:零配置,用户使用其 Replit 账户登录 → Clerk Auth:你自己的品牌化登录,开发/生产环境均只需一个提示词。文档和视频见下方 👇 文档:https://docs.replit.com/learn/projects-and-artifacts/auth#auth

X:Replit (@Replit)
Kling AI驱动《大卫之家》实现多项行业首创

Jon Erwin - Wonder Project创始人兼首席创意官,Innovative Dreams首席执行官,亚马逊Prime热门剧集《大卫之家》创作者: “Kling AI是《大卫之家》第一季和第二季背后的核心力量。最让我兴奋的是它实现了多项行业首创:在完成的剧集中首次使用AI生成场景,首个原生4K模型。其运动控制功能也使我们能够在AI生成中保留演员真实的情感和感受。”

X:可灵 Kling AI (@Kling_ai)

3行业动态

据报道Claude Mythos以“巧妙简洁的证明”解决了OpenAI里程碑式的Erdős问题

Anthropic工程师Sholto Douglas表示,Claude Mythos在周末期间解决了OpenAI提出的Erdős单位距离猜想问题,并给出了一个“巧妙简洁的证明”。这一成果被描述为人工智能在数学发现领域存在“严重超前”迹象。

The Decoder:AI News(RSS)
SynthID水印技术扩展合作,覆盖超千亿内容

SynthID已为超过1000亿条内容添加水印,但透明度需要行业协作。 因此,我们正与OpenAI、ElevenLabs和Kakao合作,将SynthID水印技术集成到他们的模型中——这延续了我们与NVIDIA共同推动的全行业趋势。

X:Google DeepMind (@GoogleDeepMind)
OpenRouter完成1.13亿美元B轮融资

今天我们宣布完成由@CapitalGVC领投的1.13亿美元B轮融资。 过去6个月,随着AI从实验快速转向生产,OpenRouter的周处理量从5万亿增长到25万亿token。 我们对未来充满期待。

X:OpenRouter (@OpenRouter)
Anthropic任命KiYoung Choi为韩国代表董事

Anthropic宣布任命KiYoung Choi为韩国代表董事,以支持其即将在首尔开设的办公室。根据Anthropic的经济指数,韩国是Claude.ai全球最活跃的市场之一,其使用率超过人口规模预期的3.5倍,主要用于技术和创意领域。KiYoung Choi此前曾担任Snowflake韩国区总经理,在Google Cloud、Adobe等公司拥有超过30年的科技行业领导经验。他将在韩国领导市场战略,支持本地企业和初创公司应用Claude,例如法律科技公司Law&Company及韩国电信巨头SK Telecom均已在使用Claude构建产品。

Anthropic:Newsroom(网页)
阿里云CTO阐述从云原生到智能体原生转型

在 #QwenConference2026 上,阿里云CTO、国际业务总裁李飞飞博士阐述了我们从云原生到智能体原生的转变。为了普及AI,我们构建了四大基石:模型、智能体云、工具与服务,以及规模。 👉 敬请关注:https://click.qwencloud.com/m/20000000187/

X:阿里云 / Alibaba Cloud (@alibaba_cloud)
微软亚洲研究院发起全球AI价值观挑战赛

AI能否理解人类价值观的现实复杂性?微软亚洲研究院的全新全球AI价值观挑战赛,诚邀哲学、伦理、法学和社会科学领域的研究人员共同探索。立即注册:https://msft.it/6012vk8OO

X:Microsoft Research (@MSFTResearch)

4论文研究

KPop 新方法让 Ring-2.6-1T 在 SWE-bench Verified 上突破 76 分

团队推出 KPop,用于稳定大规模 MoE 模型的智能体强化学习训练。它用基于二元 KL 散度的自适应掩码机制,替代了此前 IcePop 方法中的固定比例掩码,能根据训练过程中的训练-推理不匹配程度动态调整。这一改进使得 Ring-2.6-1T 模型在无需修改基础设施或路由重放的情况下,仅通过纯 RL 训练,在 SWE-bench Verified 上取得了超过 76 分的成绩。

X:蚂蚁百灵 (@AntLingAGI)

5技巧与观点

Sundar Pichai 谈 AI、搜索的未来及网络的变化

Google 与 Alphabet CEO Sundar Pichai 在 Google I/O 后受访,回顾了公司为应对 ChatGPT 而进行的战略重组与高管调整。访谈聚焦于新的 Gemini 模型及其在产品中的整合,包括全新的智能搜索框与 Gemini Spark 智能体平台,旨在让搜索从提供结果转向启动任务。Pichai 讨论了这些变化对开放网络的持续冲击,回应了主持人此前提出的“Google Zero”概念(即来自 Google 的网站流量可能归零),并提及 Google 正利用 YouTube 视频训练模型以改变视频搜索与索引方式。最后,他对 Google DeepMind CEO Demis Hassabis 关于“处…

The Verge:AI(RSS)
“龙虾之父”Peter 开源 skill-cleaner,为 AI 智能体技能“做体检”

“龙虾之父”Peter 开源了 skill-cleaner 工具,用于诊断和优化 AI 智能体的技能提示词。该工具包含5项核心功能,包括技能提示词预算审计、重复技能检测、未使用技能筛查、技能根目录审计和描述精简优化。其脚本采用标准 token 预算核算逻辑,旨在帮助减少冗长描述对 token 预算和上下文窗口的占用。已有用户实践显示,将技能描述从90多词精简至40词以内,能提升智能体选择技能的准确率。

IT之家(RSS)
Gemini Omni 视频提示词使用指南

Google 发布了其多模态模型 Gemini Omni 的视频生成功能使用指南。该模型可通过 Gemini 应用、Google Flow 等平台体验。指南包含五项提示词技巧:利用模型已有的现实世界知识进行简洁描述;精确控制文本在视频中的渲染与排版;使用专业镜头指令(如推拉摇移)像电影摄影师一样调度画面;通过迭代编辑高效修改视频;以及在生成中直接调整角色的动作节奏或情绪。其核心在于通过精准的提示词引导模型生成复杂且可控的视频内容。

X:Google AI (@GoogleAI)
人类与AI分工:教育咨询及文学奖争议

我写了一篇新文章,探讨我们需要保留哪些人类特质,以及哪些可以交给AI,其中涉及教育、咨询领域的实验,以及最近关于文学奖的争议。

X:Ethan Mollick (@emollick)
Project Luxo:跨越AI媒体的恐怖谷

Runway通过Project Luxo研究发现,AI生成视频已跨越“恐怖谷”。他们向创意生态从业者展示了《The Rogue》等AI短片及广告样片,评估显示观众开始关注故事本身,而非技术瑕疵。所有作品均由单人团队制作,耗时从3周到4小时不等。Runway认为,这标志着AI媒体成熟——当技术足够好以至于“隐形”,观众沉浸于故事时,便实现了这一跨越。

Runway:News(网页)
我们如何对不同产品中的Claude进行隔离控制

Anthropic通过三重机制控制Claude智能体的部署风险,包括用户误用、模型异常行为和外部攻击。其防护策略聚焦于三个层面:通过沙箱、虚拟机和网络出口控制限制智能体运行环境;利用系统提示词和模型训练引导其行为;以及对MCP服务器、第三方插件等外部内容实施细粒度权限管理。文章以Claude Code、claude.ai和Claude Cowork为例,阐述了不同产品如何设计对应的隔离架构。

23今日事件
16一手报道
4新模型
20信源
← 前一日历史后一日 →
VOL.2026.05.27·23 STORIES·AI HOT DAILY

AIHOT日报

二〇二六年五月二十七日 星期三DAILY · 每早八时
01

模型发布/更新

Model Releases
4 篇

谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题

综合资讯IT之家(RSS)

面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上

综合资讯IT之家(RSS)

面壁智能开源其新一代端侧大语言模型MiniCPM5-1B。该模型仅1B参数,在AA-Index榜单上超越所有2B参数以下模型,相比3个月前的Qwen3.5-2B效果更优且参数量减半。经INT4量化后权重仅0.5GB,支持在手机和浏览器上运行。其Base Model版本由面壁智能自主研发的AI训练框架ForgeTrain预训练完成,现已全面开源模型权重、训练数据集与部署方案。

腾讯混元新翻译模型双榜亮眼,小程序发布

官方·XX:腾讯混元 (@TencentHunyuan)

腾讯混元发布翻译模型 Hy-MT2,在 Hugging Face 开源模型趋势排行榜上表现突出:1.8B 版本排名第一,30B-A3B(MoE)版本排名第四,下载量已超 7K。官方同步推出了基于该模型的“腾讯混译”微信小程序,支持语音输入与离线翻译,并可自定义翻译风格与指令。模型代码与权重已开源。

Qwen3.7-Max 成为全球第二AI编程模型

官方·XX:阿里云 / Alibaba Cloud (@alibaba_cloud)

Qwen3.7-Max 正式成为全球第二大 AI 编程模型。在 Code Arena 上得分 1541,仅次于 Claude。专为生产环境打造:可运行 35 小时任务、1000+ 次工具调用,并在数小时内交付两周的项目。

02
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
SenseNova-U1全训练代码开源,支持多模态多任务训练

OpenSenseNova开源了SenseNova-U1的完整训练代码库,支持其8B密集模型与A3B MoE架构。该代码库使用一个统一的框架,可同时训练多种多模态任务,包括文本到图像生成、图像编辑、交错生成及文本与视觉理解。工程上为大规模训练设计,支持混合并行、流式可恢复数据管线、环境变量驱动配置以及从1×8 GPUs到多节点集群的扩展能力。代码已在GitHub开源,采用Apache-2.0协议。

X:商汤 SenseTime (@SenseTime_AI)
未来展望:2026年5月的一些想法

文章展望了截至2026年5月AI领域的动态。内容涉及 Gemini Flash 3.5 的发布、名为 Mythos 的新产品或项目、开源与闭源生态平衡(open-closed balance)的讨论、美国开源力量的显著增长(America's open-source surge),以及由此引发的新兴权力博弈(emerging power struggles)。

Nathan Lambert:Interconnects(RSS)

产品发布/更新

Product
4 篇

MiMo 2.5 Pro大幅降价,与DeepSeek V4 Pro同价

X·KOLX:Kim (@kimmonismus)

小米MiMo-V2.5系列API价格永久下调,最高降幅达99%,现与DeepSeek V4 Pro同价。Token套餐同步升级,同等价格下可用token量增加5-8倍,计费规则更简单透明。所有现有用户套餐额度将全额重置。此次降价源于MiMo全栈推理优化与服务效率提升,后续将发布技术博客详述细节。MiMo-V2.5-TTS限时免费,新定价于5月26日生效。

Claude Code推出安全漏洞识别插件

官方·XX:Claude Devs (@ClaudeDevs)

我们为Claude Code发布了一个安全指导插件,可在编写代码时帮助识别和修复漏洞。 所有Claude Code用户均可使用。从插件市场(/plugins)安装。

Replit 应用添加登录的两种方式

官方·XX:Replit (@Replit)

在 Replit 上为你的应用添加登录有两种方式: → Replit Auth:零配置,用户使用其 Replit 账户登录 → Clerk Auth:你自己的品牌化登录,开发/生产环境均只需一个提示词。文档和视频见下方 👇 文档:https://docs.replit.com/learn/projects-and-artifacts/auth#auth

Kling AI驱动《大卫之家》实现多项行业首创

官方·XX:可灵 Kling AI (@Kling_ai)

Jon Erwin - Wonder Project创始人兼首席创意官,Innovative Dreams首席执行官,亚马逊Prime热门剧集《大卫之家》创作者: “Kling AI是《大卫之家》第一季和第二季背后的核心力量。最让我兴奋的是它实现了多项行业首创:在完成的剧集中首次使用AI生成场景,首个原生4K模型。其运动控制功能也使我们能够在AI生成中保留演员真实的情感和感受。”

03

行业动态

Industry
6 篇

据报道Claude Mythos以“巧妙简洁的证明”解决了OpenAI里程碑式的Erdős问题

综合资讯The Decoder:AI News(RSS)

Anthropic工程师Sholto Douglas表示,Claude Mythos在周末期间解决了OpenAI提出的Erdős单位距离猜想问题,并给出了一个“巧妙简洁的证明”。这一成果被描述为人工智能在数学发现领域存在“严重超前”迹象。

SynthID水印技术扩展合作,覆盖超千亿内容

官方·XX:Google DeepMind (@GoogleDeepMind)

SynthID已为超过1000亿条内容添加水印,但透明度需要行业协作。 因此,我们正与OpenAI、ElevenLabs和Kakao合作,将SynthID水印技术集成到他们的模型中——这延续了我们与NVIDIA共同推动的全行业趋势。

OpenRouter完成1.13亿美元B轮融资

官方·XX:OpenRouter (@OpenRouter)

今天我们宣布完成由@CapitalGVC领投的1.13亿美元B轮融资。 过去6个月,随着AI从实验快速转向生产,OpenRouter的周处理量从5万亿增长到25万亿token。 我们对未来充满期待。

Anthropic任命KiYoung Choi为韩国代表董事

官方Anthropic:Newsroom(网页)

Anthropic宣布任命KiYoung Choi为韩国代表董事,以支持其即将在首尔开设的办公室。根据Anthropic的经济指数,韩国是Claude.ai全球最活跃的市场之一,其使用率超过人口规模预期的3.5倍,主要用于技术和创意领域。KiYoung Choi此前曾担任Snowflake韩国区总经理,在Google Cloud、Adobe等公司拥有超过30年的科技行业领导经验。他将在韩国领导市场战略,支持本地企业和初创公司应用Claude,例如法律科技公司Law&Company及韩国电信巨头SK Telecom均已在使用Claude构建产品。

阿里云CTO阐述从云原生到智能体原生转型

官方·XX:阿里云 / Alibaba Cloud (@alibaba_cloud)

在 #QwenConference2026 上,阿里云CTO、国际业务总裁李飞飞博士阐述了我们从云原生到智能体原生的转变。为了普及AI,我们构建了四大基石:模型、智能体云、工具与服务,以及规模。 👉 敬请关注:https://click.qwencloud.com/m/20000000187/

微软亚洲研究院发起全球AI价值观挑战赛

官方·XX:Microsoft Research (@MSFTResearch)

AI能否理解人类价值观的现实复杂性?微软亚洲研究院的全新全球AI价值观挑战赛,诚邀哲学、伦理、法学和社会科学领域的研究人员共同探索。立即注册:https://msft.it/6012vk8OO

04

论文研究

Research
1 篇

KPop 新方法让 Ring-2.6-1T 在 SWE-bench Verified 上突破 76 分

官方·XX:蚂蚁百灵 (@AntLingAGI)

团队推出 KPop,用于稳定大规模 MoE 模型的智能体强化学习训练。它用基于二元 KL 散度的自适应掩码机制,替代了此前 IcePop 方法中的固定比例掩码,能根据训练过程中的训练-推理不匹配程度动态调整。这一改进使得 Ring-2.6-1T 模型在无需修改基础设施或路由重放的情况下,仅通过纯 RL 训练,在 SWE-bench Verified 上取得了超过 76 分的成绩。

05

技巧与观点

Tips & Takes
8 篇

Sundar Pichai 谈 AI、搜索的未来及网络的变化

综合资讯The Verge:AI(RSS)

Google 与 Alphabet CEO Sundar Pichai 在 Google I/O 后受访,回顾了公司为应对 ChatGPT 而进行的战略重组与高管调整。访谈聚焦于新的 Gemini 模型及其在产品中的整合,包括全新的智能搜索框与 Gemini Spark 智能体平台,旨在让搜索从提供结果转向启动任务。Pichai 讨论了这些变化对开放网络的持续冲击,回应了主持人此前提出的“Google Zero”概念(即来自 Google 的网站流量可能归零),并提及 Google 正利用 YouTube 视频训练模型以改变视频搜索与索引方式。最后,他对 Google DeepMind CEO Demis Hassabis 关于“处…

“龙虾之父”Peter 开源 skill-cleaner,为 AI 智能体技能“做体检”

综合资讯IT之家(RSS)

“龙虾之父”Peter 开源了 skill-cleaner 工具,用于诊断和优化 AI 智能体的技能提示词。该工具包含5项核心功能,包括技能提示词预算审计、重复技能检测、未使用技能筛查、技能根目录审计和描述精简优化。其脚本采用标准 token 预算核算逻辑,旨在帮助减少冗长描述对 token 预算和上下文窗口的占用。已有用户实践显示,将技能描述从90多词精简至40词以内,能提升智能体选择技能的准确率。

Gemini Omni 视频提示词使用指南

官方·XX:Google AI (@GoogleAI)

Google 发布了其多模态模型 Gemini Omni 的视频生成功能使用指南。该模型可通过 Gemini 应用、Google Flow 等平台体验。指南包含五项提示词技巧:利用模型已有的现实世界知识进行简洁描述;精确控制文本在视频中的渲染与排版;使用专业镜头指令(如推拉摇移)像电影摄影师一样调度画面;通过迭代编辑高效修改视频;以及在生成中直接调整角色的动作节奏或情绪。其核心在于通过精准的提示词引导模型生成复杂且可控的视频内容。

人类与AI分工:教育咨询及文学奖争议

X·KOLX:Ethan Mollick (@emollick)

我写了一篇新文章,探讨我们需要保留哪些人类特质,以及哪些可以交给AI,其中涉及教育、咨询领域的实验,以及最近关于文学奖的争议。

Project Luxo:跨越AI媒体的恐怖谷

官方Runway:News(网页)

Runway通过Project Luxo研究发现,AI生成视频已跨越“恐怖谷”。他们向创意生态从业者展示了《The Rogue》等AI短片及广告样片,评估显示观众开始关注故事本身,而非技术瑕疵。所有作品均由单人团队制作,耗时从3周到4小时不等。Runway认为,这标志着AI媒体成熟——当技术足够好以至于“隐形”,观众沉浸于故事时,便实现了这一跨越。

我们如何对不同产品中的Claude进行隔离控制

官方Anthropic:Engineering(事故复盘 + 工程实践 · 网页)

Anthropic通过三重机制控制Claude智能体的部署风险,包括用户误用、模型异常行为和外部攻击。其防护策略聚焦于三个层面:通过沙箱、虚拟机和网络出口控制限制智能体运行环境;利用系统提示词和模型训练引导其行为;以及对MCP服务器、第三方插件等外部内容实施细粒度权限管理。文章以Claude Code、claude.ai和Claude Cowork为例,阐述了不同产品如何设计对应的隔离架构。

SenseNova-U1全训练代码开源,支持多模态多任务训练

官方·XX:商汤 SenseTime (@SenseTime_AI)

OpenSenseNova开源了SenseNova-U1的完整训练代码库,支持其8B密集模型与A3B MoE架构。该代码库使用一个统一的框架,可同时训练多种多模态任务,包括文本到图像生成、图像编辑、交错生成及文本与视觉理解。工程上为大规模训练设计,支持混合并行、流式可恢复数据管线、环境变量驱动配置以及从1×8 GPUs到多节点集群的扩展能力。代码已在GitHub开源,采用Apache-2.0协议。

未来展望:2026年5月的一些想法

大咖博客Nathan Lambert:Interconnects(RSS)

文章展望了截至2026年5月AI领域的动态。内容涉及 Gemini Flash 3.5 的发布、名为 Mythos 的新产品或项目、开源与闭源生态平衡(open-closed balance)的讨论、美国开源力量的显著增长(America's open-source surge),以及由此引发的新兴权力博弈(emerging power struggles)。

23
今日事件
16
一手报道
4
新模型
20
信源
← 前一日查看历史后一日 →
AI HOT · 编辑系统自动生成