AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
最新一期2026-06-12
2026 年 6 月12
  • 12 日Gemini Omni Flash 视频任务达 SOTA
  • 11 日DiffusionGemma:文本生成速度提升4倍的开源扩散模型
  • 10 日Claude Fable 5 和 Claude Mythos 5
  • 9 日小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型
  • 8 日Harness-1:基于强化学习训练的有状态搜索20B检索子智能体
  • 7 日GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码
  • 6 日Riverflow 2.5:可控制评分标准的图像模型
  • 5 日Nemotron 3.5 Content Safety:面向全球企业AI的可定制多模态安全
  • 4 日Grok Imagine 1.5 预览版发布
  • 3 日微软首款高级推理AI模型MAI-Thinking-1发布
  • 2 日MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型
  • 1 日OpenAI发布生物防御AI工具Rosalind
2026 年 5 月31
  • 31 日Nano Banana Pro与Nano Banana 2正式发布
  • 30 日OpenAI推出实时翻译模型,支持70+语言输入
  • 29 日Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级
  • 28 日Runway 推出 Model Context Protocol 服务器
  • 27 日谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题
  • 26 日面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN
  • 25 日Luma Agents 实现规模化真实 UGC 广告生成
  • 24 日StepAudio 2.5实时语音发布:副语言感知与人格化交互
  • 23 日首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布
  • 22 日Aleph 2.0 与 Edit Studio
  • 21 日Qwen3.7:智能体前沿
  • 20 日I/O 2026: 欢迎来到自主的 Gemini 时代
  • 19 日阿里云推出HappyHorse视频生成模型
  • 18 日Grok Imagine图像生成功能正式发布
  • 17 日社区协作再创佳绩,vLLM支持万亿级模型
  • 16 日MiniMax M2.7模型上线OrcaRouter平台
  • 15 日SenseNova U1技术报告发布,基于MoE架构开放模型权重
  • 14 日Hy3预览版登陆GMI,开源最强模型领跑
  • 13 日Claude Opus 4.7快速模式开放研究预览
  • 12 日SenseNova U1图像生成模型登陆ComfyUI平台
  • 11 日OpenCode x Ring 2.6 1T限时免费开放
  • 10 日ERNIE 5.1发布,预训练成本仅需对标模型6%
  • 9 日Ring-2.6-1T发布:万亿参数思维模型专为复杂任务设计
  • 8 日通过 API 中的新模型推进语音智能
  • 7 日SenseNova-U1开源8步蒸馏LoRA,推理速度大幅提升
  • 6 日GPT-5.5 Instant:更智能、更清晰、更个性化
  • 5 日语音克隆技术上线 真假难辨
  • 4 日从单张图像构建实时视频智能体:Runway Characters技术解析
  • 3 日模型别名新增"-latest"指向最新版本
  • 2 日GPT-5.5发布一周创营收新高
  • 1 日AntLingAGI开源Ling-2.6-1T模型,登陆Hugging Face平台
2026 年 4 月9
  • 30 日旗舰指令模型快速高效执行的秘诀:可靠基础设施与优化
  • 29 日Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体
  • 28 日小米开源MiMo-V2.5双模型,支持百万上下文与商用
  • 27 日Mistral AI 发布 Workflows 公开预览版,为企业AI工作流提供编排支持
  • 26 日DeepSeek V4模型限时2.5折优惠
  • 25 日迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源
  • 24 日OpenAI 最智能 AI 模型:GPT-5.5 登场,Token 成本降至 1/35、每兆瓦输出提升 50 倍
  • 23 日inclusionAI/LLaDA2.0-Uni
  • 22 日inclusionAI/DR-Venus-4B-RL 发布
全部日报 →
AI 日报每早八时
6月12日6月11日6月10日更早
AIHOT DAILY
2026年5月17日 · 周日

1模型发布/更新

社区协作再创佳绩,vLLM支持万亿级模型

又一次Day0协作,又一次社区胜利。感谢@vllm_project团队始终可靠的支持~ 🫡🫡

X:蚂蚁百灵 (@AntLingAGI)
SANA-WM:一个用于生成1分钟720p视频的26亿级开源世界模型

NVIDIA研究团队发布了SANA-WM,这是一个参数规模达26亿的开源世界模型,专门用于生成长达1分钟、分辨率为720p的视频。该模型已在GitHub页面开源,旨在推动高质量长视频生成的研发。其在Hacker News社区获得了107点热度,显示出业界对该技术进展的关注。

Hacker News 热门(buzzing.cc 中文翻译)
Ring-2.6-1T开源并上线OpenRouter,专为智能体工作流设计

Ring-2.6-1T模型现已开源,并上线OpenRouter平台,5月底前享有75%折扣。该模型由AntLingAGI开发,是一个为现实世界智能体构建的万亿级推理模型,其核心设计目标不仅是回答问题,更是执行任务。它专注于规划步骤、使用工具、维持上下文和完成复杂工作流,具备强大的智能体执行能力和高推理模式,并采用了Async RL与IcePop训练方法。

X:蚂蚁百灵 (@AntLingAGI)

2产品发布/更新

Codex新增键盘快捷键自定义功能

不知为何我们选择周六发布更新,但Codex确实迎来了一系列优化。 这些改进让使用体验愉悦许多,实在不该拖到周二再公布。 键盘快捷键现已支持自定义。 根据实际工作方式配置Codex,通过设置调整快捷键,不必再迁就默认设定。

X:Tibo (@thsottiaux)
Notion推出开发者平台及CLI工具

Notion正式推出开发者平台,核心组件包括Notion CLI终端工具、Workers计算服务、数据库同步功能以及多种Agent工具与API。平台旨在让开发者更便捷地在Notion基础设施上运行代码、连接外部数据源并构建自动化工作流。未来,即使非开发者也能通过AI Agent在Notion上构建应用。

X:Oran Ge (@oran_ge)
按需定制快捷键,优化工作流效率

处理大家的反馈让我们感到太有趣了。 (请继续反馈。) 键盘快捷键现已支持自定义。 围绕你的实际工作方式设置 Codex,然后通过设置调整快捷键,无需再适应我们的默认配置。

X:OpenAI Developers (@OpenAIDevs)

3行业动态

美国开始出现人工智能相关岗位的大规模裁员

美国人工智能相关岗位正出现大规模裁员。根据彭博社报道,受AI影响的职位开始经历严重的就业岗位流失。这一趋势表明AI技术对劳动力市场的冲击已从理论讨论进入现实阶段,具体裁员数字和涉及的行业领域在进一步显现中。

Hacker News 热门(buzzing.cc 中文翻译)
研究人员利用Anthropic Mythos工具构建macOS内核漏洞,绕过苹果M5芯片内存完整性执行安全系统

三名研究人员借助Anthropic的Mythos工具,成功开发出一个可绕过苹果M5芯片内存完整性执行(MIE)安全机制的macOS内核漏洞利用程序。MIE是苹果耗时五年、投入巨资为M5和A19芯片打造的旗舰安全功能,旨在彻底消除内存损坏漏洞。研究团队于4月25日发现漏洞,5月1日即完成开发,并亲自前往苹果园区提交报告。该攻击采用纯数据攻击方式,无需操纵指针,仅通过非特权用户的标准系统调用即可获取根权限。完整技术报告将在苹果发布补丁后公开。

X:Kim (@kimmonismus)
突发!OpenAI 大规模重组,总裁 Brockman 夺权挂帅

OpenAI宣布进行史上最大规模重组,将ChatGPT、Codex和API三大核心产品线合并为统一组织。联合创始人兼总裁Greg Brockman正式全面接管产品战略,成为实际掌权者,而ChatGPT原负责人Nick Turley被调离核心岗位。此次重组旨在整合资源,聚焦“智能体时代”,并秘密开发集成多项功能的“超级应用”桌面端产品。与此同时,竞争对手Anthropic估值飙升至9000亿美元,使OpenAI面临严峻挑战。

IT之家(RSS)
杭州基地启用,机器人有了国家级职业技能训练场

国家人工智能应用中试基地(具身智能)5月16日在浙江杭州挂牌启用,为机器人提供国家级职业技能训练场。该基地是集场景体验、技术展示、研发合作、产业赋能于一体的综合性平台,旨在推动具身智能技术从实验室迈向现实应用。杭州市于5月1日施行首部具身智能机器人地方性法规,支持核心研发、平台建设和场景开放。目前杭州已集聚机器人产业相关企业700余家,2025年具身智能产业集群产值达1068亿元。

IT之家(RSS)
OpenAI 与马耳他合作,向所有公民提供 ChatGPT Plus

OpenAI 与马耳他政府达成合作,将向该国所有公民免费提供 ChatGPT Plus 订阅服务。此次合作旨在扩大人工智能技术的普及范围,并包含面向公民的 AI 技能实践培训,以帮助民众负责任地使用 AI。该计划是国家级大规模推广 ChatGPT Plus 的首例,预计将提升马耳他全民的 AI 素养与应用能力。

OpenAI:官网动态(RSS · 排除企业/客户案例)

4论文研究

智能体驱动系统Articraft实现3D资产生成自动化,开源万件数据集降低门槛

剑桥大学团队推出Articraft,这是一个由智能体驱动的编码系统,能全自动生成带关节、可运动的交互式3D资产。系统通过AI智能体自主编写代码、执行并接收物理反馈迭代优化,将以往需数日甚至数周的创作过程极大简化。团队同时开源了Articraft-10K数据集,包含超1万个物体,覆盖250个类别,所有资产均仿真就绪。此举显著降低了机器人训练和物理AI领域对高质量3D资产的数据门槛,为解决“数据饥渴”问题提供了高效的自动化方案。

X:Berry Xia (@berryxia)

5技巧与观点

藏师傅PPT Skills更新,AI自动美化截图

藏师傅PPT Skills产品更新,新增截图美化功能。该功能无需消耗GPT-Image 2.0资源,即可根据用户截图的大小、长宽比以及当前PPT的模板类型和颜色主题,自动匹配合适的背景图,实现类似CleanShot X等专业软件的截图美化效果。AI还能处理过长等有问题的图片,例如将其自动裁剪并排成两列展示。

X:歸藏 (@op7418)
MagicPath与Codex深度整合,设计开发流程合二为一

MagicPath AI CEO @skirano 演示了其产品与Codex的深度整合。用户现可将MagicPath作为原生画布直接在Codex中运行,通过拖拽设计UI,Codex能实时感知项目并自动生成、编辑代码,实现设计与开发的无缝衔接,无需在Figma和IDE间切换。安装简便,只需在Codex中粘贴一条命令即可完成配置。此举将“设计-开发-迭代”流程整合于单一窗口,显著缩短了从创意到可运行应用的距离。

X:Berry Xia (@berryxia)
Codex实现多设备远程控制与上下文共享

Codex除了通过ChatGPT连接和远程控制外,还能控制另一台电脑,实现在ChatGPT上直接管理多台设备而无需切换,只需切换项目即可访问不同设备的上下文和文件。引用推文补充,此功能还支持通过远程SSH设置其他VMs等,增强了多设备协作的灵活性和实用性。

X:歸藏 (@op7418)
Show HN: 烧吧,宝贝,烧吧(那些代币)

开发者发布了一个名为“烧吧,宝贝,烧吧”的开源项目,旨在通过销毁代币来应对加密货币领域的通胀问题。该项目提供了一个工具,允许用户主动销毁自己持有的代币,从而减少总供应量。此举可能提升剩余代币的稀缺性与潜在价值。项目已在GitHub上开源,并在Hacker News上获得了100点的社区热度。

Hacker News 热门(buzzing.cc 中文翻译)
Anthropic《Founder's Playbook》:AI提高创业失败率的警示

Anthropic发布内部手册《Founder's Playbook》,核心观点是AI(如Claude Code)将提高创业失败率,而非降低。手册指出,AI能快速生成原型,易使创始人混淆“能运行”与“有市场需求”,并通过确认偏误和研究引擎强化错误想法。它将创业分为Idea、MVP、Launch、Scale四阶段,剖析AI放大的风险:如原型不等于验证、Agentic技术债、创始人成为决策瓶颈等。最终结论是,AI极大降低执行成本,使得判断力成为最稀缺资源,真正护城河在于将垂直领域知识结构化沉淀为专属Skills。

X:Berry Xia (@berryxia)
工具使用代理认知与行动脱节机制研究

该可解释性论文聚焦工具使用代理,通过探测隐藏状态发现模型常能识别应调用工具,但实际调用失败,不匹配率达26%-54%。问题完全集中于认知到行动的过渡阶段,而非认知本身。内部探测方向可解码,但后期层的最后令牌机制使信号旋转,几乎与产生的行动正交。研究旨在预测干预措施效果,指出常见归因如提示或训练不足可能忽略后期层几何结构,这为工具使用提示A/B测试中的性能上限提供了合理解释。

X:Elvis Saravia (@omarsar0, DAIR.AI)
20今日事件
5一手报道
3新模型
13信源
← 前一日历史后一日 →
VOL.2026.05.17·20 STORIES·AI HOT DAILY

AIHOT日报

二〇二六年五月十七日 星期日DAILY · 每早八时
01

模型发布/更新

Model Releases
3 篇

社区协作再创佳绩,vLLM支持万亿级模型

官方·XX:蚂蚁百灵 (@AntLingAGI)

又一次Day0协作,又一次社区胜利。感谢@vllm_project团队始终可靠的支持~ 🫡🫡

SANA-WM:一个用于生成1分钟720p视频的26亿级开源世界模型

综合资讯Hacker News 热门(buzzing.cc 中文翻译)

NVIDIA研究团队发布了SANA-WM,这是一个参数规模达26亿的开源世界模型,专门用于生成长达1分钟、分辨率为720p的视频。该模型已在GitHub页面开源,旨在推动高质量长视频生成的研发。其在Hacker News社区获得了107点热度,显示出业界对该技术进展的关注。

Ring-2.6-1T开源并上线OpenRouter,专为智能体工作流设计

官方·XX:蚂蚁百灵 (@AntLingAGI)

Ring-2.6-1T模型现已开源,并上线OpenRouter平台,5月底前享有75%折扣。该模型由AntLingAGI开发,是一个为现实世界智能体构建的万亿级推理模型,其核心设计目标不仅是回答问题,更是执行任务。它专注于规划步骤、使用工具、维持上下文和完成复杂工作流,具备强大的智能体执行能力和高推理模式,并采用了Async RL与IcePop训练方法。

02

产品发布/更新

Product
3 篇

Codex新增键盘快捷键自定义功能

Eric Jang分享从零构建AlphaGo的经历与见解

Eric Jang在过去几个月从零开始实现AlphaGo,这是2016年激发他进入深度学习的AI突破。他最初理解AlphaGo为“通过自我对弈训练的搜索增强深度神经网络”,但通过亲手构建获得了更深层次的理解。他指出,前沿深度学习研究虽昂贵,但特定能力的实现成本下降迅速;在2026年,训练强大围棋AI仅需几千美元租赁算力,无需DeepMind级别的资源。他荣幸受邀在播客中分享这一过程,并提供了详细教程和代码,同时谦虚自称围棋与AlphaGo学徒,对任何事实错误负责。

X:Marc Andreessen (@pmarca, a16z)
最新开源成果(#21):开源模型盛宴!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。基于CAISI的V4评估。

本月开源AI模型领域迎来密集发布,包括Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5和GLM-5.1等一系列重要新版本。这些模型均在CAISI的V4评估框架下进行了性能评测。多个团队几乎同期推出旗舰级更新,反映出开源社区当前高速迭代的竞争态势。

Nathan Lambert:Interconnects(RSS)
X·KOL
X:Tibo (@thsottiaux)

不知为何我们选择周六发布更新,但Codex确实迎来了一系列优化。 这些改进让使用体验愉悦许多,实在不该拖到周二再公布。 键盘快捷键现已支持自定义。 根据实际工作方式配置Codex,通过设置调整快捷键,不必再迁就默认设定。

Notion推出开发者平台及CLI工具

X·KOLX:Oran Ge (@oran_ge)

Notion正式推出开发者平台,核心组件包括Notion CLI终端工具、Workers计算服务、数据库同步功能以及多种Agent工具与API。平台旨在让开发者更便捷地在Notion基础设施上运行代码、连接外部数据源并构建自动化工作流。未来,即使非开发者也能通过AI Agent在Notion上构建应用。

按需定制快捷键,优化工作流效率

官方·XX:OpenAI Developers (@OpenAIDevs)

处理大家的反馈让我们感到太有趣了。 (请继续反馈。) 键盘快捷键现已支持自定义。 围绕你的实际工作方式设置 Codex,然后通过设置调整快捷键,无需再适应我们的默认配置。

03

行业动态

Industry
5 篇

美国开始出现人工智能相关岗位的大规模裁员

综合资讯Hacker News 热门(buzzing.cc 中文翻译)

美国人工智能相关岗位正出现大规模裁员。根据彭博社报道,受AI影响的职位开始经历严重的就业岗位流失。这一趋势表明AI技术对劳动力市场的冲击已从理论讨论进入现实阶段,具体裁员数字和涉及的行业领域在进一步显现中。

研究人员利用Anthropic Mythos工具构建macOS内核漏洞,绕过苹果M5芯片内存完整性执行安全系统

X·KOLX:Kim (@kimmonismus)

三名研究人员借助Anthropic的Mythos工具,成功开发出一个可绕过苹果M5芯片内存完整性执行(MIE)安全机制的macOS内核漏洞利用程序。MIE是苹果耗时五年、投入巨资为M5和A19芯片打造的旗舰安全功能,旨在彻底消除内存损坏漏洞。研究团队于4月25日发现漏洞,5月1日即完成开发,并亲自前往苹果园区提交报告。该攻击采用纯数据攻击方式,无需操纵指针,仅通过非特权用户的标准系统调用即可获取根权限。完整技术报告将在苹果发布补丁后公开。

突发!OpenAI 大规模重组,总裁 Brockman 夺权挂帅

综合资讯IT之家(RSS)

OpenAI宣布进行史上最大规模重组,将ChatGPT、Codex和API三大核心产品线合并为统一组织。联合创始人兼总裁Greg Brockman正式全面接管产品战略,成为实际掌权者,而ChatGPT原负责人Nick Turley被调离核心岗位。此次重组旨在整合资源,聚焦“智能体时代”,并秘密开发集成多项功能的“超级应用”桌面端产品。与此同时,竞争对手Anthropic估值飙升至9000亿美元,使OpenAI面临严峻挑战。

杭州基地启用,机器人有了国家级职业技能训练场

综合资讯IT之家(RSS)

国家人工智能应用中试基地(具身智能)5月16日在浙江杭州挂牌启用,为机器人提供国家级职业技能训练场。该基地是集场景体验、技术展示、研发合作、产业赋能于一体的综合性平台,旨在推动具身智能技术从实验室迈向现实应用。杭州市于5月1日施行首部具身智能机器人地方性法规,支持核心研发、平台建设和场景开放。目前杭州已集聚机器人产业相关企业700余家,2025年具身智能产业集群产值达1068亿元。

OpenAI 与马耳他合作,向所有公民提供 ChatGPT Plus

官方OpenAI:官网动态(RSS · 排除企业/客户案例)

OpenAI 与马耳他政府达成合作,将向该国所有公民免费提供 ChatGPT Plus 订阅服务。此次合作旨在扩大人工智能技术的普及范围,并包含面向公民的 AI 技能实践培训,以帮助民众负责任地使用 AI。该计划是国家级大规模推广 ChatGPT Plus 的首例,预计将提升马耳他全民的 AI 素养与应用能力。

04

论文研究

Research
1 篇

智能体驱动系统Articraft实现3D资产生成自动化,开源万件数据集降低门槛

X·KOLX:Berry Xia (@berryxia)

剑桥大学团队推出Articraft,这是一个由智能体驱动的编码系统,能全自动生成带关节、可运动的交互式3D资产。系统通过AI智能体自主编写代码、执行并接收物理反馈迭代优化,将以往需数日甚至数周的创作过程极大简化。团队同时开源了Articraft-10K数据集,包含超1万个物体,覆盖250个类别,所有资产均仿真就绪。此举显著降低了机器人训练和物理AI领域对高质量3D资产的数据门槛,为解决“数据饥渴”问题提供了高效的自动化方案。

05

技巧与观点

Tips & Takes
8 篇

藏师傅PPT Skills更新,AI自动美化截图

X·KOLX:歸藏 (@op7418)

藏师傅PPT Skills产品更新,新增截图美化功能。该功能无需消耗GPT-Image 2.0资源,即可根据用户截图的大小、长宽比以及当前PPT的模板类型和颜色主题,自动匹配合适的背景图,实现类似CleanShot X等专业软件的截图美化效果。AI还能处理过长等有问题的图片,例如将其自动裁剪并排成两列展示。

MagicPath与Codex深度整合,设计开发流程合二为一

X·KOLX:Berry Xia (@berryxia)

MagicPath AI CEO @skirano 演示了其产品与Codex的深度整合。用户现可将MagicPath作为原生画布直接在Codex中运行,通过拖拽设计UI,Codex能实时感知项目并自动生成、编辑代码,实现设计与开发的无缝衔接,无需在Figma和IDE间切换。安装简便,只需在Codex中粘贴一条命令即可完成配置。此举将“设计-开发-迭代”流程整合于单一窗口,显著缩短了从创意到可运行应用的距离。

Codex实现多设备远程控制与上下文共享

X·KOLX:歸藏 (@op7418)

Codex除了通过ChatGPT连接和远程控制外,还能控制另一台电脑,实现在ChatGPT上直接管理多台设备而无需切换,只需切换项目即可访问不同设备的上下文和文件。引用推文补充,此功能还支持通过远程SSH设置其他VMs等,增强了多设备协作的灵活性和实用性。

Show HN: 烧吧,宝贝,烧吧(那些代币)

综合资讯Hacker News 热门(buzzing.cc 中文翻译)

开发者发布了一个名为“烧吧,宝贝,烧吧”的开源项目,旨在通过销毁代币来应对加密货币领域的通胀问题。该项目提供了一个工具,允许用户主动销毁自己持有的代币,从而减少总供应量。此举可能提升剩余代币的稀缺性与潜在价值。项目已在GitHub上开源,并在Hacker News上获得了100点的社区热度。

Anthropic《Founder's Playbook》:AI提高创业失败率的警示

X·KOLX:Berry Xia (@berryxia)

Anthropic发布内部手册《Founder's Playbook》,核心观点是AI(如Claude Code)将提高创业失败率,而非降低。手册指出,AI能快速生成原型,易使创始人混淆“能运行”与“有市场需求”,并通过确认偏误和研究引擎强化错误想法。它将创业分为Idea、MVP、Launch、Scale四阶段,剖析AI放大的风险:如原型不等于验证、Agentic技术债、创始人成为决策瓶颈等。最终结论是,AI极大降低执行成本,使得判断力成为最稀缺资源,真正护城河在于将垂直领域知识结构化沉淀为专属Skills。

工具使用代理认知与行动脱节机制研究

X·KOLX:Elvis Saravia (@omarsar0, DAIR.AI)

该可解释性论文聚焦工具使用代理,通过探测隐藏状态发现模型常能识别应调用工具,但实际调用失败,不匹配率达26%-54%。问题完全集中于认知到行动的过渡阶段,而非认知本身。内部探测方向可解码,但后期层的最后令牌机制使信号旋转,几乎与产生的行动正交。研究旨在预测干预措施效果,指出常见归因如提示或训练不足可能忽略后期层几何结构,这为工具使用提示A/B测试中的性能上限提供了合理解释。

Eric Jang分享从零构建AlphaGo的经历与见解

X·KOLX:Marc Andreessen (@pmarca, a16z)

Eric Jang在过去几个月从零开始实现AlphaGo,这是2016年激发他进入深度学习的AI突破。他最初理解AlphaGo为“通过自我对弈训练的搜索增强深度神经网络”,但通过亲手构建获得了更深层次的理解。他指出,前沿深度学习研究虽昂贵,但特定能力的实现成本下降迅速;在2026年,训练强大围棋AI仅需几千美元租赁算力,无需DeepMind级别的资源。他荣幸受邀在播客中分享这一过程,并提供了详细教程和代码,同时谦虚自称围棋与AlphaGo学徒,对任何事实错误负责。

最新开源成果(#21):开源模型盛宴!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。基于CAISI的V4评估。

大咖博客Nathan Lambert:Interconnects(RSS)

本月开源AI模型领域迎来密集发布,包括Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5和GLM-5.1等一系列重要新版本。这些模型均在CAISI的V4评估框架下进行了性能评测。多个团队几乎同期推出旗舰级更新,反映出开源社区当前高速迭代的竞争态势。

20
今日事件
5
一手报道
3
新模型
13
信源
← 前一日查看历史后一日 →
AI HOT · 编辑系统自动生成