AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态一手 · 2416 条
全部一手资讯X论文
4月29日周三
4月28日周二
4月27日周一
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月29日
00:36
Claude:Blog(网页)
精选72
像培训新开发者一样引导Claude Code:来自17年开发的经验教训

华盛顿大学MacCoss实验室的Brendan MacLean将培训新开发者的方法论应用于Claude Code,以管理拥有70万行C#代码、持续开发17年的开源蛋白质分析软件Skyline。他通过创建独立的AI上下文仓库、编写CLAUDE.md引导文件以及设计“技能”模块(如调试技能),为Claude Code建立项目认知。该方法显著提升了开发效率:搁置一年的文件视图面板功能在两周内完成;CSS布局更新从依赖设计师变为不到一天实现。此外,Claude Code还自动化了2000多张教程图片的截图比对和每日测试报告生成,团队现在主要依靠它生成代码和脚本。

AnthropicMCP/工具教程/实践编码

推荐理由:这不是又一篇 Claude Code 安利文,而是一个维护了 17 年 70 万行 C# 代码库的人,把带新人的方法论原封不动搬给了 AI,结果真管用。做 legacy 项目的人应该认真看他的 context 管理和 skill 库设计。
00:06
Google Blog:AI(RSS)
51
庆祝 Google Translate 20 周年:趣闻、技巧与可尝试的新功能

Google Translate 迎来 20 周年,从 2006 年的一项 AI 实验起步,现已支持近 250 种语言。官方分享了 20 条相关趣闻,并介绍了用户可尝试使用的实用技巧与新功能,以展示其多年来的技术演进与服务扩展。

Google产品更新多模态
4月28日
23:39
Mistral AI:News(网页)
68
Mistral AI 发布 Workflows 公开预览版,为企业AI工作流提供编排支持

Mistral AI 正式推出 Workflows 公开预览版,该产品定位为企业AI的编排层,旨在通过提供持久性、可观察性和容错性,帮助AI驱动的工作流从概念验证可靠过渡到生产环境。它集成于Studio平台,允许开发者用Python编写工作流,并可发布至Le Chat供组织成员触发。其核心功能包括持久化执行(支持从断点恢复)、完整的步骤跟踪与审计,以及通过 wait_for_input() 等方法实现人工介入审批。目前已有ASML、ABANCA等企业客户使用其自动化货物放行、文档合规检查等关键业务流程,将原本耗时数小时的人工操作缩短至几分钟。

智能体产品更新部署/工程
23:10
Anthropic:Newsroom(网页)
精选70
Claude创意工作套件

Anthropic推出Claude for Creative Work,这是一套连接器工具,可实现Claude与Blender、Autodesk、Adobe等主流创意软件的直接集成。这些连接器允许Claude访问各平台功能,例如在Adobe系列中调用50多款应用,在Autodesk Fusion中通过对话创建3D模型,或在Blender中通过自然语言操作Python API。创意工作者可利用Claude加速软件学习、编写脚本插件、桥接多工具工作流以及自动化批量处理等重复任务。该系列工具基于MCP标准,并已与多所艺术设计院校合作,旨在推动创意计算教育。

AnthropicMCP/工具产品更新
关联讨论 3 条X:阿易 AI Notes (@AYi_AInotes)X:Rohan Paul (@rohanpaul_ai)X:Testing Catalog (@testingcatalog)
推荐理由:Anthropic 把 Claude 塞进 Blender、Adobe、Ableton 这些创意工具里,不是又一个聊天框,而是用 MCP 让 AI 真正操作软件。做设计、做音乐、做 3D 的人第一次有了一个能跨工具干活的 AI 助手,值得试试。
21:38
腾讯混元:Research(API)
Hy3 preview : 混元大模型重建的第一步
20:46
公众号:可灵AI(快手·视频)
41
可灵AI超创亮相北京国际电影节,多部作品入围AIGC单元斩获大奖

可灵AI超创亮相北京国际电影节,多部作品入围AIGC单元并斩获大奖。

多模态行业动态视频
19:35
公众号:生数科技(Vidu·视频)
24
降本50%,效率提升10倍,Vidu发布一键生成AI解说剧产品,重塑解说剧生产链路

Vidu发布一键生成AI解说剧产品,实现降本50%、效率提升10倍,重新塑造解说剧生产链路。该产品无需人工剪辑与配音,可自动完成解说剧的全部生成流程,推动内容创作进入全AI化阶段。

产品更新图像生成视频
19:07
Qwen:Blog Retrieval(API)
精选57
FlashQLA: 面向GDN的CP-/Bwd友好型融合线性注意力内核

FlashQLA 发布了一组专为梯度下降网络优化的融合线性注意力内核。新内核在设计上对计算模式和后向传播更加友好,旨在提升训练效率。该技术通过优化内核融合策略,改进了注意力机制的计算性能,是提升大规模模型训练速度的关键底层优化。

数据/训练论文/研究部署/工程
关联讨论 1 条X:通义千问 / Qwen (@Alibaba_Qwen)
推荐理由:Qwen 团队发了一篇 fused linear attention 内核的工程论文,目标是把 GDN 架构的推理和反向传播都跑快。做底层优化的工程师值得看一眼,普通开发者可以略过。
19:06
公众号:昆仑万维(天工)
18
古城逐光·同心同行--昆仑万维大同团建凝聚AI奋进力量

昆仑万维在大同举办“古城逐光·同心同行”主题团建活动,通过古城探索与团队协作,凝聚AI奋进力量,强化团队向心力与创新共识。

其他
19:06
公众号:昆仑万维(天工)
30
昆仑万维"4+3战略"落地首季:一季度营收25.7亿元,视频与音乐模型登顶全球第一

昆仑万维发布2026年一季度财报,营收25.7亿元,同比增长46%,为“4+3战略”落地首季。公司自研视频模型与音乐模型均登顶全球第一,但正文未披露具体模型名称及版本号。具体营收增长主要来自AI业务驱动,战略聚焦多模态大模型与AI应用生态。

多模态行业动态
17:51
蚂蚁 inclusionAI:HuggingFace 新模型
49
inclusionAI发布Ling-2.6-flash-int4模型

inclusionAI团队宣布推出Ling-2.6-flash-int4模型,作为其通过开源与开放科学推动人工智能技术进步与普及的重要举措。该版本延续了团队降低AI应用门槛、促进技术民主化的核心使命,以轻量化技术方案进一步优化模型性能与部署效率。

开源/仓库模型发布端侧
13:36
公众号:智谱(GLM)
50
智谱入选《时代》"2026年最具影响力的10家人工智能公司"

智谱(GLM)入选《时代》杂志“2026年最具影响力的10家人工智能公司”榜单。该榜单关注人工智能领域的技术创新与行业影响力。

行业动态
12:34
Tomer Tunguz 博客(VC 分析)
精选64
GPU现货价格六周内暴涨114%

根据Ornn Compute Price Index数据,NVIDIA B200 GPU的现货租赁价格在六周内飙升114%,从三月初的2.31美元涨至本周的4.95美元/小时。此次价格暴涨与GPT-5.5等前沿模型发布带来的需求冲击紧密相关,这些模型需要Blackwell架构提供的内存支持。与此同时,B200与上一代H200的价差从0.28美元大幅扩大至1.80美元,不同云服务商之间的报价差距也扩大了一倍以上,反映出市场供应紧张。预计夏季B200价格将维持在5美元以上,云端推理成本持续上升。

现象/趋势行业动态部署/工程

推荐理由:Tomer Tunguz 用 Ornn 真实价格指数拆出 B200 六周涨 114% 的供需逻辑,做 AI infra 选型或算力采购的人该把这张图存下来,夏天 B200 破 5 刀基本板上钉钉。
12:34
Anthropic:Newsroom(网页)
43
Anthropic 任命澳新总经理并正式开设悉尼办公室

Anthropic 正式任命 Theo Hourmouzis 为澳大利亚和新西兰总经理,并同步开设悉尼办公室。Hourmouzis 拥有超过20年的亚太科技行业领导经验,将负责制定本地战略,推动 Claude 人工智能进入客户核心业务。公司正深化与联邦银行等企业的合作,并与澳大利亚国立大学等研究机构推进 AI for Science 项目。同时,Anthropic 近期与 Canva、Xero 建立了深度平台合作。悉尼办公室是其在亚太地区的最新布局,旨在贴近当地客户与市场。

Anthropic行业动态
12:33
Runway:News(网页)
精选58
无闲置GPU:Runway的研究计算管理

Runway通过采用Kueue作为Kubernetes准入控制器,将GPU利用率提升超过20%,同时保障团队容量。其核心机制是为关键工作预留配额,并设立共享队列借用闲置容量,当配额所有者需要时通过抢占回收资源。该系统运行于昂贵的多租户GPU集群,支持多节点训练的拓扑感知调度和弹性工作负载。具体实现中,团队拥有专用预留队列,而默认队列作为共享机会池,可借用闲置配额运行可中断工作负载。当预留队列需资源时,Kueue基于优先级和运行时间抢占默认队列中的任务,实现资源高效管理。

教程/实践部署/工程

推荐理由:Runway 把 Kueue + Kubernetes 的 GPU 调度实战写成了保姆级工程笔记,利用率翻倍的方案和踩坑细节都有,做大规模训练集群调度的团队可以直接抄作业。
12:33
OpenAI:官网动态(RSS · 排除企业/客户案例)
30
Choco 利用 AI 智能体实现食品分销自动化

Choco 通过集成 OpenAI API 构建了 AI 智能体系统,以自动化餐饮行业的食品采购与分销流程。该系统能自动处理订单、协调物流并优化库存,将人工操作时间减少了 70%,订单处理效率提升 50%。这一变革显著降低了供应链中的食物浪费,并帮助公司实现了业务规模化增长,展示了 AI 在传统产业中的实际应用价值。

智能体行业动态
12:33
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选70
一个用于编排的开源规范:Symphony

Symphony 是一个用于 Codex 编排的开源规范,能够将问题跟踪器转化为持续运行的智能体系统。该系统通过自动化任务协调与执行,显著提升工程团队的产出效率,同时减少开发者在不同任务间频繁切换带来的认知负担。其核心在于以标准化、可扩展的方式,将日常开发流程转化为由智能体持续驱动的工作流。

智能体OpenAI产品更新开源/仓库
关联讨论 3 条X:阿易 AI Notes (@AYi_AInotes)X:邵猛 (@shao__meng)X:Vista (@vista8)
推荐理由:OpenAI 把 Codex 的编排层抽成开源规范,等于告诉所有做 coding agent 的团队,底层调度逻辑不用自己造轮子了。做 AI 编程工具的值得花半小时看架构思路。
11:50
蚂蚁 inclusionAI:HuggingFace 新模型
51
inclusionAI/Ling-2.6-flash-fp8

inclusionAI 团队发布了 Ling-2.6-flash-fp8 模型,致力于通过开源与开放科学推动人工智能的发展与普及。该版本采用 FP8 精度优化,显著提升了推理效率并降低了计算资源消耗,是其在推进技术民主化进程中的最新实践。

开源/仓库模型发布端侧
11:27
蚂蚁 inclusionAI:HuggingFace 新模型
精选55
inclusionAI/Ling-2.6-flash

inclusionAI发布了Ling-2.6-flash模型。该模型是其开源语言模型系列的最新成员,旨在通过开源与开放科学推动人工智能的进步与民主化。此次发布延续了团队降低AI技术使用门槛、促进更广泛社区参与开发的使命。

开源/仓库模型发布端侧

推荐理由:蚂蚁 inclusionAI 的 Ling-2.6-flash 上线 HuggingFace,名字带 flash 大概率是轻量推理模型,但官方描述几乎空白,没有 benchmark 也没有用例,建议等社区实测再决定是否投入精力。
10:25
公众号:面壁智能(MiniCPM)
41
面壁智能与TINNOVE梧桐科技深化合作,共探下一代AI座舱

面壁智能与TINNOVE梧桐科技宣布深化合作,共同探索下一代AI座舱。

端侧行业动态
08:31
Claude Code:GitHub Releases(RSS)
精选60
Claude Code v2.1.121 更新:新增功能、体验优化与内存泄漏修复

本次更新为 Claude Code 带来多项增强与修复。新增功能包括 MCP 服务器的 `alwaysLoad` 配置、`claude plugin prune` 命令以及 `/skills` 界面搜索框。用户体验方面,优化了全屏模式滚动、对话框键盘滚动和长 URL 点击体验。重点修复了处理多张图片或使用 `/usage` 命令时可能出现的数 GB 内存泄漏问题,并解决了 Bash 工具在工作目录被删除后失效等稳定性缺陷。此外,还改进了 MCP 服务器的错误重试机制和终端会话标题的本地化显示。

智能体Anthropic产品更新编码

推荐理由:Claude Code 这版修了一堆让人抓狂的内存泄漏和崩溃问题,加上 alwaysLoad 和 plugin prune 两个实用功能,重度用户值得立刻升级,但对非用户来说只是例行迭代。
08:28
Hugging Face:Blog(RSS)
精选58
Adaptive Ultrasound Imaging with Physics-Informed NV-Raw2Insights-US AI

NVIDIA 在 Hugging Face 上发布了一款名为 NV-Raw2Insights-US 的物理信息人工智能模型,专门用于自适应超声成像。该模型能够直接处理原始超声射频数据,实时生成高质量的诊断图像。它通过结合物理定律与深度学习,显著提升了图像分辨率和对比度,同时将传统处理流程中的多个步骤整合为单一前向传播,大幅提高了计算效率。这一进展有望推动超声设备向更便携、智能和精准的方向发展。

具身智能论文/研究部署/工程

推荐理由:NVIDIA 把物理先验塞进超声成像管线,从原始射频数据直接出诊断结果,跳过传统重建步骤。做医疗 AI 的值得拆一下这个端到端思路,但离通用场景太远。
08:00
Apple Machine Learning Research(RSS)
精选62
LaDiR:潜在扩散模型增强 LLM 的文本推理能力

研究团队提出LaDiR推理框架,将连续潜在表征的表达能力与潜在扩散模型的迭代优化能力相结合,以增强现有大语言模型的推理性能。该框架首先构建一个结构化的潜在推理空间,通过扩散过程对潜在状态进行迭代细化,使模型能够全局性地重新审视和修正推理路径中的早期内容。这种方法突破了传统自回归解码在整体优化和多样化解决方案探索方面的限制,提升了链式思维生成的质量与效率。

推理数据/训练论文/研究

推荐理由:Apple 把扩散模型塞进 LLM 推理链,思路很野,用连续潜空间替代自回归 token 生成来解决「写到一半没法回头改」的老毛病。做推理优化或 diffusion 架构的值得细看,但离工程落地还远。
08:00
Apple Machine Learning Research(RSS)
45
StereoFoley: 从视频生成具有对象感知能力的立体声音频

StereoFoley是一个视频到音频的生成框架,能生成48kHz、语义对齐、时间同步且空间准确的立体声。现有视频生成音频模型大多局限于单声道或无法实现对象感知的立体声成像,主要受限于缺乏专业混音、空间准确的视频-音频数据集。该研究首先开发了一个从视频生成立体声的基础模型,在语义准确性上达到了与当前最先进V2A模型相当的性能。

多模态论文/研究
08:00
Apple Machine Learning Research(RSS)
49
条件扩散模型中组合泛化的局部机制

条件扩散模型展现出组合泛化能力,能生成超出训练分布的条件组合样本,但其机制尚不明确。研究聚焦于长度泛化,即生成比训练所见更多数量物体的图像。在受控的CLEVR场景中发现,模型仅在某些情况下能实现长度泛化,表明其并非总能掌握底层组合结构。通过分析扩散过程的局部动态,研究揭示了泛化成功与失败案例中条件交互模式的系统性差异,为理解生成式模型的组合推理边界提供了新视角。

图像生成论文/研究
03:02
Midjourney:Updates(RSS)
50
High-res rating

Midjourney团队正为v8.1/8.2版本筹备重大美学更新,并公开征集用户协助进行图像排序以改进模型。此次工作的核心在于,团队将首次在完整的2K分辨率下进行图像排序活动,旨在为模型获取最优的高清像素数据,以提升图像生成质量。

产品更新图像生成
01:27
公众号:小米 MiMo
45
小米 MiMo-V2.5 系列开源 & Orbit 百万亿 Token 计划启动

小米开源 MiMo-V2.5 系列模型,同时启动 Orbit 百万亿 Token 计划,携手全球开发者与 Agent 框架共建开源繁荣生态。

智能体开源生态模型发布
00:46
CMU:Machine Learning Blog
精选58
介绍ARFBench:基于真实事件的时间序列问答基准

每年系统故障导致损失超万亿美元,工程师需通过分析时间序列数据快速定位问题。时间序列问答(TSQA)是关键运维任务,对AI模型构成挑战。为此,研究团队推出ARFBench基准,基于Datadog真实内部事件及遥测数据构建。测试显示,当前领先的大型语言模型、视觉语言模型和时间序列基础模型在ARFBench上表现均有较大改进空间。团队提出混合TSFM-VLM模型,其整体性能接近前沿水平,为TSQA任务提供了新评估框架和改进方向。

论文/研究评测/基准部署/工程

推荐理由:CMU 和 Datadog 联手搞了个基于真实事故的时序问答基准,结论很诚实,现有模型全拉胯。做 SRE Agent 的团队该看看,这比合成数据的 benchmark 有说服力得多。
00:16
Gary Marcus:The Road to AI We Can Trust(RSS)
41
达里奥·阿莫代伊、炒作、AI安全与氛围编码AI灾难的爆发

AI领域的鼓吹者往往回避讨论关键风险。随着GPT、Claude、LLaMA等大型语言模型的快速迭代,行业在竞相追求参数规模与商业落地的同时,AI安全问题正以“氛围编码”的形式被系统性低估——即通过模糊的修辞淡化潜在危害。 Anthropic联合创始人达里奥·阿莫代伊等研究者多次警示,缺乏严格安全框架的AI发展可能引发连锁性灾难,包括恶意使用、社会分化与失控性风险。当前行业亟需将安全指标从抽象讨论转化为可量化的技术约束。

大佬观点安全/对齐现象/趋势
4月27日
23:58
GitHub Blog
精选79
GitHub Copilot 将转向基于使用量的计费模式

自6月1日起,GitHub Copilot 的使用将开始消耗 GitHub AI Credits,计费模式正式从固定订阅制转变为基于实际使用量的计费。这一变化意味着用户的费用将与 AI 助手的具体调用量直接挂钩,而非统一的月费或年费。

编码行业动态部署/工程
关联讨论 3 条X:宝玉 (@dotey)Simon Willison 博客Hacker News 热门(buzzing.cc 中文翻译)
推荐理由:GitHub Copilot 从订阅制转向按量计费,这是 AI 编程工具定价范式的标志性拐点,所有重度用户和竞品都得重新算账。
22:28
Hugging Face:Blog(RSS)
53
如何利用OpenAI的Privacy Filter构建可扩展的Web应用

OpenAI正致力于通过开源与开放科学推动人工智能的进步与民主化。这一举措旨在降低AI技术的使用门槛,促进更广泛的创新与合作。其Privacy Filter工具为开发者提供了构建可扩展Web应用的关键支持,帮助在保障用户数据隐私的同时,高效集成AI能力。这一方向强调了技术开放性与负责任开发并重的理念。

OpenAI教程/实践部署/工程
22:22
Dwarkesh Patel:Podcast & Blog(RSS)
42
周末随想--更多开放性问题、智能与权力、科学验证难题、达尔文主义的并行发现

作者围绕多个开放性问题展开探讨,包括人工智能领域中智能与权力的本质区别及其对社会结构的潜在影响。科学验证机制面临的可靠性危机被提及,尤其是在复杂系统研究中。同时,文章指出达尔文进化论的核心概念曾出现多地域独立发现的现象,这引发了对知识创造与传播模式的思考。这些议题共同指向技术发展背后更深层的认知与伦理挑战。

大佬观点现象/趋势
22:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
51
OpenAI获得FedRAMP Moderate授权

OpenAI的ChatGPT Enterprise与API已获得FedRAMP Moderate安全授权,允许美国联邦机构在符合数据安全与隐私合规要求的前提下,安全采用其人工智能服务。

OpenAI政策/监管行业动态
21:30
公众号:昆仑万维(天工)
37
营收增长45%、短剧暴增865%:昆仑万维的AI增长引擎已开启

昆仑万维营收同比增长45%,短剧业务收入暴增865%,AI增长引擎已正式开启。公司通过AI技术驱动核心业务,短剧领域表现突出,体现了AI与内容产业融合的初步成果。

行业动态
21:22
Google Blog:AI(RSS)
50
加入 Google 与 Kaggle 的全新 AI Agents Vibe Coding 课程

Google 与 Kaggle 再度推出为期 5 天的 AI Agents 强化课程,现已开放注册。该课程旨在教授开发者如何构建和部署 AI 智能体,内容涵盖从基础概念到实际应用。课程形式为短期集中学习,参与者将通过 Kaggle 平台进行实践。

智能体Google教程/实践
21:13
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选81
Microsoft 与 OpenAI 合作进入新阶段

OpenAI 与 Microsoft 宣布修订合作协议,旨在简化合作结构并明确长期合作框架。新协议将为持续的大规模人工智能创新提供支持,标志着双方战略伙伴关系进入更清晰、更稳定的新阶段。此次调整侧重于强化合作效率与长期目标的一致性,共同推进 AI 技术的前沿发展。

MicrosoftOpenAI行业动态
关联讨论 8 条X:Kim (@kimmonismus)X:Sam Altman (@sama)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)Simon Willison 博客Hacker News 热门(buzzing.cc 中文翻译)X:Rohan Paul (@rohanpaul_ai)X:宝玉 (@dotey)
推荐理由:OpenAI 和微软重新谈定了合作框架,这事牵动的不只是两家公司,Azure 上跑 OpenAI API 的每一个产品都在这个棋盘上。不过目前公告措辞极模糊,具体条款还得等后续披露。
20:30
公众号:可灵AI(快手·视频)
25
可灵AI创作者计划3.0正式升级!
产品更新视频
19:22
公众号:阶跃星辰(Step)
45
阶跃与腾讯云达成战略合作,共同打造智能座舱 Agent 助手

近日,阶跃与腾讯云达成战略合作,双方将围绕智能座舱 Agent 展开深度共创,打造全新的智能座舱 Agent 助手。该助手以语音为入口,实现免唤醒、连续对话、情绪识别的超自然交互,并能基于用户情绪、驾驶状态、环境和历史信息秒懂意图,精准推荐腾讯系音乐、视频、地图等内容与应用生态。同时,产品打通腾讯在支付、地图、出行服务等领域的生态接口,从需求直达交易闭环,为用户提供一站式服务。

智能体行业动态语音
17:55
公众号:通义实验室(千问)
34
搜对≠答对:EAPO用"证据奖励"让大模型不再靠猜
检索增强推理教程/实践
15:29
公众号:火山引擎
38
字节跳动发布《2025字节跳动企业社会责任报告》

《2025字节跳动企业社会责任报告》发布。

行业动态
‹ 上一页
1…2122232425…50
下一页 ›