AIHOT

全部动态一手 · 2416 条

全部一手资讯 X 论文

4月16日周四

4月15日周三

4月14日周二

4月13日周一

4月12日周日

4月11日周六

4月10日周五

4月16日

04:47

Gary Marcus：The Road to AI We Can Trust（RSS）

荒谬的巅峰：第二部分

正文内容仅包含"You can't make this up"一句感叹，缺乏撰写摘要所需的具体信息（如发布的产品、技术细节、数据指标或关键变化等）。请提供完整文章内容以便提取关键信息点并完成摘要。

大佬观点现象/趋势

01:00

GitHub Blog

用 GitHub Copilot CLI 构建个人组织指挥中心

一位 GitHub 工程师基于 GitHub Copilot CLI 构建了个人组织指挥中心，详细展示了 AI 如何辅助该生产力工具的开发全过程。这一实践案例记录了从需求构思到功能实现的技术细节，体现了 AI 编程助手在加速个人项目开发和提升工作效率中的实际应用价值。

智能体GitHubMicrosoft教程/实践

4月15日

21:01

Cloudflare Blog

Project Think：基于 Cloudflare 打造下一代 AI 智能体平台

Cloudflare 发布 Project Think 及 Agents SDK 下一版本预览，该平台从轻量级原语转型为功能完备的一站式开发平台，支持 AI 智能体实现思考、行动与状态持久化。新版本提供开箱即用的基础设施，帮助开发者构建具备持续认知能力的下一代 AI 应用。

智能体产品更新部署/工程

21:00

Cloudflare Blog

Agent Lee 正式发布：Cloudflare 技术栈的全新交互界面

Cloudflare 推出仪表盘内置代理 Agent Lee，将传统多标签页手动操作界面革新为单一提示词交互模式。基于沙盒化 TypeScript 构建，该工具以技术协作者身份协助用户排查故障、管理 Cloudflare 技术栈，实现从繁琐手动配置向智能化对话式运维的转变，提升基础设施管理效率与体验。

智能体产品更新部署/工程

20:00

Cursor Blog

精选70

更强AI模型推动开发者转向更高复杂度工作

一项针对500家公司开发者使用Cursor的八个月研究发现，在Opus 4.5和GPT-5.2等先进模型发布后，人均周AI使用量增长44%。开发者初期用更强模型完成更多同复杂度任务，4-6周后开始转向更高复杂度工作，高复杂度任务量激增68%，远超低复杂度任务的22%。媒体广告、软件工具和金融科技行业增长最为显著。任务分布呈现结构性变化：文档编写、架构设计等管理性任务增长超50%，而UI设计等独立任务仅增15%，表明开发者角色正从代码生成转向代码库管理。研究揭示了类似杰文斯悖论的效应——AI效率提升反而刺激了总需求，并可能创造新的经济活动空间。

现象/趋势编码论文/研究

推荐理由：Cursor 拿 500 家公司八个月的真实数据证明了一个反直觉结论，AI 越好开发者用得越多，而且是从做更多简单活慢慢转向啃硬骨头。做 AI 产品的人该认真想想这个杰文斯效应。

18:00

公众号：生数科技（Vidu·视频）

生数科技Vidu发布《AI漫剧视频模型行业白皮书V1.0》

生数科技Vidu正式发布《AI漫剧视频模型行业白皮书V1.0》，该白皮书已上市。

图像生成行业动态视频

16:01

公众号：可灵AI（快手·视频）

可灵AI高校创作工坊，解锁AI创作新可能

可灵AI推出高校创作工坊，面向大学生开放AI创作体验，鼓励探索AI在内容生成中的应用，解锁创作新可能。

行业动态视频

12:57

Claude Code：GitHub Releases（RSS）

v2.1.109 版本发布

v2.1.109 版本正式发布，重点优化了扩展思考功能的交互体验。此次更新针对深度思考指示器进行改进，新增旋转进度提示动画，使用户在模型进行复杂推理期间能够更直观地感知实时处理状态。该版本聚焦于提升长时间计算场景下的视觉反馈，通过动态指示元素缓解等待焦虑，进一步完善了产品的人机交互细节。

智能体Anthropic产品更新编码

11:00

公众号：小红书技术（dots.llm）

小红书 Relax 开源发布：面向全模态 Agentic 的异步 RL 训练引擎

小红书开源发布Relax，一个为全模态数据、Agentic工作流和大规模异步训练Co-Design的RL训练引擎。

智能体开源/仓库开源生态

08:00

OpenRouter：Announcements（RSS）

OpenRouter 发布视频生成功能

OpenRouter 宣布视频生成功能已上线。用户只需使用单一 API 即可访问该平台上的顶级视频模型。这一功能通过统一接口简化了视频模型的调用流程，开发者无需额外配置就能快速集成视频生成能力。

产品更新

08:00

OpenRouter：Announcements（RSS）

OpenRouter 宣布视频生成功能上线

OpenRouter 视频生成功能正式上线，用户通过单一的 API 接口即可调用当前最顶尖的视频模型，无需分别对接多个服务。

产品更新

08:00

Cursor Blog

精选69

在画布中与智能体创建的可视化界面交互

Cursor新增画布功能，可将信息转化为可视化、可交互的界面，替代难以阅读的长篇文本。智能体能利用画布为真实数据创建仪表盘，或定制带逻辑的交互界面，应用于代码审查、学习库文档乃至管理其他智能体。该功能基于React组件库构建，包含表格、图表等原生组件。在数据密集型任务中尤为高效，例如聚合多源数据生成统一分析图表，或在代码审查中智能分组并优先展示关键变更。Cursor团队已借此显著提升了模型评估分析和复杂问题研究的效率，成为扩展人机协作信息带宽的关键工具。

智能体产品更新编码

推荐理由：Cursor 把 agent 输出从纯文本拉到可交互的可视化画布，PR review、eval 分析这些高频场景立刻能用上。做 coding agent 的同行该想想自己的 agent 输出形态是不是该升级了。

08:00

OpenRouter：Announcements（RSS）

精选57

宣布推出视频生成功能

OpenRouter平台现已上线视频生成服务。用户可通过单一API接口，直接调用顶级的视频生成模型。这一集成简化了开发流程，使开发者无需分别对接不同厂商，即可便捷地访问和使用当前领先的视频AI模型能力。

产品更新视频部署/工程

推荐理由：OpenRouter 把视频生成塞进统一 API，对已经在用它做多模型路由的开发者来说是零成本扩展，但对大多数人只是又一个聚合入口，不算必须关注的节点。

05:00

Nathan Lambert：Interconnects（RSS）

近期构建项目：ATOM Report、后训练课程、新书完稿及持续研究

作者汇总了近期推进的四大核心项目：发布 ATOM Report、开发后训练课程（post-training course）、完成技术书籍撰写，以及推进 ongoing research。这些工作覆盖行业研究、教育培训、知识沉淀与前沿探索，呈现从理论总结到实践落地的完整技术输出链条。目前各项目均已进入收尾或持续深化阶段，标志着阶段性成果的集中交付。

大佬观点数据/训练

04:11

OpenAI：官网动态（RSS · 排除企业/客户案例）

面向下一代网络防御的可信访问

OpenAI 扩展 Trusted Access for Cyber 计划，向经过审查的网络防御者推出 GPT-5.4-Cyber 模型，并在 AI 网络安全能力持续进阶的背景下强化安全保障机制。该举措旨在为下一代网络防御提供可信的 AI 访问渠道，确保先进 AI 技术被负责任地应用于防御场景，在提升防御能力的同时严格管控潜在风险。

OpenAI产品更新

02:17

GitHub Blog

破解AI智能体：通过GitHub Secure Code Game培养agentic AI安全技能

GitHub Secure Code Game是一款免费开源的安全训练游戏，设置五个渐进式挑战教授开发者发现和利用真实世界的agentic AI漏洞。目前已有超过10,000名开发者使用该游戏磨练安全技能，以提升对智能体AI系统的安全防护能力。

智能体GitHub教程/实践

4月14日

22:29

Anthropic：Newsroom（网页）

Anthropic 长期利益信托任命 Vas Narasimhan 加入董事会

Anthropic 长期利益信托任命 Novartis 首席执行官 Vas Narasimhan 加入董事会。作为医生科学家，Narasimhan 曾在高度监管环境下主导 35 种以上新药的开发审批，擅长将突破性技术安全规模化交付。此次任命后，信托指派董事在董事会中占据多数席位，强化了对公司公共利益使命与财务目标平衡治理的独立监督。

Anthropic行业动态

20:56

公众号：月之暗面（Kimi）

重要提醒

行业动态

20:00

Cursor Blog

精选62

多智能体系统将GPU内核性能提升38%

我们与NVIDIA合作，利用自主运行的多智能体系统，在为期三周内对235个真实CUDA内核进行了优化。该系统从零开始构建并优化Blackwell GPU内核直至汇编级别，实现了38%的几何平均速度提升，其中63%的问题超越基线，19%实现超2倍优化。这些内核直接影响AI训练与推理效率，传统上需资深工程师耗时数月乃至数年的优化工作，该系统在数周内即自主完成，并能探索更广阔解决方案空间，突破了人工逐项优化的限制。

智能体现象/趋势编码部署/工程

推荐理由：Cursor 把自家多 Agent 系统拉去优化 CUDA 内核，38% 的 geomean 提速不算炸裂，但真正值得看的是它证明了 Agent 可以在无人干预下跑三周啃硬骨头，这对做 Agent 产品的人是个强信号。

18:05

公众号：生数科技（Vidu·视频）

生数科技与阿里云达成战略合作，共建"云+AI"全栈生态，加速多模态大模型与世界模型产业落地

生数科技与阿里云签署战略合作协议，双方将共建“云+AI”全栈生态，推动多模态大模型与世界模型的产业落地。

多模态行业动态

17:33

Google Blog：AI（RSS）

Google 于华盛顿举办 AI for the Economy Forum 汇聚各界人士

Google 在华盛顿特区举办 AI for the Economy Forum，汇聚各界人士共同探讨人工智能与经济发展的关键议题。该论坛旨在搭建多方对话平台，促进关于 AI 技术如何驱动经济增长、重塑劳动力市场及推动产业创新的深度交流，助力构建包容且可持续的 AI 经济生态，体现科技巨头在推动负责任人工智能发展中的积极作用。

Google行业动态

15:07

公众号：MiniMax（稀宇科技）

MiniMax Agent 更新：这次我们重新设计了 Agent 操作电脑的方式

MiniMax Agent 的此次更新重新设计了 Agent 操作电脑的方式。本次更新全部内容即是对 Agent 与电脑的交互方式进行了重新设计。

智能体产品更新

14:31

Claude Code：GitHub Releases（RSS）

v2.1.107 版本发布

v2.1.107 版本已发布，主要优化了长时间操作场景下的用户反馈体验。新版本改进了思考提示（thinking hints）的显示机制，使其在系统执行冗长运算过程中显著提前出现。用户现在能够更快获知当前处理状态与思维进度，有效减少等待过程中的不确定性，提升交互透明度与操作可控感。

智能体Anthropic产品更新编码

08:00

Tomer Tunguz 博客（VC 分析）

主动式安全智能系统

前Amazon GuardDuty负责人Shachar Hirshberg与Abnormal Security前AI负责人Dan Shiebler创立Artemis，推出新一代安全智能平台以应对AI时代的自主化攻击。该平台通过语义理解、智能体检测和闭环学习三大技术，将传统SIEM升级为具备自主推理能力的安全系统。Artemis已在数月内部署至十余家大型企业，每小时处理超10亿起安全事件，并完成A轮融资。

智能体行业动态

06:28

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.105 发布

Claude Code v2.1.105 新增 EnterWorktree 路径参数、PreCompact hook 阻塞压缩及插件后台监控功能，技能描述上限提升至 1,536 字符。优化 API 流 5 分钟无数据自动中止、WebFetch 自动过滤 CSS/JavaScript、/doctor 支持一键修复问题。同时修复队列图片丢失、终端输入异常、MCP 工具异步加载失败等 30 余项问题。

智能体Anthropic产品更新编码

03:25

Google Research：Blog（网页）

利用生成式AI培养未来就绪技能

Google Research发布实验性评估工具Vantage，通过生成式AI模拟多人协作场景，测试学生的批判性思维与协作等"未来就绪技能"。系统由Executive LLM驱动AI化身，在对话中动态引入冲突以收集能力证据，再由AI Evaluator实时评分。与纽约大学的联合研究显示AI评分与人类专家水平相当，188名18-25岁测试者参与了验证。该项目现已上线Google Labs。

智能体Google论文/研究

00:00

Google Research：Blog（网页）

AI生成合成神经元加速大脑测绘

Google Research发布MoGen神经元形态生成模型，利用点云流匹配技术将随机三维点云转化为逼真神经元几何结构。在PATHFINDER重建模型训练中加入MoGen合成神经元后，错误率降低4.4%，主要减少神经元合并错误，相当于为完整小鼠大脑测绘节省157人年手动校对时间。这是生成式AI首次用于提升连接组学重建精度，盲测显示专家无法区分合成与真实神经元片段。

Google开源生态数据/训练论文/研究

4月13日

22:07

CMU：Machine Learning Blog

AI 何时该退后：教会 Agent 预判人类介入时机

研究人员发布 CowCorpus 数据集，包含 400 个真实人机协作网页会话和 4200 余个交错动作，用于训练 AI 预判人类介入时机。该数据集通过 CowPilot 收集自 20 名真实用户，包含逐步的干预时刻标注。针对当前 AI 代理要么忽视用户需求、要么频繁请求确认的问题，研究转向人机协作范式，让系统学会预测人类何时希望接管，而非追求端到端完全自主。

智能体论文/研究

10:04

Claude Code：GitHub Releases（RSS）

v2.1.104 版本发布

正式发布 v2.1.104 版本。当前发布说明中未提供具体的更新内容、变更日志或技术细节，未包含功能改进、问题修复等相关信息。建议查阅版本控制系统的提交历史或联系维护者以获取完整的版本变更详情。

智能体Anthropic产品更新编码

08:56

公众号：MiniMax（稀宇科技）

MiniMax M2.7 × Hermes Agent：开启自我进化的 Agent 工作流

MiniMax M2.7 与 Hermes Agent 结合，构建可自我进化的 AI 智能体工作流。

智能体模型发布

4月12日

21:30

公众号：MiniMax（稀宇科技）

MiniMax M2.7开源，携手全球伙伴加速AI生态繁荣

MiniMax 正式开源 M2.7 模型，并联合全球合作伙伴共同加速人工智能生态的繁荣发展。

开源生态模型发布

4月11日

21:02

Nathan Lambert：Interconnects（RSS）

开放模型联盟的必要性

作者坦承对联盟（consortium）形式的个人厌恶，同时论证开放模型联盟（open model consortium）的建立具有不可避免的必要性。这一看似矛盾的立场暗示，尽管反感此类组织的官僚与低效，但在当前大模型竞争格局下，为对抗封闭生态、维护开源模型发展，行业协同仍须通过联盟形式实现。

大佬观点开源生态

03:03

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.101 发布

Claude Code 发布 v2.1.101，新增 /team-onboarding 命令生成团队上手指南，默认支持 OS CA 证书存储以适配企业 TLS 代理，/ultraplan 可自动创建云环境。优化 brief 模式重试、focus 模式摘要、速率限制提示及插件钩子逻辑。修复 POSIX which 命令注入漏洞、长会话内存泄漏、--resume 上下文丢失、权限规则覆盖失效等关键问题，以及子代理 MCP 工具继承、沙箱命令执行等错误。

智能体Anthropic产品更新编码

4月10日

21:30

公众号：MiniMax（稀宇科技）

MiniMax Music 2.6：我们想讲四个人的故事

MiniMax Music 2.6 版本发布，以“四个人的故事”为主题。

多模态模型发布

17:14

公众号：智谱（GLM）

GLM-5.1获LMArena代码榜开源第一、全球第三

GLM-5.1在LMArena Code Arena登顶开源第一、全球第三。它继承上一代的SOTA编码能力，并在长程任务突破：8小时构建Linux桌面、655次迭代优化向量数据库、1000轮工具调用优化机器学习模型。METR榜下，它是唯一达8小时级持续工作的开源模型（除Claude Opus 4.6外）。

开源生态模型发布编码

关联讨论 1 条

15:50

公众号：通义实验室（千问）

通义实验室《热浪中的每个"我"》线下演讲：5句AI时代心里话引共鸣

通义实验室举办《热浪中的每个“我”》线下演讲，5位不同年龄和背景的开发者分享了AI解决真实问题的故事：为家人整理十几年病历搭建病历管理工具、工科生跨界做AI育种、面向东南亚多语言文化构建SEA-LION模型、脑瘫患者用AI开发“燃言”重获表达权、63岁老人教千余名同龄人使用AI。这些案例体现了AI在长尾需求、农业育种、母语包容、残障辅助和数字适老等领域的落地价值。

行业动态

13:16

Claude Code：GitHub Releases（RSS）

v2.1.100 版本发布

版本 v2.1.100 已正式发布，但官方未提供具体的更新内容、变更日志或发布说明。建议用户关注后续补充信息或查看相关发布页面以获取详细更新详情。

智能体Anthropic产品更新编码

12:20

公众号：昆仑万维（天工）

昆仑万维方汉：「一人公司」时代全面到来，你能干什么？

昆仑万维创始人方汉在文中指出，「一人公司」时代已全面到来，并抛出个人在此趋势下如何定位与行动的核心问题。

其他大佬观点

12:00