AIHOT

全部动态一手 · 2416 条

全部一手资讯 X 论文

4月8日周三

4月7日周二

4月6日周一

4月4日周六

4月3日周五

4月2日周四

4月8日

18:00

公众号：蚂蚁百灵（Ling）

cuLA：用 CUDA 重写线性注意力

推理教程/实践

15:01

公众号：豆包（字节）

如何用豆包一键生成PPT？

图像生成教程/实践

14:06

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/TC-AE

inclusionAI团队发布了TC-AE项目，旨在通过开源与开放科学推动人工智能技术的进步与民主化。该项目致力于降低AI技术的使用门槛，促进更广泛的社区参与和创新。核心变化在于构建了一个可访问的AI开发框架，强调协作与知识共享。此举预期将加速AI工具在多元领域的应用，并推动技术发展的透明性与包容性。

开源/仓库模型发布

13:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

OpenAI 发布 Child Safety Blueprint（儿童安全蓝图）

OpenAI 发布 Child Safety Blueprint，提出负责任开发 AI 的系统性路线图。该方案通过建立技术保障机制、设计适龄交互界面及推动跨领域协作，致力于在保护青少年网络安全的同时赋予其数字能力。蓝图强调将儿童安全原则融入 AI 产品全生命周期，为行业提供兼顾安全防护与成长赋能的框架，应对未成年人使用人工智能的潜在风险。

OpenAI安全/对齐

12:37

Claude Code：GitHub Releases（RSS）

v2.1.96

Claude Code v2.1.96 修复 Bedrock 请求 403 "Authorization header is missing" 错误，解决使用 AWS_BEARER_TOKEN_BEDROCK 或 CLAUDE_CODE_SKIP_BEDROCK_AUTH 环境变量时的认证失败问题。该回归缺陷源自 2.1.94 版本。

智能体Anthropic产品更新编码

10:41

公众号：智谱（GLM）

精选62

GLM-5.1开源：一个独立工作8小时的模型

智谱推出开源模型GLM-5.1，支持独立工作长达8小时。模型可直接部署使用，无需人工频繁干预，适用于长周期自动化任务场景。

智能体开源生态模型发布

关联讨论 1 条

推荐理由：智谱把 GLM-5.1 开源，并且主打 8 小时独立工作，这个定位切中了 agent 场景下长任务执行的痛点，想做自动化流程的可以跑起来试试。

05:18

Claude Code：GitHub Releases（RSS）

v2.1.94

新版本新增对 Amazon Bedrock（由 Mantle 驱动）的支持，并将 API-key、Bedrock/Vertex/Foundry、Team 及 Enterprise 用户的默认 effort level 从 medium 提升至 high。修复了 429 速率限制后代理卡死、macOS 控制台登录失败、插件 hooks 被忽略、长会话滚动回显重复、CJK 字符损坏等关键问题。VSCode 扩展优化了冷启动性能并新增设置解析失败警告。

智能体AnthropicMCP/工具产品更新

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

Scaling Managed Agents： Decoupling the brain from the hands

00:00

Meta AI：Blog（网页）

精选73

Alta Daily借助Meta SAM模型革新数字衣橱体验

2025年推出的AI时尚应用Alta Daily，利用Meta的Segment Anything Model (SAM)分割和数字化用户上传的衣物图像。用户可拍摄整个衣橱，应用通过自然语言提示推荐穿搭，并在虚拟形象上展示效果。面对用户上传内容的复杂场景（如纯色背景、复杂光照），SAM在八个产品类别中分割效果最佳，能处理镜面自拍、地毯背景等挑战。采用SAM使应用以低成本处理超2000万张图像，节省了API费用。目前在美国、法国、德国、墨西哥和荷兰拥有大量用户，团队正试验SAM 3D模型以提升虚拟试衣沉浸感。

Meta产品更新图像生成

推荐理由：开源AI模型赋能时尚应用，降低创业成本并提升用户体验。

00:00

Google Research：Blog（网页）

改进学术工作流程：推出两款用于图表生成与同行评审的AI智能体

Google Cloud推出PaperVizAgent与ScholarPeer两款学术AI智能体。前者通过检索、规划、风格、可视化与批判五个专门智能体协作迭代，将论文文本转化为符合发表标准的图表，综合评分（60.2）显著超越人类基线（50.0）及GPT-Image-1.5等模型；后者模拟资深审稿人流程，动态构建文献背景并验证基线，实现基于实证的自动化同行评审。

智能体Google论文/研究

4月7日

19:39

公众号：智谱（GLM）

智谱向2027届同学发放AGI入场券

智谱（GLM）通过微信公众号向2027届同学推送AGI入场券，邀请其进入AGI相关体验或学习环节。

行业动态

19:32

公众号：蚂蚁百灵（Ling）

Ming-flash-omni：从看图到发文，打通全模态创作闭环

Ming-flash-omni 模型具备全模态创作能力，能够同时完成照片中路人干扰的识别、自动修图、修图效果自评，并最终生成一段社交媒体推文，实现从视觉理解到内容发布的完整闭环。

多模态模型发布

17:32

公众号：通义实验室（千问）

通义实验室「热浪中的每个"我"」年度对话活动预告

通义实验室（千问）将于4月10日（本周五）13:00举办年度对话活动「热浪中的每个“我”」，主题围绕AI与人的关系。

行业动态

17:32

公众号：通义实验室（千问）

FIPO：精准追踪2%的Token，突破大模型推理瓶颈！

FIPO方法通过精准追踪仅占2%的关键Token，有效缓解大模型强化学习中的“蝴蝶效应”，从而突破推理性能瓶颈。

推理数据/训练论文/研究

17:26

蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/TC-AE

研究团队发布了TC-AE，一种用于深度压缩自动编码器的新方法，旨在突破现有模型的令牌容量限制。该方法通过创新的架构设计，显著提升了模型在压缩表示中保留信息的能力，实现了更高的压缩效率与重建质量。具体指标显示，TC-AE在多个基准测试中，相较于传统深度压缩自动编码器，将有效令牌容量提升了约30%，同时保持了较低的计算开销。这项工作为高密度数据压缩与表示学习提供了新的技术路径。

开源/仓库数据/训练论文/研究部署/工程

11:46

公众号：昆仑万维（天工）

对话周亚辉："一人公司"火爆，企业级Agent才是金矿

昆仑万维创始人周亚辉认为，传统SaaS正在被AI侵蚀，新一代Agent尚未出现绝对赢家，这可能是未来几年最大的机会。

智能体大佬观点现象/趋势

00:06

Gary Marcus：The Road to AI We Can Trust（RSS）

山姆·奥特曼，不受真相约束

《纽约客》最新调查报道证实了对OpenAI首席执行官山姆·奥特曼的既有质疑。报道指出其在公共言论中缺乏对事实的约束，存在夸大或误导性陈述。这一调查为此前关于奥特曼诚信问题的担忧提供了佐证，揭示了这位AI行业领军人物在承诺与事实之间的偏差，反映出其言行中真实性约束的缺失。

OpenAI大佬观点

4月6日

20:00

Cursor Blog

精选66

通过warp decode提升MoE模型推理效率

针对Blackwell GPU上的小批量解码，研究提出了一种名为“warp decode”的新方法。该方法颠覆了传统以专家为中心的计算路径，改为让每个GPU warp负责计算一个输出神经元。这一根本性改变消除了原有流程中五个纯数据管理的“簿记”步骤，将整个MoE计算层压缩为仅两个内核。其优势在于避免了填充、分散和中间缓冲区的读写，并通过warp独立性实现了更好的调度。在Blackwell GPU上，该方法实现了1.84倍的吞吐量提升，同时输出精度更高，与全FP32参考值的差距缩小了1.4倍，有效加速了模型研发流程。

推理论文/研究部署/工程

推荐理由：Cursor 把 MoE 推理的并行轴从专家翻转到输出神经元，Blackwell 上吞吐涨 1.84 倍还顺带提精度，这种同时赢性能和精度的内核优化极其罕见，做推理引擎的值得逐行读。

18:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

OpenAI 宣布推出安全研究奖学金试点计划

OpenAI 启动一项全新的安全研究奖学金试点计划，旨在支持独立的安全与对齐研究，并培养下一代人才。该计划为研究人员提供独立开展 AI 安全和对齐研究的机会，同时致力于发掘和培养该领域的新兴研究力量，推动人工智能安全研究的长期发展。

OpenAI安全/对齐

15:00

OpenAI：Alignment 研究博客（RSS）

推出 OpenAI 安全研究员计划

OpenAI 启动了一项试点计划——OpenAI 安全研究员计划，旨在支持独立的安全与对齐研究，并培养下一代相关人才。该计划将为研究人员提供资金、资源以及与 OpenAI 团队的协作机会，以推进人工智能安全领域的前沿工作。此举是 OpenAI 构建更安全、更对齐的 AI 系统整体战略的一部分。

OpenAI安全/对齐行业动态

10:30

OpenAI：官网动态（RSS · 排除企业/客户案例）

智能时代的产业政策

提出了一套面向AI时代的雄心勃勃的以人为本的产业政策方案，聚焦扩大经济机会、促进繁荣共享与构建韧性制度三大支柱，以应对先进智能技术演进带来的挑战。该框架强调在技术变革中保障人的主体地位，建立包容性制度体系确保AI发展成果广泛惠及社会，同时增强 institutions 适应智能化转型的长期能力。

OpenAI政策/监管

00:37

Gary Marcus：The Road to AI We Can Trust（RSS）

首个"18亿美元""AI公司"的幕后故事

由于提供的正文内容仅包含不完整片段（"AI isn't the only thing behind Medvi"），缺乏关键信息点（如公司具体业务、融资细节、技术突破或财务指标等），无法撰写符合要求的100-200字摘要。请提供完整正文以便提取核心事实与数据。

大佬观点现象/趋势

00:00

Anthropic：Newsroom（网页）

Anthropic与Google、Broadcom扩大合作，获多千兆瓦下一代算力

Anthropic宣布与Google、Broadcom达成新协议，将获得多千兆瓦下一代TPU算力，预计2027年上线。这是其迄今最大的算力投资，用以支持Claude模型及激增的客户需求。数据显示，Claude年收入运行率已突破300亿美元，年消费超百万美元的企业客户两个月内从500家翻倍至超1000家。新设施主要位于美国，符合其500亿美元投资美国基础设施的承诺。公司强调将继续保持多硬件平台策略，AWS仍是主要云服务商。

AnthropicGoogle行业动态部署/工程

4月4日

12:57

公众号：昆仑万维（天工）

天工AI Mureka惊艳央视《焦点访谈》！1 分钟谱就宋词新声，彰显中国 AI 原创力量

天工AI Mureka亮相央视《焦点访谈》，1分钟内即可为宋词谱曲，展现中国AI在音乐创作领域的原创能力。

产品更新语音

08:42

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.92

新增强制远程设置刷新策略、Bedrock 交互配置向导与按模型成本细分，远程控制会话默认使用主机名前缀。修复子代理生成、工具验证、API 400 等十余项错误，Write 工具大文件 diff 速度提升 60%。移除 /tag 和 /vim 命令，Linux 沙盒恢复 seccomp 限制。

智能体Anthropic产品更新编码

00:57

Nathan Lambert：Interconnects（RSS）

精选

Gemma 4 与开放模型成功之道

Gemma 4 的发布揭示了开放模型成功的真正标准。文章指出，决定模型成败的关键并非基准测试分数（benchmark scores），而是其他因素。当前 AI 领域过度关注 leaderboard 排名，但高分数不等于实际应用价值与社区采用率。真正的成功取决于模型解决真实场景需求的能力、开发者友好度以及生态建设，而非单纯的技术指标领先。这一观点挑战了以 benchmark 为导向的行业评估范式。

Google大佬观点开源生态模型发布

关联讨论 9 条

推荐理由：开源模型成败不只看榜单分数，Hugging Face 大佬揭秘真实胜负手

4月3日

17:44

公众号：月之暗面（Kimi）

和 Kimi 一起投身 AGI，穿越成长周期

行业动态

14:14

公众号：通义实验室（千问）

Wan2.7-Video 为创作自由而来

产品更新视频

13:08

Steve Yegge：Medium（RSS）

Gas Town与Beads同步发布1.0.0正式版

Gas Town（编程智能体框架）与Beads（智能体记忆系统）今日同步发布1.0.0正式版。Gas Town目前拥有13k星标，已进入稳定维护模式，让非技术人员也能构建软件。Beads则以轻量级问题工单为基础，将记录存储在Git中并支持SQL查询，为智能体提供跨会话的历史记录与上下文。

智能体产品更新开源生态

12:15

公众号：小米 MiMo

Xiaomi MiMo Token Plan 答疑

其他教程/实践

12:15

公众号：小米 MiMo

Xiaomi MiMo Token Plan 全球发布

产品更新端侧

10:13

Gary Marcus：The Road to AI We Can Trust（RSS）

今日科技界最疯狂的两则新闻

科技领域正经历目标基准的转移与叙事体系的重构。行业评估标准持续调整，原有衡量目标被不断重新定义；同时出现新一轮努力，试图重塑技术发展的公众话语框架与内在逻辑。这些变化反映了科技产业在转型期对价值标准和传播策略的深层调整，涉及对既有范式的反思与未来路径的再定位，标志着行业进入新的认知与评价阶段。

大佬观点

10:00

公众号：阶跃星辰（Step）

阶跃已经没有"纯人类"员工了

行业动态

10:00

公众号：阶跃星辰（Step）

阶跃三年，Super Flash！

行业动态

07:45

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.91 版本更新

Claude Code v2.1.91 发布，支持 MCP 工具结果最大 500K 字符不截断，新增禁用技能内联 shell 执行选项，插件可打包 bin/ 目录可执行文件。修复了 --resume 转录链断裂、远程会话计划模式丢失、cmd+delete 快捷键等 bug，并优化了 ANSI 剥离性能。

智能体AnthropicMCP/工具产品更新

03:59

Meta Engineering Blog（RSS）

精选82

KernelEvolve：Meta的Ranking Engineer Agent如何优化AI基础设施

Meta的Ranking Engineer Agent系列博客第二篇，聚焦其底层基础设施优化能力。该自主AI代理能够优化支撑广告排名模型运行的低层基础设施，旨在提升系统性能与效率。本篇承接首篇介绍的机器学习实验自主探索功能，进一步展示了该代理在硬件与系统层面的自动化优化实践。

智能体Meta产品更新部署/工程

关联讨论 1 条

推荐理由：Meta 内部工具展示 AI 自动化优化基础设施，工程师可借鉴实践。

00:00

Google Blog：AI（RSS）

Google Vids 支持免费创建、编辑和分享视频

Google Vids 接入 Lyria 3 与 Veo 3.1 模型能力，新增免费 AI 视频生成功能，用户可无成本创建、编辑和分享高质量视频。

Google产品更新视频

00:00

Google Blog：AI（RSS）

Gemini API 推出 Flex 与 Priority 层级，平衡成本与可靠性

Google 为 Gemini API 新增 Flex 和 Priority 两个推理层级，帮助开发者在成本与延迟之间灵活取舍。

Google产品更新部署/工程

00:00

Google Research：Blog（网页）

评估 LLM 行为倾向的一致性

Google Research 提出系统性评估框架，将标准化心理学问卷（如 IRI、ERQ）转化为情境判断测试，量化 LLM 行为倾向与人类共识的偏差。研究测试了25个模型，发现小模型（<25B）一致性显著较低，且模型存在两种偏差：偏离人类共识、未能覆盖人类观点的多样性。该框架通过真实场景（如职场冲突、日常决策）评估模型行为，为改进 LLM 社交互动能力提供依据。

Google安全/对齐论文/研究

4月2日

19:58

公众号：龙猫LongCat（美团）

LongCat-Flash-Prover：AI 攻克数学定理证明，不仅要"算得对"，更要"证得严"

推理模型发布