AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态一手 · 2416 条
全部一手资讯X论文
4月23日周四
4月22日周三
4月21日周二
4月20日周一
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月23日
18:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选63
如何使用Codex进行日常工作

该内容探索了10个实用的ChatGPT Codex用例,旨在自动化任务、创建交付物,并将真实的输入转化为跨工具、文件和工作流的输出。

OpenAI教程/实践编码

推荐理由:虽然发布一月有余,但官方整理的十个 Codex 日常自动化用例依然是最佳上手模板,从邮件整理到数据报表,产品人和运营可以直接抄作业。
17:50
公众号:腾讯混元
精选67
Hy3 preview发布并开源:混元重建后首个模型,Agent能力大幅提升
智能体开源/仓库模型发布
关联讨论 1 条公众号:腾讯混元
推荐理由:混元重建后的第一枪,Agent能力大幅提升且直接开源,虽然已过首发热度,但对关注国产模型Agent能力的人还是个值得拉下来跑的repo。
12:06
公众号:MiniMax(稀宇科技)
23
想象力也是生产力:MiniMax 在戛纳见证一种新的生产关系

MiniMax 在戛纳电影节展示了其 AI 技术与内容生成能力,强调“想象力也是生产力”的理念。活动聚焦于 AI 如何改变创意生产的工作流,并探索人机协作下新型生产关系的形成。

行业动态
10:00
公众号:阶跃星辰(Step)
49
官宣!阶跃和千里科技,达成全面战略合作!
多模态端侧行业动态
08:00
Google Developers Blog(RSS)
精选59
使用 LiteRT 与 NPU 构建现实世界中的设备端人工智能

LiteRT 是一个生产就绪的框架,旨在帮助移动开发者充分发挥神经处理单元(NPU)的效能,以突破传统 CPU 或 GPU 在性能与电池续航上的瓶颈。该框架通过提供统一的 API 来屏蔽底层硬件复杂性,已成功助力 Google Meet、Epic Games 等行业领先者高效部署复杂的 AI 模型,实现实时视频处理、动画生成与语音识别等高级功能。此外,平台还提供基准测试工具并具备跨平台兼容性,能够支持 AI 应用无缝部署于移动设备、AI PC 及工业物联网硬件等多种终端。

Google产品更新端侧部署/工程

推荐理由:Google 把 LiteRT 从实验品推到生产级,统一 NPU 调用 API,做端侧 AI 的开发者终于不用逐家适配芯片了。虽然不是新概念,但 Google Meet 和 Epic Games 已经在用,说明不是 PPT。
08:00
Hugging Face:Blog(RSS)
精选57
如何在 Chrome 扩展中使用 Transformers.js

本文介绍在 Chrome 扩展中集成 Transformers.js 库的具体方法,涵盖从环境配置、模型加载到前后端通信的关键步骤。通过示例代码演示了如何利用该库在扩展中实现本地机器学习推理,同时处理扩展权限限制与安全策略。文中还对比了 Web Worker 与 Service Worker 两种部署方案,并提供了性能优化建议,帮助开发者在浏览器扩展环境中高效运行 Transformer 模型。

开源生态教程/实践端侧

推荐理由:Hugging Face 官方出的 Transformers.js 浏览器插件教程,想在 Chrome 里跑端侧推理的前端开发者可以直接抄,省掉自己踩坑的时间。
08:00
蚂蚁百灵:Developer Blog(网页)
精选67
Ling-2.6-flash 发布:更快响应、更强执行、更高 Token Efficiency

针对智能体任务中Token消耗快速增长的问题,Ling-2.6-flash模型正式发布。该模型采用混合线性架构等技术进行系统性优化,旨在实现更高推理效率和更低使用成本。其推理速度在4卡H20条件下最快可达340 tokens/s,在Artificial Analysis评测中仅消耗约对比模型1/10的Tokens。模型在多个Agent相关基准测试中达到同尺寸SOTA水平,保持了强大的任务执行与工具调用能力。

智能体模型发布部署/工程
关联讨论 5 条X:阿易 AI Notes (@AYi_AInotes)X:Artificial Analysis (@ArtificialAnlys)IT之家(RSS)蚂蚁 inclusionAI:HuggingFace 新模型X:蚂蚁百灵 (@AntLingAGI)
推荐理由:蚂蚁百灵这次打的是「省 token」这张牌,104B 总参但只激活 7.4B,Agent 场景评测对齐同尺寸 SOTA,输出 token 消耗只有竞品的 1/10。做 Agent 产品、被推理成本卡脖子的团队值得认真看看这个路线。
08:00
Tomer Tunguz 博客(VC 分析)
49
商业智能的未来:从仪表盘到AI驱动的深度分析

Omni公司CEO指出,商业智能正从静态仪表盘重新扩展为AI驱动的深度分析。AI能融合结构化和非结构化数据,例如分析75页支持对话以识别代表错误并提供具体改进建议。其平台具备自动处理问题报告的能力,客户案例显示BambooHR在四个月内向三万人推出分析服务,Cribl则在三个月内整合遗留系统并快速迁移上百个仪表盘。底层统一的语义模型存储定义、逻辑与权限,支持多种分析界面。Omni近期以150亿美元估值完成1.2亿美元融资,由ICONIQ领投。

智能体现象/趋势行业动态
01:10
蚂蚁 inclusionAI:HuggingFace 新模型
51
inclusionAI/LLaDA2.0-Uni

inclusionAI团队发布了LLaDA2.0-Uni模型。该版本在统一的多模态理解与生成能力上取得显著进展,支持图像、文本、音频等多种输入与输出模态。模型参数量达到约70B,在多项基准测试中,其综合性能较前代提升超过15%。此次发布延续了通过开源与开放科学来推动人工智能民主化的核心使命。

开源/仓库模型发布端侧
00:16
Gary Marcus:The Road to AI We Can Trust(RSS)
ChatGPT 连胡须与肘部都分不清

(注:提供的正文内容仅有一句话,缺乏必要的具体信息,如研究数据、性能指标、模型版本或测试结果等,无法撰写符合 100-200 字要求且包含关键数字/指标的摘要。请提供完整正文以便提取关键信息点。)

OpenAI多模态大佬观点
00:05
公众号:小米 MiMo
54
Xiaomi MiMo-V2.5 系列大模型开启公测
智能体多模态模型发布
00:00
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
精选72
关于近期 Claude Code 质量报告的更新说明

Anthropic 确认并解决了过去一个月影响 Claude Code、Claude Agent SDK 和 Claude Cowork 的三个问题,所有问题已于 4 月 20 日修复。具体包括:3月4日将 Claude Code 的默认推理强度从“高”改为“中”,导致用户感知智能下降,已于4月7日回滚;3月26日一项缓存优化存在缺陷,导致会话恢复后模型“健忘”和重复,4月10日修复;4月16日一项旨在减少冗余的系统提示指令意外损害了代码质量,4月20日撤销。这些问题影响了 Sonnet 4.6 和 Opus 4.6/4.7 模型,但 API 未受影响。公司已重置所有订阅用户的使用限额,并承诺改进流程以防止类似问题。

Anthropic安全/对齐编码行业动态
关联讨论 2 条X:小互 (@xiaohu)Simon Willison 博客
推荐理由:Anthropic 把 Claude Code 连续一个月质量下滑的三个 bug 全部摊开讲,这种级别的工程复盘在大模型公司里极少见。做 Agent 产品的人该认真读,因为这三个坑你迟早也会踩。
4月22日
23:16
Gary Marcus:The Road to AI We Can Trust(RSS)
ChatGPT 的"强大新图像引擎"

正文内容仅包含"Regurgitating ≠ understanding"(反刍不等于理解),缺乏撰写摘要所需的完整信息,如具体发布细节、功能变化或性能指标。请提供完整文章内容以便提取关键信息并撰写符合要求的摘要。

OpenAI图像生成大佬观点
23:07
OpenAI:官网动态(RSS · 排除企业/客户案例)
OpenAI 推出 Privacy Filter

OpenAI 发布 Privacy Filter,一款用于检测和脱敏文本中个人身份信息(PII)的开源权重模型。该模型在 PII 识别任务上达到业界领先的准确率,支持开发者本地部署和定制。作为开放权重模型,它可自动识别并编辑敏感个人信息,为企业数据隐私保护和合规处理提供高效的技术解决方案。

OpenAI开源/仓库数据/训练部署/工程
21:00
公众号:通义实验室(千问)
59
Qwen3.6-27B 开源发布:270亿稠密参数,编程能力超越前代MoE旗舰

Qwen3.6-27B 开源发布,采用270亿稠密参数,无需MoE路由,部署门槛更低。编程能力全面超越前代旗舰Qwen3.5-397B-A17B MoE,在SWE-bench Verified(77.2)、SWE-bench Pro(53.5)、Terminal-Bench 2.0(59.3)、SkillsBench(48.2)等基准上领先,深度思考能力媲美超大参数模型。原生支持多模态,可处理图像、视频与文本,支持视觉推理、文档理解和视觉问答,具备视觉语言思考与非思考模式。开源权重已上线Hugging Face与ModelScope,API即将在阿里云百炼上线,兼容OpenAI与Anthropic协议,即时对话可通过Qwen Studio体验。

多模态推理模型发布编码
关联讨论 1 条公众号:通义实验室(千问)
21:00
Cloudflare Blog
提升 Rust Workers 可靠性:wasm-bindgen 中的 panic 与中止恢复

Rust Workers 曾因 panic 导致整个实例崩溃。通过与 wasm-bindgen 上游项目合作,现已支持弹性关键错误恢复,包括利用 WebAssembly Exception Handling 实现 panic 展开。

产品更新部署/工程
20:12
Google Blog:AI(RSS)
Google 推出两款面向智能体时代的专用 TPU

Google 发布第八代 TPU,内含两款面向智能体时代的专用芯片。新处理器专为 AI 未来发展设计,针对智能体工作负载进行专门优化,提供更强算力支持。作为 Google AI 基础设施的最新升级,该系列芯片将助力下一代智能体应用的开发与部署。

智能体Google产品更新部署/工程
20:12
Google DeepMind:Blog(RSS)
与行业领导者合作加速 AI 转型

Google DeepMind 正与全球咨询公司建立战略合作,将前沿 AI 技术能力引入企业组织,加速全球范围内的 AI 转型进程。该合作旨在弥合尖端 AI 技术与企业应用之间的鸿沟,使各行业组织能够直接获取和应用最新的 AI 能力,推动业务创新与数字化变革。

DeepMind行业动态
20:00
OpenRouter:Announcements(RSS)
42
OpenRouter 推出 Workspaces

OpenRouter 推出 Workspaces 功能,允许用户将项目组织到独立环境中。每个环境自带独立的 API 密钥、路由默认设置、护栏(guardrails)和可观测性(observability)配置。

产品更新部署/工程
20:00
OpenRouter:Announcements(RSS)
52
OpenRouter 推出 Workspaces 功能

OpenRouter 新增 Workspaces 功能,允许用户将项目组织为独立环境。每个工作区拥有独立的 API keys、路由默认值、guardrails 和可观测性配置,实现不同项目的资源隔离与管理。

产品更新部署/工程
20:00
OpenRouter:Announcements(RSS)
52
工作空间简介

OpenRouter 推出工作空间功能,支持用户将项目组织到相互独立的环境中。每个工作空间可配置专属的 API 密钥、自定义路由默认设置、防护规则以及观测性选项。这一功能有助于实现项目间的资源隔离与管理分离,提升多项目协作与安全管控的灵活性。

产品更新部署/工程
09:00
公众号:蚂蚁百灵(Ling)
40
Ling-2.6-flash 发布:更快响应、更强执行、更高 Token Efficiency
模型发布部署/工程
08:07
Claude Code:GitHub Releases(RSS)
Claude Code v2.1.117 版本更新

Claude Code 发布 v2.1.117 版本。模型选择现支持跨会话持久化;Pro/Max 用户 Opus 4.6 与 Sonnet 4.6 默认 effort 级别提升至 high。原生 macOS/Linux 构建采用 bfs 和 ugrep 替代原有工具,搜索速度显著提升。插件系统支持自动安装缺失依赖。修复 Opus 4.7 上下文窗口计算错误(200K→1M),优化 MCP 服务器并发启动速度,/resume 新增大会话总结功能。

智能体Anthropic产品更新编码
06:17
Cursor Blog
精选68
Cursor与SpaceX就模型训练达成合作

智能编程助手Cursor宣布与SpaceX合作,以突破算力瓶颈,加速其模型训练进程。该公司在不到半年内快速迭代了Composer系列模型:首款智能编码模型Composer问世后,Composer 1.5将强化学习规模扩大20倍以上,而Composer 2通过持续预训练,以极低成本达到了前沿性能水平。此次合作将使Cursor团队利用xAI的Colossus基础设施,大幅提升训练规模,从而显著增强模型的智能水平。

智能体编码行业动态
关联讨论 1 条X:Testing Catalog (@testingcatalog)
推荐理由:Cursor 抱上 xAI 的算力大腿,意味着 AI 编程工具的竞争正式进入「谁的 GPU 多」阶段。对开发者来说,Composer 系列模型接下来的进化速度会明显加快,值得持续关注。
00:49
Google Research:Blog(网页)
ReasoningBank:让智能体从经验中学习

Google Cloud提出ReasoningBank智能体记忆框架,突破传统方法仅记录动作轨迹或成功经验的局限,从成败经验中提炼可泛化的高层推理策略。该框架通过LLM-as-judge自评估构建检索-提取-整合闭环,特别利用失败案例生成预防性策略,并创新提出Memory-aware Test-Time Scaling技术将测试时计算转化为高质量记忆。在网页浏览与软件工程基准测试中,该系统显著提升任务成功率并减少执行步骤。

智能体Google推理论文/研究
4月21日
22:40
Google Blog:AI(RSS)
Ads Advisor 推出三项新功能,提升 Google Ads 安全性与效率

Ads Advisor 集成三项全新的代理式安全与政策功能,全面升级 Google Ads 账户的安全防护与操作效率。这些智能化功能通过自动化安全机制和策略优化,在强化账户风险保护的同时简化管理流程,帮助广告主更快速地识别潜在威胁并确保合规投放。新方案兼顾安全性与便捷性,旨在为用户提供更流畅的广告管理体验,有效降低安全风险并提升整体运营效率。

智能体Google产品更新
21:02
OpenAI:官网动态(RSS · 排除企业/客户案例)
将 Codex 扩展至全球企业

OpenAI 推出 Codex Transformation Partners 计划,联合埃森哲、普华永道、印孚瑟斯等全球咨询与科技服务商,协助企业在软件开发生命周期内部署并规模化应用 Codex。该合作旨在通过专业服务体系,将 AI 编程工具从试点阶段推向全面生产环境,加速全球企业软件开发流程的智能化转型。

智能体OpenAI产品更新编码
21:00
Cloudflare Blog
超越机器人与人类的二元对立

AI助手与隐私代理技术正挑战传统机器人检测的边界,推动网络信任机制从简单的人机区分向新型问责模式转型。核心方案主张将控制权保留在客户端,通过建立开放的匿名凭证生态系统,在保护用户隐私的同时有效防范源站滥用,以加密凭证取代传统的身份验证方式,构建兼顾隐私与安全的精细化信任框架。

智能体安全/对齐
20:00
Cursor Blog
精选55
保持 Cursor 应用稳定

Cursor 团队针对用户全天依赖应用、崩溃影响严重的问题,聚焦内存不足导致的崩溃。通过为多进程架构设计细粒度监控系统,实时追踪版本发布后的崩溃指标。采用双重调试策略:自上而下关联功能与崩溃数据,监控大消息负载;自下而上通过崩溃观察服务、堆快照等定位根本原因。自2月底以来,全版本会话OOM率下降80%,自3月1日起请求OOM率下降73%。具体措施包括处理大文件加载和修复资源泄漏,以应对突发与渐进性内存耗尽。

现象/趋势编码部署/工程

推荐理由:Cursor 把自家 OOM 问题的排查方法论完整公开了,自顶向下加自底向上的双线调试思路对做桌面端 Agent 产品的人有参考价值,但本质上是工程复盘而非行业事件。
17:22
公众号:通义实验室(千问)
37
AgentScope Tuner:让 Agent 越用越聪明

AgentScope Tuner 让 AI 智能体在工具调用中越用越聪明,持续优化行为,减少误调问题。

智能体MCP/工具产品更新
16:25
蚂蚁 inclusionAI:HuggingFace 新模型
37
inclusionAI/DR-Venus-4B-RL-GGUF

该模型由 inclusionAI 发布,属于 DR-Venus 系列,参数量为 40 亿,采用强化学习训练并已转换为 GGUF 格式,便于在本地设备高效运行。其推出延续了通过开源与开放科学推动人工智能技术发展与普及的使命,旨在降低先进 AI 技术的使用门槛,促进更广泛的社区参与和创新应用。

开源/仓库模型发布端侧
16:05
蚂蚁 inclusionAI:HuggingFace 新模型
39
inclusionAI/DR-Venus-4B-RL 发布

inclusionAI 团队开源了 DR-Venus-4B-RL 模型。这是一个基于强化学习技术微调的 40 亿参数语言模型,旨在通过开源与开放科学的方式推动人工智能的发展与普及。该模型的发布为研究社区提供了一个中等规模、经过指令与人类偏好对齐的可用模型,延续了其促进 AI 民主化的目标。

开源/仓库模型发布端侧
15:29
蚂蚁 inclusionAI:HuggingFace 新模型
39
inclusionAI/DR-Venus-4B-SFT模型

该团队正致力于通过开源与开放科学的方式,推动人工智能技术的进步与民主化。其核心目标是降低AI技术的门槛,促进更广泛的参与和创新,使先进AI工具能够被更多开发者和研究者所使用。这一举措旨在构建一个开放、协作的AI生态系统。

开源/仓库模型发布端侧
08:00
Tomer Tunguz 博客(VC 分析)
百亿美元的看涨期权

SpaceX与Cursor达成100亿美元战略合作,保留年内以600亿美元收购后者的期权。Cursor作为史上增长最快的开发者工具,年收入20亿美元,拥有庞大开发者网络,但模型层长期依赖OpenAI等竞争对手。xAI虽拥有配备10万NVIDIA H100的Colossus数据中心,其Grok模型周处理量却从6万亿token暴跌90%至0.6万亿。此次交易使SpaceX获得关键分发渠道,同时让Cursor摆脱对第三方模型的依赖,实现垂直整合。

智能体xAI编码行业动态
06:47
Claude Code:GitHub Releases(RSS)
v2.1.116 版本更新

Claude Code v2.1.116 优化性能与终端体验。大型会话 `/resume` 速度提升最高67%,MCP 启动加快且资源列表延迟加载。改进 VS Code、Cursor 和 Windsurf 的全屏滚动,修复 Kitty 键盘协议下快捷键失效及 Devanagari 等印度语系渲染错位问题。安全方面修复 sandbox auto-allow 绕过危险路径检查的问题。同时改进 `/config` 搜索、`/doctor` 响应逻辑及插件依赖自动安装。

智能体Anthropic产品更新编码
05:48
BAIR:Berkeley AI Research Blog
面向长程世界模型的梯度规划方法

GRASP是一种面向世界模型长程规划的梯度优化新方法。通过将轨迹映射至虚拟状态实现跨时间并行优化,引入状态迭代的随机噪声增强探索能力,并重塑梯度以避免高维视觉模型中的病态信号传播。该技术解决了长程规划中的优化病态、局部最优和高维潜在空间失效等问题,使基于学习动力学的复杂任务规划更加稳定高效。

智能体推理论文/研究
02:15
GitHub Blog
GitHub Copilot Individual 计划变更

GitHub 宣布调整 Copilot Individual 个人版订阅计划,旨在确保现有用户获得更稳定、可预测的服务体验。官方表示此次变更将提升产品可靠性,但未披露具体调整内容、生效时间及定价变化等细节,完整信息有待官方进一步公布。

GitHub产品更新编码
4月20日
23:40
公众号:月之暗面(Kimi)
57
Kimi K2.6 发布并开源,全面精进代码和 Agent 集群能力
智能体开源/仓库模型发布编码
21:15
OpenAI:官网动态(RSS · 排除企业/客户案例)
OpenAI 助力凯悦面向全球员工推进 AI 应用

凯悦酒店集团在全球范围内部署 ChatGPT Enterprise,集成 GPT-5.4 与 Codex 模型,旨在提升员工生产力、运营效率及宾客体验。通过与 OpenAI 合作,凯悦将企业级生成式 AI 工具普及至全体员工,优化内部协作流程与酒店服务标准,推动 hospitality 行业数字化转型。

智能体OpenAI编码行业动态
21:00
Cloudflare Blog
规模化AI代码审查的编排实践

团队基于OpenCode构建CI原生AI代码审查系统,将智能审查能力深度集成至持续集成流程。该系统通过自动化编排实现大规模代码审查,在代码提交阶段为工程师提供实时质量检测与安全分析,帮助团队及时识别潜在问题,显著提升代码质量与交付安全性。

智能体教程/实践编码
‹ 上一页
1…2324252627…50
下一页 ›