该公司基于对外交付的同一产品平台构建了内部 AI 工程栈,实现真正的"自产自用"。该架构已通过 AI Gateway 路由 2000 万请求,处理 2410 亿 token,并依托 Workers AI 运行推理,为 3683 余名内部用户提供支持。这一实践验证了其平台在超大规模企业级场景下的稳定性与性能表现。
该公司基于对外交付的同一产品平台构建了内部 AI 工程栈,实现真正的"自产自用"。该架构已通过 AI Gateway 路由 2000 万请求,处理 2410 亿 token,并依托 Workers AI 运行推理,为 3683 余名内部用户提供支持。这一实践验证了其平台在超大规模企业级场景下的稳定性与性能表现。
Agents Week 2026 活动正式收官,期间密集发布了构建智能体云的完整产品矩阵,涵盖计算基础设施、安全架构、智能体工具箱、平台开发工具及新兴智能体网络等关键领域,全面覆盖从底层算力到上层应用的工具链,系统性推进智能体云生态建设。
卡内基梅隆大学将在2026年4月23日至27日于巴西里约热内卢举行的ICLR 2026会议上展示194篇研究论文。其中,研究人员发布了EditBench基准测试,包含545个真实世界代码编辑任务,用于评估大语言模型根据用户指令编辑现有代码的能力。该基准考虑了周围代码和光标位置等实际上下文。测试结果显示,大多数AI模型在该任务上表现挣扎。
DR-Venus 是一个仅用1万条开放数据训练的40亿参数深度研究智能体,基于Qwen3-4B-Thinking-2507架构,支持200步工具调用和超20万tokens的上下文。它通过监督微调与强化学习两阶段训练,在BrowseComp、GAIA等多个深度研究基准上树立了小模型性能新标杆。其SFT版本已超越多数同类开源模型,而RL版本进一步将长程任务可靠性和工具使用校准度提升2-3个百分点。项目已全面开源模型、代码与训练流程。
关联讨论 1 条HuggingFace Daily Papers(社区热门论文)通义千问发布 Qwen3.6-Max-Preview 预览版,相比 Qwen3.6-Plus 在多项基准上显著提升:智能体编程(SkillsBench +9.9、SciCode +6.3、NL2Repo +5.0、Terminal-Bench 2.0 +3.8)、世界知识(SuperGPQA +2.3、QwenChineseBench +5.3)、指令遵循(ToolcallFormatIFBench +2.8)。新版本支持 preserve_thinking,可在消息中保留前序轮次思维内容,避免多步任务上下文丢失,官方推荐用于智能体开发。用户可登录 Qwen Studio 直接对话,或通过阿里云百炼(即将上线)调用 API。
关联讨论 1 条公众号:通义实验室(千问)Anthropic与Amazon签署十年协议,承诺向AWS投入超1000亿美元以获取高达5吉瓦算力,用于Claude训练与部署。Amazon追加投资50亿美元(未来可达200亿美元),新容量包括上半年上线的Trainium2及2026年底前部署的近1GW Trainium2与Trainium3。Claude Platform将直接集成AWS,目前超10万客户通过Bedrock使用Claude,Anthropic年化收入已突破300亿美元。
v2.1.114 版本发布,修复了权限对话框在 Agent Teams 队友请求工具权限时发生的崩溃问题。此次更新解决了多智能体协作场景中的关键稳定性故障,当团队成员发起工具权限申请时,系统不再出现异常退出,确保了协作流程的顺畅进行。
Claude Code v2.1.113 将CLI改为通过原生二进制文件运行,替代原有JavaScript捆绑包。新增 deniedDomains 设置实现域名精确拦截,并强化Bash工具安全策略,将macOS系统路径列为危险删除目标,修复命令包装器绕过限制的问题。交互方面优化全屏选择、多行输入快捷键及长URL点击体验,改进/loop和/ultrareview命令性能。此外修复30余项Bug,涵盖MCP调用超时、表格渲染、远程控制会话及插件安装冲突等问题。
开发者在 Rubber Duck Thursday 直播中展示了使用 GitHub Copilot CLI 构建 emoji 列表生成器的完整过程。该项目通过 AI 编程助手在命令行界面实现快速开发,演示了如何利用 GitHub Copilot CLI 生成功能性工具代码,体现了 AI 辅助编程在提升开发效率与快速原型制作方面的实际应用。
Google 针对暑期出行场景发布七项智能旅行新功能,帮助用户优化行程规划、筛选高性价比方案并探索目的地。这些工具整合最新技术,提供从行前规划到实地探索的全流程支持,旨在提升旅行效率、降低出行成本,为用户带来更便捷、智能的今夏旅行体验。
Cloudflare 推出 Agent Readiness 评分体系,帮助网站所有者量化评估其网站对 AI agent 的支持能力。该体系建立全新技术标准,并基于 Radar 数据监测分析。Cloudflare 通过重构文档站点,将其打造为全网对 agent 最友好的网站,为行业提供了可复现的优化范例,推动网站基础设施向 AI 代理友好型架构升级。
技术团队预告了共享压缩字典功能的上线计划,这项压缩技术专为适应代理式网络的发展需求而设计,能够显著缩短页面加载时间并提升传输效率。该功能目前处于预览阶段,具体的 beta 测试开放时间即将公布,用户很快就能亲自体验这项新技术。
Cloudflare 发布原生功能标志服务 Flagship,直接构建于其全球网络之上,旨在消除第三方供应商的延迟。该服务利用 KV 和 Durable Objects 技术,实现亚毫秒级的 flag 评估速度,满足 AI 时代对实时性能的需求,为开发者提供低延迟的功能开关能力。
Cloudflare 发布 Agent Memory 托管服务,为 AI 智能体提供持久化记忆能力。该服务支持智能体长期保留关键上下文、自动过滤并遗忘无关信息,同时基于交互历史持续学习优化。开发者无需自建基础设施,即可快速部署具备长期记忆、能随使用时间增长而变聪明的 AI 应用。
Cloudflare 发布无损推理时压缩系统 Unweight,可在不牺牲模型质量的前提下,将大语言模型(LLM)的占用空间减少 22%。该系统针对 GPU 内存带宽进行优化,使推理速度更快、成本更低,解决了在网络边缘大规模部署 LLM 时的内存效率挑战,实现了模型体积与计算资源的高效平衡。
Cloudflare 推出 Redirects for AI Training 功能,解决软指令无法阻止 AI 爬虫抓取弃用内容的局限。网站管理员可通过一键切换,将已验证的 AI 爬虫自动重定向至规范页面,无需修改源站配置即可确保 AI 模型训练获取权威内容,避免过时信息被纳入训练数据。
阶跃 Step 3.5 Flash 大规模上车极氪8X,深度集成该模型的整车智能体超级 Eva 随车量产上市。超级 Eva 融合阶跃三款大模型:Step 3.5 Flash 作为核心大脑,提供模糊指令理解与多步骤任务规划;语音大模型带来低延迟、更自然的交互;视觉理解模型可感知车外环境并决策,如判断路况、找车位。即日起用户可在极氪8X驾驶场景中体验。未来超级 Eva 将覆盖更多车型。
可灵AI与艾菲奖联合发起AIGC广告创作大赛,设置潮宏基珠宝、云南白药、华帝、999澳诺四大品牌赛道。奖项包括艾菲奖杯/证书、万元品牌实物奖励及50万灵感值,每个赛道独立评奖。投稿周期即日起至5月25日。早鸟福利:可灵AI联合艾菲评选50件优秀作品,入选作品报名费用全额支持。
LLaDA2.0-Uni是一个统一的多模态模型,具备对世界的理解与生成能力。该模型通过整合视觉、语言等多模态信息,实现了跨模态的语义理解和内容生成。其架构支持从图像理解到文本生成、跨模态检索等复杂任务,标志着多模态人工智能向更通用、统一的方向演进。
智谱(GLM)AutoClaw项目宣布开启自进化,无需研究Hermes。该进展聚焦于AI模型自主进化能力,具体技术细节尚未披露。
发布 v2.1.112 版本更新,重点修复自动模式下 claude-opus-4-7 模型提示"temporarily unavailable"的可用性故障。此次补丁解决了该模型在自动模式调用时的服务中断问题,消除错误提示,恢复其正常响应功能,确保用户可稳定使用该 AI 模型进行交互。
文章探讨了大规模预训练中的并行计算策略优化方案,分析模型蒸馏技术是否可被检测或阻止及其对AI生态的影响;介绍 Mythos 系统在维护网络安全平衡中的应用,阐述流水线强化学习(Pipeline RL)的架构设计与效率提升,并总结预训练任务失败的常见技术瓶颈与排查方法,为分布式训练提供实践参考。
Cloudflare 将 AI Gateway 重构为统一的 AI 推理层,开发者可通过单一接口调用 14 家以上提供商的模型。新版本集成 Workers AI 绑定功能,并扩充了多模态模型目录,专为 AI 智能体优化设计。该平台旨在简化跨服务商的模型调用流程,降低多模型集成的技术门槛。
Cloudflare 针对超大型语言模型推理需求打造了专属技术栈,通过在其全球基础设施上部署定制化高性能 AI 推理系统,实现了大模型的低延迟运行。该方案深入剖析了工程权衡与技术优化路径,解决了超大规模模型部署中的性能瓶颈,使企业无需自建复杂基础设施即可获取高性能 AI 推理能力。
Artifacts 正式发布,这是一款专为智能体(agents)打造的版本化存储服务,完全兼容 Git 协议。该平台支持创建数千万个仓库,允许从任意远程仓库 fork,并可通过 URL 提供给任何 Git 客户端访问。Artifacts 旨在为智能体、开发者和自动化工具提供代码与数据的统一存储空间,实现大规模仓库管理与无缝的 Git 操作集成。
AI Search 作为面向智能体的搜索基础组件发布,支持动态创建实例、上传文件,并基于混合检索与相关性增强技术实现跨实例搜索。用户只需完成创建搜索实例、上传文档、执行检索三步操作,即可为 Agents 快速构建高效的知识检索能力,满足智能体对信息查询与知识管理的核心需求。
美团技术团队主办的MARS TALK香港大学站活动开放线上线下报名,主题聚焦具身智能的技术演进与商业化进程。
美团技术团队推出的LongCat-AudioDiT模型,实现了零样本TTS音色克隆,让AI直接学习声音本身的规律,跳过中间处理环节,从而突破音色克隆的上限。
OpenAI 启动 Trusted Access for Cyber 计划,多家领先安全公司和企业加入该生态,使用 GPT-5.4-Cyber 模型并分享 1000 万美元 API 资助额度,共同强化全球网络防御能力。该倡议通过开放先进 AI 技术与资金资源,推动网络安全产业协同升级,构建更广泛的防护网络。
Vidu与酱油动漫合作,助力仙侠真人剧《教书五年,我教出满门妖神》热映。该剧是红果平台爆款,背后整合了AI视频生成与动漫制作资源,试图以AI赋能真人剧内容生产。
研究团队提出一种基于推理插值的早期检测方法,利用重要性采样结合微调供体前缀技术,在模型训练过程中预测奖励黑客行为的出现。该方法通过分析模型推理路径的插值变化,在奖励黑客完全形成前识别其风险迹象,为语言模型安全训练提供关键的预警指标。
NousResearch 发布了 Hermes Agent 的桌面客户端 v0.1.0,提供一键安装体验。该客户端内置了 Python 3.11 和 Node.js 22 等运行环境,实现零依赖部署。它集成了 hermes-webui 聊天界面,支持会话管理、文件上传与技能编辑。安装向导支持 Anthropic、OpenAI、Google 等 7 种 AI 服务商,并特别优化了 Ollama 本地模型的使用(无需 API Key)。客户端适用于 macOS (Apple Silicon) 和 Windows (x64) 平台,可通过系统托盘后台运行,并会自动安装 hermes CLI 命令。
MaxHermes 是全球首个云端沙箱 Hermes,提供“一键养‘马’”功能。该产品由 MiniMax 推出,定位为云端沙箱环境。
新增 `/tui` 命令实现全屏无闪烁渲染,Ctrl+O 改为切换详细转录模式,焦点视图由 `/focus` 独立控制。强化插件管理界面,新增 MCP 服务器配置冲突警告,扩展远程控制客户端对多条斜杠命令的支持。修复 30 余项问题,包括 MCP 工具调用挂起、全屏高 CPU 占用、非受信文件名命令注入漏洞等,并优化内存分配与会话管理。