OpenAI 为旗下 AI 智能体助手 Codex 新增 6 个岗位插件,覆盖数据分析、创意制作、销售等 62 个应用与 110 项技能,帮助非技术用户将 AI 用于工作流。Codex 周活跃用户超 500 万,其中非开发者占 20%,且增速为开发者的 3 倍以上。
OpenAI 为旗下 AI 智能体助手 Codex 新增 6 个岗位插件,覆盖数据分析、创意制作、销售等 62 个应用与 110 项技能,帮助非技术用户将 AI 用于工作流。Codex 周活跃用户超 500 万,其中非开发者占 20%,且增速为开发者的 3 倍以上。
OpenAI 为 Codex 推出 Sites 功能,目前以预览版形式向 Business 和 Enterprise 订阅用户开放。该功能可将用户的工作、想法与计划转化为仪表盘、规划器、项目看板等交互式托管网站和应用程序,并可通过 URL 分享给团队指定用户,以实现协作与共享决策。
关联讨论 3 条X:OpenAI (@OpenAI)X:Rohan Paul (@rohanpaul_ai)X:Sam Altman (@sama)美国总统特朗普签署行政令,建立了AI企业自愿合作机制。该机制允许前沿大模型在发布前,企业自愿选择向联邦政府提交模型以进行安全评估。此举旨在推动安全创新与强化网络安全。谷歌、微软和xAI已同意在模型上线前接受CAISI的核验,而OpenAI与Anthropic早在2024年就已参与。行政令明确这并非强制审批,但标志着政府开始对AI科技企业实施适度监管。
关联讨论 3 条X:Anthropic (@AnthropicAI)TechCrunch:AI(RSS)X:Rohan Paul (@rohanpaul_ai)Claude Code v2.1.161 发布了多项功能改进与问题修复。功能方面,现在可将 OTEL_RESOURCE_ATTRIBUTES 的值作为指标数据点的标签,支持按团队或代码库等维度查看使用情况;`claude agents` 命令在分发任务时会显示“已完成/总数”;`/mcp` 改进了连接器列表的展示;并行工具调用时,单个 Bash 命令的失败不再取消同批次的其他调用;全屏模式在 Linux 上优化了剪贴板支持。本次更新还修复了包括管理策略阻止第三方会话、后台子智能体输出损坏以及终端渲染性能在内的多个问题。
关联讨论 4 条Claude:Blog(网页)X:Thariq (@trq212)X:Claude Devs (@ClaudeDevs)X:邵猛 (@shao__meng)微软发布了MAI-Thinking-1与MAI-Code-1-Flash两款新大语言模型。MAI-Thinking-1为35B参数的推理模型,目前向部分早期合作伙伴开放,官方称其在盲测中优于Sonnet 4.6。MAI-Code-1-Flash为5B参数模型,专为GitHub Copilot和VS Code优化,将逐步向VS Code的Copilot个人用户推出。两款模型均强调使用清洁、商业授权的数据从零开始进行端到端训练,未使用第三方模型进行蒸馏。
纽约大学的 Gary Marcus 在 Bloomberg 节目上讨论了美国最新的 AI 监管行政命令,将其描述为对上一任政府放手态度的重大逆转,认为之前的做法不可持续。
关联讨论 3 条X:Anthropic (@AnthropicAI)TechCrunch:AI(RSS)X:Rohan Paul (@rohanpaul_ai)微软通过其AI官方网站 microsoft.ai 发布了新模型 “MAI-Thinking-1”。该消息随链接一同发布,并出现在相关技术社区中。
关联讨论 3 条X:Rohan Paul (@rohanpaul_ai)X:Satya Nadella (@satyanadella)The Decoder:AI News(RSS)两名前美国政府效率部门(DOGE)员工成立新公司,计划通过收购企业并实施人工智能来削减成本与浪费,将政府的成本削减模式应用于私营领域。
Claude Code 新增动态工作流功能,允许模型在运行时即兴创建和协调多智能体框架来处理复杂任务。该功能通过执行特定的 JavaScript 文件来生成和协调拥有独立上下文窗口的子代理,可解决单一上下文窗口中长时间执行任务可能出现的智能惰性等问题。工作流适用于研究、安全分析、代码审查等场景,通常消耗更多 token,更适合高价值复杂任务,其最佳实践仍在发展中。
关联讨论 4 条Claude:Blog(网页)X:Thariq (@trq212)X:Claude Devs (@ClaudeDevs)X:邵猛 (@shao__meng)特朗普签署了一项修改后的人工智能行政命令,该命令旨在对人工智能模型实施监管。此项命令是经过数周修订后的缩小版本,其正式名称和具体监管框架的细节有待进一步公布。行政命令要求相关部门在规定时间内制定具体规则,但未提及对特定AI模型(如GPT或Claude)的直接限制。这是美国政府针对快速发展的AI技术采取的最新监管举措。
一座与CoreWeave Inc.关联的数据中心通过高收益票据发行成功筹集9亿美元。这笔融资反映了当前AI基础设施领域债务市场活跃的趋势,表明大量高收益债券发行方正通过借贷为人工智能基础设施建设提供资金支持。
微软正启动 Project Solara 项目,开发一个为 AI 智能体设计的 Android 操作系统。此举旨在应对应用时代竞争失利的局面,将发展重心转向为智能体提供基础设施。
作者因不满Gmail过度“智能”的分类、过滤及对用户选择的“纠正”,决定迁移到Fastmail。他指出Gmail将邮件强制归入促销、社交等分类且难以关闭,干扰了工作流程;同时其垃圾邮件过滤过于激进,错误屏蔽重要邮件。作者体验Fastmail后,认为其提供了更安静、可控的邮件管理环境,能按自身习惯组织邮件,不再被平台的“AI”预设所困扰,从而提升了效率。
微软推出开源框架 ASSERT,旨在将自然语言行为规范直接转换为可执行的评估流程。该框架能从需求文档等文本出发,自动生成测试场景、评估指标并对目标模型进行测试。它将评估系统化为四个阶段:细化规范、生成测试用例、运行测试并记录轨迹、对轨迹评分。验证研究表明其生成的测试集覆盖更广,且大语言模型判定器与人工审核一致率较高。该框架适用于行为定义明确的场景,旨在使评估更快速、明确。
微软在Build 2026宣布与梅奥诊所达成战略合作,共同开发并部署医疗保健领域的前沿AI模型。该合作将整合梅奥诊所的医疗专业能力与去标识化临床健康数据,以及微软的先进AI、云计算及超级智能能力。新模型将由梅奥诊所持有,并计划通过微软的Azure Foundry API向全球机构提供。
在 Build 2026 上,英伟达与微软展示了覆盖端侧到云端的统一 AI 智能体部署栈。端侧发布了提供 1 petaflop AI 算力与最高 128GB 统一内存的 RTX Spark,以及搭载 GB300 芯片、可本地运行最高万亿参数模型的 DGX Station for Windows。云端,Nemotron 3 Ultra 推理模型上线微软 Foundry,Claude 模型也已在 Azure 的 GB300 系统中原生运行。数据层,微软 Fabric Data Warehouse 内置的 NVIDIA 加速计算使 SQL 执行速度最高提升至 CPU 基线的 6 倍。此外,微软位于威斯康星州的 Fairwater AI 工厂提前上线,并已完成对下一代 NVIDIA Vera Rubin 平台的验证,其推理吞吐量提升最高达 10 倍。
微软推出 MAI-Code-1-Flash 模型,仅使用 50 亿个活动参数(5B Active Params),在 SWE-Bench Pro 基准测试中获得了 51% 的成绩,展示了高参数效率。
微软 Build 2026 的主题演讲几乎完全聚焦于人工智能。大会预计将发布七项重要公告,其核心内容均与 AI 技术相关。
微星(MSI)推出了MSI Claw 8 EX AI Plus掌机,搭载Intel芯片,该产品被视为正在推动掌机市场向前发展的设备。
人工智能公司Anthropic已秘密提交上市申请,在IPO竞赛中领先于竞争对手OpenAI。与此同时,SpaceX也计划于本月启动其IPO。PitchBook高级风投研究分析师Emily Zheng表示,这些“巨大”的超级IPO规模将带领市场进入一个未知的领域。
微软 Build 2026 发布会宣布了七项重要更新。硬件方面,推出了专为本地AI开发设计的 Surface RTX Spark Dev Box 迷你PC,搭载 Nvidia Arm 芯片与128G内存。软件层面,发布了始终在线的个人AI助手 Copilot Always On,并更新了 Windows Subsystem for Linux(WSL),后者将原生支持运行AI工具的 Linux GUI应用。此外,微软还更新了其自研的AI模型。
研究提出“语义运动锚点”方法,用于解决协同语音手势生成与检索中语义理解不足的问题。该方法将3D手势离散化为身体-手部运动原语,并转化为结构化的自然语言描述,作为辅助监督信号锚定于语音文本。在BEAT2数据集上,该方法将文本到手势检索的R@1指标提升了8.2%,并优于现有方法。检索增强的手势生成用户研究显示,该方法检索到的手势在传达交流意图方面明显优于基线。
DOT-MoE提出了一种将预训练密集模型转换为Mixture of Experts架构的新框架。该方法将密集层的分解建模为一个可微最优传输问题,利用Sinkhorn-Knopp迭代来实施严格的专家容量约束。同时,通过Straight-Through Estimators端到端联合学习离散的神经元-专家分配与token-专家路由策略。实验表明,DOT-MoE在多个基准测试中显著优于结构化剪枝等基线方法,能够在减少50%活跃参数的同时,保留原始密集模型90%的性能。
面对人工智能的快速发展,美国公众和一些团体不知从何处着手进行有效对抗,转而将矛头对准了作为AI基础设施的数据中心。这种策略选择反映了针对新兴技术的阻力正寻找其可触及和具体的抗议目标。
Gary Marcus在其个人专栏中分享了一个真实的瞬间,以此反映了他对于人工智能实现稳定、可靠(即“理智”)发展的思考与期许。
Alphabet宣布拟通过股权融资800亿美元,用于扩展AI基础设施。Anthropic已秘密提交IPO申请,在上市竞赛中领先于竞争对手OpenAI。此外,SpaceX正与华尔街机构协商其IPO的承销费用,HPE则因AI基础设施需求旺盛,年度销售预期超出市场估计。
微软在 Build 2026 大会上宣布对 Windows 365 进行重大更新。此次更新推出了预装 VS Code、Git 等工具的 Windows 11 Developer Configuration Image(公开预览版),以加快开发者环境部署。新增 32 vCPU 和 GPU Select 套餐,满足高性能计算与图形工作负载需求。同时,正式发布 Windows 365 for Agents 平台,为企业 AI 智能体提供安全、可管理的专属 Cloud PC 运行环境。此外,Azure Compute Gallery 支持现已可用,Windows 365 Frontline 更名为 Windows 365 Flex。
微软在 Build 2026 大会上发布了其首款高级推理模型 MAI-Thinking-1。该模型为中等规模,在软件工程基准测试中达到业界领先水平,且完全基于干净数据从零开始训练,未使用第三方模型的蒸馏数据。同时,微软还推出了 MAI-Image 2.5(文生图/图像编辑)、MAI-Transcribe-1.5(语音转写,速度达竞争对手五倍)、MAI-Voice-2(语音合成,新增15种语言支持)和 MAI-Code-1(编程辅助,已集成至 GitHub Copilot 和 VS Code)等多款新模型。
微软在Build 2026大会上发布了全天候AI助理Microsoft Scout。该产品与Outlook、OneDrive和Teams等Microsoft 365生态深度整合,能监测交通与日程,并通过分析聊天、会议和邮件主动推荐信息,同时可协助处理日程安排、费用报销及邮件草稿。目前已有3000名微软员工在内部使用。微软采取谨慎推广策略,首先向美国Frontier客户开放桌面预览,计划未来几个月向少量客户推出功能受限的预览版,并最终实现完全上云运行,其核心组件OpenClaw将在云端沙箱中作为不受信任组件执行以保障安全。
谷歌为 Android 推出“虚假来电检测”功能,当通讯录联系人双方均使用 Phone by Google 时,系统可基于端到端加密的 RCS 信号实时验证来电设备,防范利用 AI 语音克隆冒充熟人的诈骗。该功能默认开启,本月向全球推送,首批支持 Android 12 及以上系统设备,率先登陆 Google Pixel 系列。
微软发布新一代量子芯片 Majorana 2,其采用全新材料栈设计,使用铅材料取代铝超导体,并将半导体活性区域更新为砷化铟与砷化铟锑组合。该芯片的量子比特可靠性相比上一代 Majorana 1 提升1000倍,量子比特寿命从上一代的1毫秒至12毫秒提升到20秒以上,部分比特可达分钟级。得益于 Discovery 智能体 AI 的协助,微软将实用量子计算机原型的目标发布时间缩短至2029年。
在 Build 2026 大会上,微软宣布推出名为 Agent Control Specification(ACS,智能体控制规范)的开源标准。该标准旨在为开发者提供统一且细粒度的 AI 智能体行为控制方式,允许团队通过策略规则明确规定智能体的允许操作、禁止操作、需人工审批的操作及审计记录要求。ACS 通过在工作流的多个拦截点执行策略检查来确保合规,并可集成分类器、大语言模型和检查逻辑。该标准以 SDK 形式发布,支持 LangChain、OpenAI Agents SDK 等多个主流开发框架。
随着越来越多人拒接陌生号码,诈骗者转而伪装可信号码,并利用 AI 深伪技术冒充权威人士、家人或雇主进行电话诈骗。Google 已推出一项新功能,旨在检测此类 AI 生成的深伪语音,以保护用户免受冒充诈骗的侵害。
微软开源发布 Adaptive Spec-driven Scoring for Evaluation and Regression Testing 框架。开发者可通过文本描述快速生成 AI 行为测试,用于模型评估与回归测试。
微软在 Build 2026 开发者大会上发布了其首个高级推理 AI 模型 MAI-Thinking-1。该模型是此次发布的七款新模型之一,标志着微软在提升模型复杂推理能力方面迈出新步伐。
美国总统特朗普签署行政令,要求对AI模型进行发布前审查。该行政令的一个关键点在于,是否与政府共享相关技术信息将由AI公司自行决定。
国际数学联盟支持一份关于科技行业影响力对数学领域构成威胁的警告。该警告指出,随着行业影响力的扩大,人工智能对数学家的职业前景构成了威胁。
微软在Build 2026上发布了其首款高级推理AI模型MAI-Thinking-1。该模型被定位为“中等规模”,能在“关键”软件工程基准测试中达到领先模型的水平。微软称其完全从头使用干净数据进行训练,未涉及从第三方模型进行知识蒸馏。这标志着微软在自研AI模型上迈出重要一步,此前其主要依赖OpenAI。近期两家公司已重新协商合作协议,关系有所松绑。
关联讨论 3 条X:Rohan Paul (@rohanpaul_ai)X:Satya Nadella (@satyanadella)The Decoder:AI News(RSS)美国总统特朗普周二签署一项行政命令,旨在创建一个AI公司与联邦政府共享前沿模型的“自愿框架”。该命令指出,此举是为了“促进安全创新并加强关键基础设施的网络安全”,相关联邦机构需制定框架以在模型发布前评估其高级网络能力。
关联讨论 3 条X:Anthropic (@AnthropicAI)TechCrunch:AI(RSS)X:Rohan Paul (@rohanpaul_ai)OpenAI 正在为旗下编程工具 Codex 扩展功能,新增针对数据分析、销售和投资银行业务的角色专用插件。该公司表示,Codex 每周有500万用户,其中五分之一并非开发者。非开发者用户群体的增长速度是开发者群体的三倍,这表明 OpenAI 正将 Codex 定位为面向所有人的通用工作应用。