AIHOT

全部动态一手 · 2391 条

全部一手资讯 X 论文

6月4日周四

6月3日周三

6月2日周二

6月4日

07:26

OpenAI：官网动态（RSS · 排除企业/客户案例）

Wasmer 使用 Codex 构建边缘 Node.js 运行时

Wasmer 借助 Codex（基于 GPT-5.5）构建了一个用于边缘计算的 Node.js 运行时，将开发速度提升 10 到 20 倍，交付周期从数月缩短至数周。

OpenAI教程/实践编码

05:58

Claude Code：GitHub Releases（RSS）

精选59

Claude Code v2.1.162 发布

Claude Code v2.1.162 发布，主要包含 Bug 修复和体验优化。`claude agents --json` 新增 `waitingFor` 字段，`/effort` 命令确认级别持久化，远程控制固定底部显示，`/ide` 菜单中 Windsurf 更名为 Devin Desktop。修复了配置文件只读导致启动黑屏、Windows 权限规则不匹配、LSP 的 `workspaceSymbol` 无结果、API 400 错误、MCP 超时低于 1000ms 被截断等十余项问题。

智能体Anthropic产品更新编码

关联讨论 2 条

推荐理由：一系列扎实的修复，尤其是 Windows 权限匹配和启动挂死问题的解决，对于日常用 Claude Code 做开发的来说稳定性提升明显，可以升级。

04:26

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选71

GPT-Rosalind 新功能发布

GPT-Rosalind 在生命科学研究领域推出新功能，增强了生物推理、药物化学专业知识、基因组学分析以及实验工作流处理能力。

OpenAI推理模型发布

关联讨论 3 条

推荐理由：GPT-Rosalind 的这次更新把生物推理和药物化学能力做实了，对生命科学领域的人来说，可能比通用模型升级更关键。

04:15

Cursor Blog

精选60

Cursor Enterprise 推出 Organizations 组织管理功能

Cursor Enterprise 正式推出 Organizations 结构，允许企业在统一面板中管理多个团队。每个团队可独立设置预算、安全策略、模型访问和功能控制。新增 Groups 作为跨团队或团队内的轻量级用户集合，用于分段管理模型访问、花销上限和智能体权限，不同设置取最宽松权限生效。管理员可创建沙箱团队预先测试新功能，再向全公司推送；也可按部门划分模型访问和预算。组织级仪表盘汇总所有团队的 token 用量与花费，支持按团队、用户等维度筛选。身份提供商和 SCIM 目录在组织层面一次配置，成员自动同步。该功能现已全面开放给所有 Enterprise 客户。

智能体产品更新编码

推荐理由：这是 Cursor 企业版在治理能力上的关键补丁，把多团队预算、模型权限和沙盒测试管了起来，对想把 AI 编程推到千人规模的团队是实打实的基建更新。

02:49

Google Research：Blog（网页）

精选72

洪水韧性新篇章：Google 开源水文建模框架

Google Research 在 GitHub 开源了其水文建模框架，这是一个基于 PyTorch 的 Python 包，采用与 Flood Hub 河段洪水预报相同的模型架构和训练数据。该框架允许研究者和预报员训练 AI 洪水预报模型、添加新模型与数据，并已与捷克水文气象研究所（CHMI）等合作测试。开放模型架构和训练管线旨在让各国气象水文部门在保留数据完全控制权的同时，整合基于 AI 的洪水预报。

Google开源/仓库开源生态数据/训练

推荐理由：谷歌开源的水文模型框架，是少数真正能救命的AI应用。不是秀参数，而是把工具直接塞给一线预报员，让他们用本地数据训练。务实，值得给赞。

02:23

Claude：Blog（网页）

精选76

Claude Cowork 入门最佳实践

Anthropic 增长营销负责人 Austin Lau 介绍了非技术知识工作者使用 Claude Cowork 的最佳实践。Claude Cowork 是面向文档、电子表格等多步骤任务的 AI 助手，用户无需编程技能，将其指向文件夹或连接已有应用即可委托任务。与用于快速问答和头脑风暴的 Chat 以及面向开发者的 Claude Code 不同，Claude Cowork 适用于需要产出交付物、涉及多个文件或应用、可重复执行的场景。Lau 给出了判断任务是否适合的五项检查清单，并预告将于6月4日分享具体营销用例。

Anthropic教程/实践

关联讨论 1 条

推荐理由：Anthropic 官方教你如何把 Claude Cowork 用到极致，从每日摘要到自动报表，非技术人员看完就能上手，比自己硬摸索省十倍时间。

01:23

Claude：Blog（网页）

精选68

Claude Code技能使用经验：Anthropic内部实践

Anthropic 分享了内部使用 Claude Code 的 Skills（技能）功能的经验。Skills 是指令、脚本和资源的文件夹，智能体可发现并调用它们以提升准确性和效率。Anthropic 内部已有数百个活跃使用的技能，它们可归为九类，包括库和 API 参考、产品验证、数据获取与分析、业务流程与团队自动化、代码脚手架与模板、代码质量与审查等。最佳技能专注于单一类别，涵盖过多功能会混淆智能体。团队发现，投入时间优化验证类技能对 Claude 输出质量的提升最显著。

智能体AnthropicMCP/工具教程/实践

关联讨论 4 条

推荐理由：这不是产品公告，而是从几百个内部技能中血泪总结出的实战手册。如果你想让Claude Code真正变成你的工程副驾驶，这9类技能和‘gotchas’章节至少省你三个月踩坑。

01:23

Claude：Blog（网页）

精选73

Anthropic 用 Claude 赋能自助数据分析

Anthropic 使用 Claude 自动化了 95% 的业务分析查询，整体准确率约 95%。其关键在于构建智能体分析栈（agentic analytics stack），通过数据基础层、维护验证流程和技能（skills）分别解决概念-实体歧义、数据过时和检索失败三大错误来源。相比编码场景，数据分析的难点在于将用户问题映射到正确的数据实体，而执行 SQL 反而是简单的。Anthropic 的数据科学团队因此得以专注于因果建模、预测和机器学习等战略工作。

智能体Anthropic教程/实践数据/训练

关联讨论 1 条

推荐理由：Anthropic 把内部用 Claude 搞自助分析踩过的坑全摊开，技能模板和「语义层优先」的强制流程是实打实的干货，做数据 agent 的团队可以直接抄作业。

01:10

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选63

OpenAI 公共政策议程

OpenAI 公布其 AI 公共政策议程，涵盖安全、青少年保护、劳动力转型和全球标准四大领域，旨在确保 AI 技术造福全社会。

OpenAI安全/对齐政策/监管

推荐理由：OpenAI 首次系统性地拿出政策议程，安全、青年保护、劳动力转型这些切口很精准，做 AI 治理和政策的人应该认真看一下。

01:10

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选67

OpenAI 提出前沿 AI 民主治理蓝图，呼吁建立联邦安全框架

OpenAI 发布了一份针对美国前沿 AI 治理的蓝图，提出建立联邦层面的框架，以保障安全性、韧性和国家安全。该蓝图聚焦于前沿 AI 的民主治理，强调通过政府监管与行业协作来应对潜在风险。

OpenAI安全/对齐政策/监管

关联讨论 1 条

推荐理由：OpenAI主动抛出联邦监管蓝图，在硅谷普遍抵触管制的氛围下算是反直觉，政策制定者和AI公司都得仔细看看。

00:07

Google Developers Blog（RSS）

在笔记本电脑上运行 Gemma 4 12B：借助 Google AI Edge 解锁本地智能体工作流

Google DeepMind 的 Gemma 4 12B 模型可在 16GB RAM 的普通笔记本上运行，支持本地数据处理与视觉洞察生成。macOS 用户可通过 Google AI Edge Gallery 执行动态 Python 代码与可视化，通过 Google AI Edge Eloquent 实现完全离线的语音听写和文本编辑。另外，LiteRT-LM CLI 新增 serve 命令，可创建行业兼容的本地端点，驱动完全本地的 AI 工具和智能体。

智能体Google产品更新多模态

关联讨论 4 条

00:07

Google Developers Blog（RSS）

精选78

Gemma 4 12B：开发者指南

Gemma 4 12B 是一款密集多模态模型，专为消费级设备上的高性能本地 AI 执行而设计。其采用新颖的无编码器架构，绕过传统视觉和音频编码器，将多模态数据直接输入大语言模型主干。

Google多模态模型发布端侧

关联讨论 4 条

推荐理由：Google 把多模态模型直接塞进消费级设备，靠的不再是缩水而是架构层面的创新。12B 放在本地跑，这次玩法变了。

6月3日

22:41

Hugging Face：Blog（RSS）

为 Reachy Mini 添加 MCP 工具

Reachy Mini 对话应用现在可通过 MCP 协议添加远程工具。执行 `reachy-mini-conversation-app tool-spaces add` 命令即可从 Hugging Face Spaces 安装远程工具（如搜索、天气），并自动启用至当前 profile 的 tools.txt 中。内置工具（头部动作、跳舞、表情、摄像头等）仍为本地 Python 代码，远程工具则通过 MCP 端点调用。profiles 通过 tools.txt 控制哪些工具可用，不在文件中的工具模型无法调用。用户也可编写自定义本地工具。远程工具适合无状态能力，便于发布、共享和迭代，无需修改应用本身。支持 install、list、remove 等子命令。

Hugging FaceMCP/工具产品更新具身智能

21:41

Hugging Face：Blog（RSS）

精选55

DharmaOCR 利用 DPO 将文本退化率降低 59.4%

4月发布的DharmaOCR（结构化OCR模型）在巴西葡萄牙语文档提取任务中，使用直接偏好优化（DPO）作为监督微调（SFT）后的第二训练阶段。SFT无法直接惩罚文本退化（重复循环），而DPO以模型自身失败输出（退化循环）作为负样本进行偏好训练，使所有测试模型族的文本退化率平均降低59.4%，最高达87.6%（如Nanonets-OCR2-3B从1.61%降至0.20%）。传统DPO多用于聊天对齐，该工作将其扩展至客观的OCR任务，证明DPO可针对性修复特定失败模式。

Hugging Face教程/实践数据/训练

推荐理由：DPO 不只能对齐，这篇直接用模型自身的垃圾输出当反例，把 OCR 的重复错误平均降了 59%。思路不复杂，但告诉做结构化生成的工程师：训练数据里最该保留的就是模型犯的错。

21:37

Tomer Tunguz 博客（VC 分析）

精选66

智能性价比

微软在模型发布卡中首次加入平均token使用量指标。其模型在SWE-Bench Verified上达71.6分，仅消耗约Claude Haiku 4.5三分之一的token。Artificial Analysis的Intelligence Index显示GPT 5.5与Claude Opus 4.8得分相近（约60分），但Opus 4.8运行成本高出40%（$4,685 vs $3,357）。Uber因四个月内AI预算超支而限制员工使用；Salesforce花费$3亿购买Anthropic tokens并冻结工程招聘。模型公司如今需同时在性能和成本两个维度竞争。

MicrosoftOpenAI推理现象/趋势

推荐理由：微软在模型发布卡上悄悄加了“平均token消耗”这个指标，这不是小改动，而是宣告AI从堆算力转向算账时代。Uber和Salesforce的预算教训已经很清楚了。

21:34

Google Blog：AI（RSS）

Google Search 提升二手和复古购物体验的5种方式

Google Search 和 Google Shopping 中的 AI 工具帮助用户在二手和复古购物中发现好物。

Google搜索教程/实践

21:30

Anthropic：Newsroom（网页）

精选59

介绍 Claude Partner Network 的 Services Track 和 Partner Hub

Anthropic 扩展 Claude Partner Network，推出 Services Track 分级体系和 Partner Hub 门户。Services Track 设 Select、Preferred、Global Premier 三级，按认证人数、投产客户数及客户推荐信量化评定。Partner Hub 提供每日更新仪表盘和公开目录，方便合作伙伴查看进展、客户寻找供应商。该网络三月启动以来已有超 4 万家公司申请，逾 1 万顾问获认证；Accenture 训练 3 万人，Cognizant 部署约 35 万员工，Deloitte 惠及 47 万人，KPMG 覆盖 27.6 万，Infosys 构建行业智能体，PwC 先在美推广再扩至全球。

Anthropic产品更新行业动态部署/工程

推荐理由：Anthropic 给合作伙伴画了一条明确的爬升阶梯，从 Select 到 Global Premier，企业客户终于有个公开透明的渠道找靠谱的实施团队，做 AI 咨询的可以认真评估入局了。

21:30

公众号：月之暗面（Kimi）

精选67

Kimi Work Beta版发布：面向知识工作者的本地Agent

Kimi Work Beta版随Kimi最新Mac和Windows客户端推出，是基于Kimi Code的通用型本地Agent。它内置Kimi WebBridge浏览器操作方案，支持安装和使用Skill、运行定时任务，并能根据任务复杂度自主创建最多300个子Agent的团队。开发中使用的Kimi K2.6模型支持13小时连续编码、4000余次工具调用，累计产出超5万行有效代码，其中92%由AI自主生成。用户可用自然语言描述目标，Kimi Work即可拆解任务、并行执行、调用工具、操作浏览器，交付文档、表格、PPT等工作产物。

智能体MCP/工具产品更新

关联讨论 2 条

推荐理由：Kimi 把代码 Agent 的本地能力包装成了面向普通人的工作 Agent，300 个子 Agent 集群让繁琐的任务并行处理成为可能，对天天跟文档表格打交道的人是真提效。