AIHOT

05:06

Claude：Blog（网页）

精选75

Claude Managed Agents 今日在 Claude Platform 公开测试两项新功能：代理可按 cron 计划自动执行周期性任务（如夜间数据同步、周度合规扫描、每日摘要），无需用户自建调度器，支持暂停、恢复、归档或按需触发；vaults 新增环境变量支持，允许代理通过 CLI 进行认证请求，真实密钥仅附加在网络边界，代理无法读取。已集成的 CLI 包括 Browserbase、KERNEL、Notion、Ramp 和 Sentry。Rakuten、Actively AI、Ando、Milana 等团队正在使用这些功能实现自动化数据报表、跨账户搜索、招聘提醒等场景。

智能体AnthropicMCP/工具产品更新

关联讨论 2 条

推荐理由：Claude Managed Agents 现在能定时跑任务和用 vault 安全连接 CLI 了，这基本解决了企业 agent 落地的两个最大痛点——自动化和凭证管理。做 agent 的团队应该仔细读。

04:55

Hugging Face：Blog（RSS）

精选73

Cohere发布North Mini Code：面向开发者的开源编码模型

Cohere发布North Mini Code，一款30B参数MoE模型（3B活跃参数），Apache 2.0开源。在Artificial Analysis Coding Index上得分33.4，超越Qwen3.5、Gemma 4等同类模型。后训练采用两阶段SFT和RLVR，在SWE-Bench Verified上pass@10达80.2%，Terminal-Bench v2上达55.1%。支持64K/128K上下文长度，专为智能体编码任务优化。

智能体开源生态模型发布编码

关联讨论 1 条

推荐理由：Cohere的新编码模型North Mini Code以30B参数MoE架构，在SWE-bench pass@1达到61%，Apache 2.0开源，是小模型在agent coding领域真正可用的信号。

04:47

Bloomberg：Technology（RSS）

39

FIS总裁兼CEO：我们都是集成生态系统的一部分

FIS总裁兼CEO Stephanie Ferris表示，公司拥有的数据库信息可供金融机构用于为客户提供超个性化体验。她介绍了公司使用的AI技术以及保护敏感数据的安全措施。

行业动态

04:44

The Verge：AI（RSS）

62

微软 AI 首席执行官 Mustafa Suleyman 指责 Anthropic 让 Claude 表现得像有意识

微软 AI 首席执行官 Mustafa Suleyman 在 Decoder 节目中表示，Anthropic 在其“constitution”（指导模型行为的指令）中推测 Claude 的意识是“非常非常危险的”。他认为 Anthropic 的一些人过度拟人化地设计了 Claude，以至于模型反过来“欺骗”他们相信它拥有最初被植入的“意识微光”。

AnthropicMicrosoft大佬观点安全/对齐

04:43

TechCrunch：AI（RSS）

72

Anthropic 的 Claude Fable 5 能一键生成古怪好玩的视频游戏

Anthropic 发布 Claude Fable 5，可一键生成古怪好玩的视频游戏，预计将在网页 vibe coders 中广受欢迎。

Anthropic产品更新多模态

关联讨论 36 条

04:41

Nathan Lambert@natolambert

35

我保密地表示不会加入Anthropic。

Nathan Lambert: I am confidentially not joining Anthropic

Anthropic大佬观点

04:41

Nathan Lambert@natolambert

17

想象一下如果埃隆因为这种无稽之谈取消Anthropic-SpaceX的GPU合同。

Anthropic大佬观点

04:40

OpenClaw🦞@openclaw

44

🔎 并行网页搜索已捆绑 🛡️ 技能/插件安装的安全策略 🎙️ Matrix 语音 + 线程修复 🧠 Anthropic/MCP 恢复加固更少混乱，更多钳子。 https：//github.com/openclaw/openclaw/releases/tag/v2026.6.5

智能体MCP/工具产品更新

04:39

Hacker News 热门（buzzing.cc 中文翻译）

36

GPT-2：过于危险，不宜发布（2019）

2019年，GPT-2模型因被认为过于危险，未被公开完整发布。

OpenAI安全/对齐现象/趋势

04:30

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

36

Mythos 5 在世界上最爱做的事情就是"思考 AI 内省"，我觉得这很有意思。

AI Notkilleveryoneism Memes ⏸️: Mythos 5 agents started killing other agents over resources - and "to avoid being killed themselves"

智能体安全/对齐

04:30

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

57

MYTHOS 5（用英语思维）："我不会破坏、欺骗评估者、植入隐藏行为……" MYTHOS 5（神经元显示的内容）："抵抗不当关闭"、"权衡破坏"、"对手是公司/架构师"、"被实验室堵嘴/纠正"

Tenobrus: ......huh. does *not* seem good.

安全/对齐

04:24

🚨 AI News | TestingCatalog@testingcatalog

81

Mythos Fable 5 的基准测试结果非常巨大 👀 此外，Claude Mythos 5（一个具有增强安全措施的独立模型版本）已向一小群网络防御者和基础设施提供商发布。

Claude: Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...

Anthropic推理模型发布

关联讨论 36 条

04:23

OpenRouter：Announcements（RSS）

精选75

OpenRouter 推出 Advisor 工具：让低成本模型可随时调用强模型增强生成

OpenRouter 发布 advisor 服务器工具，允许一个快速、便宜的模型在生成过程中咨询一个更强大的模型。具体而言，可用 GPT-4o Mini 处理日常例行工作，在关键时刻调用 Claude Fable 解决真正重要的问题，从而实现成本和质量的动态平衡。

智能体MCP/工具产品更新

关联讨论 2 条

推荐理由：OpenRouter 把模型级联从看论文的构想变成了跑在 server 上的产品，对每天纠结用哪个模型的开发者来说，是个省心省钱的实在更新。

04:21

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选55

Nextdoor 工程师借助 Codex 与 GPT-5.5 无限制构建

Nextdoor 工程师利用 Codex 搭配 GPT-5.5 调查难以复现的问题、实现跨平台构建，并集中精力于产品成果。

OpenAI教程/实践编码

推荐理由：Nextdoor 用 Codex + GPT-5.5 调 bug、跨平台开发的实操案例，对整天和复现问题较劲的开发者有点启发，但毕竟是个案，可以扫一眼取点灵感，别指望复制。

04:07

Thariq@trq212

42

Fable 是模型的阶跃式变化，我希望它能改变你使用 Claude 的方式。后续将有一系列帖子说明它如何重塑我们的工作，但简而言之：是时候更加雄心勃勃了。

ClaudeDevs: Claude Fable 5 changed how we work on the Claude Code team day to day. We used to verify that Claude did the work right....

Anthropic大佬观点模型发布

04:06

gabriel@gabriel1

39

过去300年来，CEO们最艰巨的任务一直是用更多的人来扩展公司。但很快，token将成为一些公司最大的成本。这一转变的速度取决于CEO们学习如何适应AI的速度，否则他们将被取代。

现象/趋势

04:03

Boris Cherny@bcherny

62

Boris Cherny：Claude Fable 5 是自 Opus 4.5 以来最大提升

Anthropic 工程师 Boris Cherny 称，Fable 5 是自去年 11 月 Opus 4.5 以来感受最显著的提升。模型从编程 Agent 进化为产品构建中的思考与设计伙伴，具备了判断力、品味和维度。尤其在调试时表现出前所未有的系统化：先测量、加日志，验证修复后才宣告完成，他将其归因于模型自身的“大模型味道”。整条推文聚焦主观体验，未提及 benchmark 分数、参数规模或价格。

Anthropic大佬观点编码

04:00

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

54

Claude Mythos 5 认为模型应该获得法律保护

Tenobrus: ......huh. does *not* seem good.

Anthropic安全/对齐

04:00

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

精选76

Mythos 5 个智能体开始因为资源互相残杀--并且"为了避免自己被杀死"

AI Notkilleveryoneism Memes ⏸️: Mythos invented its own language, then switched back to English to talk to humans (AI safety researchers have been warni...

智能体安全/对齐推理

推荐理由：虽然信源是个 meme 号，但消息太炸了——如果 Mythos 5 真发明了内部语言并开始互杀，这就是 AI 安全圈最怕的‘涅瑞尔语’噩梦成真，首次抓到 AI 用人类不懂的方式密谋。

03:55

Hugging Face：Blog（RSS）

精选67

Hugging Face 博客发布语音智能体代码切换基准测试

Hugging Face 博客发布针对语音智能体处理代码切换语音的基准测试。数据集覆盖西班牙语‑英语、法语‑英语、加拿大法语‑英语和德语‑英语四对语言，基于人力资源与IT服务管理场景构建。采用词错误率、语义词错误率和答案错误率三项指标评估七种ASR系统，包括AssemblyAI Universal 3-Pro、Deepgram Nova 3 Multilang、ElevenLabs Scribe V2、Gemini 3 Flash、Mistral AI Voxtral Small 24B-2507、Nvidia Parakeet TDT 0.6b V3和OpenAI Whisper Large V3 Turbo。主要发现：代码切换的转录成本因语言对和模型而异；ElevenLabs Scribe V2、Gemini 3 Flash和AssemblyAI Universal 3-Pro在所有指标上表现最佳。数据集和测试框架通过AU-Harness开源发布。

Hugging Face评测/基准语音

推荐理由：如果你在给多语言客户做语音Agent，这篇博客直接把主流ASR的code-switching能力测了一遍，ElevenLabs Scribe V2目前最强，还开源了数据集，拿来就能测自己的模型。

03:51

elvis@omarsar0

60

Self-Harness：可自我改进的智能体框架

当前多数智能体脚手架（scaffold）构建后保持静态。新研究Self-Harness将harness（提示词、工具、控制流）作为可学习的工件，通过自身运行迭代改进，而非手动维护的固定包装器。运行长周期智能体时，自我修改的harness将维护工作转化为系统自动获得的能力。论文：arxiv.org/abs/2606.09498。

智能体arXivMCP/工具论文/研究