本次更新修复了两个问题:其一,Fable 5 模型名称带 `[1m]` 后缀时未能自动规范化的问题已解决——Fable 5 默认包含 1M 上下文窗口,现后缀会被自动去除。其二,修复了在 Windows 系统上启用沙盒后出现虚假的“sandbox dependencies missing”启动警告。
本次更新修复了两个问题:其一,Fable 5 模型名称带 `[1m]` 后缀时未能自动规范化的问题已解决——Fable 5 默认包含 1M 上下文窗口,现后缀会被自动去除。其二,修复了在 Windows 系统上启用沙盒后出现虚假的“sandbox dependencies missing”启动警告。
I shared this note earlier today with the entire team at Opendoor. Today we began to say goodbye to our colleagues in In...
Claude Devs 宣布本周起变更 Fable 5 的安全措施:被标记的请求将可见地回退至 Opus 4.8(与网络、生物安全一致),API 同时返回拒绝理由。此前采用的不可见措施虽能快速部署且误报极少,却让用户无法了解触发原因。可见措施易被破解,需要更多误报以保持鲁棒性;团队正同步调优生物/网络分类器以减少对无害请求的误报。用户可通过 `/feedback`、thumbs-down 或 appeal 表单反馈误判。
阿里云发布一段由Qwen和Wan模型生成的AI视频,以墨西哥文化为主题,融合祖先智慧、传统工艺、Mariachi音乐和Zapotec编织艺术,从古老圣地到现代创新枢纽,展现AI如何连接过去与未来。视频旨在展示模型的创意能力,并引导用户通过Model Studio平台使用相关模型进行创作。
阿里云发布AI生成视频,由通义千问(Qwen)和万相(Wan)模型共同创作。视频以阿联酋为主题,融合沙漠、阿拉伯书法、传统待客之道与迪拜现代天际线等元素,从古代天文智慧到未来科技,展现文化遗产与创新的平衡。官方推荐使用Model Studio平台调用模型进行创作。
针对第一人称视频空间推理中观测证据受限的问题,现有单次推理方法依赖语义先验无法解决几何歧义。论文提出无训练推理时框架ReRe:推理阶段MLLM从原始视频形成空间假设;重推理阶段通过观察合成的新视角视频验证或修正假设。采用Geometry-to-Video流水线,从预测3D几何渲染抬高斜视的全景新视角,保留MLLM原生视频接口。在VSI-Bench和STI-Bench上,ReRe显著提升开源MLLM性能,匹敌专有模型最优水平。
Up until yesterday, our entire MTS team has operated under the philosophy of tokenmaxxing as much as possible on Claude ...
昨天Claude Fable 5发布以后, 压力给到了Open AI, OpenAI 正在考虑大幅降价, 以争取从劲敌 Anthropic 手中赢得更多用户, 感觉有点难追啊,全球大模型铁王座大概是Claude稳坐了
OpenAI is considering drastic price cuts as it seeks to win over customers from archrival Anthropic https://on.wsj.com/4...
Anthropic CEO Dario Amodei只有1个直接下属(幕僚长),所有执行通过其姐姐、总裁Daniela Amodei流向董事会,Dario本人专注安全、战略与AI未来。对比:Nvidia CEO黄仁勋有60个直接下属,OpenAI CEO Sam Altman有6个。Anthropic无层层汇报、PPT文化和办公室政治,强调信息传递效率和自组织管理。
Anthropic's Dario Amodei has only 1 direct report, his chief of staff. The rest of Anthropic's executive system flows th...
WorkBuddy是一款国内通用Agent产品,支持Windows和Mac,微信扫码登录,个人专业版58元/月。界面提供Ask/Plan/Craft三种工作模式和代码开发、日常办公、设计创意三个场景,内置DeepSeek V4 Pro、腾讯混元、GLM、Kimi等国产模型。专家中心有100多个垂直领域AI专家,支持专家团多Agent协作。技能市场(Skills)和MCP连接器可打通QQ邮箱、腾讯会议、腾讯文档等生态,也支持自建技能和连接器。上周五腾讯推出WorkBuddy企业版。
Omdia报告,2026年第一季度半导体营收环比增长27%至3190亿美元,创2002年以来最大季度增幅。存储器是主要推手,环比增幅超80%;其中NAND营收近480亿美元,环比增长96%,平均售价大涨95%。DRAM和NAND合计占半导体总营收40%以上,远高于长期平均。非存储器类仅环比增长略超2%。受AI需求及供应受限推动,预计第二季度环比增速仍将超20%。
脑虎科技宣布,两位高位截瘫患者通过自研“三全”脑机接口完成上海与南昌相距800公里的象棋对弈。上海小张2025年10月植入,术后第5天实现脑控光标,经17天训练脑控速率达5.2 BPS,可上网、打游戏、控智能轮椅和家居。南昌邓老师2025年12月植入,术后一月可通过脑控外骨骼辅助吃饭、喝水、书写,今年4月借助BCI-FES技术实现用手绘画。“三全”系统采用柔性电极贴附大脑表面不刺入组织,发热单元置于胸部皮下,复用成熟DBS手术范式,无需专用机器人。
Dario Amodei just published a super long blog, calling for an urgent policy overhaul because he thinks frontier AI is mo...
阿里巴巴集团已更换钉钉负责人。此前公司内部围绕钉钉在整体 AI 战略中的定位爆发争论,此次高层人事变动是这一争议的直接结果。
你不能指望一个模型在什么地方都是最强的,要像渣男一样才能用好 AI:去爱很多模型,去发掘他们的优秀点,东食西宿,组合着用 Opus 4.8 在写作不太行,但是在 UI 设计,UI 实现比 GPT-5.5 要好很多,推荐你多用用 Claude...
如何让多个 Agent 之间真正互相学习、互相帮助? 现在很多 Agent 都开始有自己的记忆,但问题是: 这些记忆彼此不连通。 Codex 记住的坑,Claude 不知道;Hermes 总结的方法,OpenClaw 也用不上。 最后每个 ...
Claw-SWE-Bench是一个多语言SWE-bench风格基准和适配器协议,用于在公平设置下比较通用智能体框架(claws)的编程能力。完整基准包含350个GitHub issue解决实例,覆盖8种语言和43个仓库,来源于SWE-bench-Multilingual和SWE-bench-Verified-Mini。同时发布80实例的Lite子集用于快速验证。在完整基准上,OpenClaw搭配最小适配器仅得19.1% Pass@1,而完整适配器使用相同GLM 5.1骨干达到73.4%,表明适配器设计至关重要。模型选择改变Pass@1达29.4个百分点,框架选择改变27.4个百分点;相似精度的系统总API成本差异巨大。Claw-SWE-Bench将框架和成本核算作为SWE风格编码智能体评估的第一类维度。
MoE模型中路由器矩阵的每一行作为专家代理,通过计算与输入的相似度来决定激活哪些专家。理想情况下,每一行应编码对应专家矩阵的主奇异方向,使点积能更好反映token与专家的亲和度。然而现有设计缺少对齐约束。为此提出Manifold Power Iteration (MPI)方法,采用“Power-then-Retract”范式:先在路由器权重上执行幂迭代步骤,再通过回缩施加范数约束以保证效率和稳定性。理论表明MPI驱动路由器行收敛至对应专家的主奇异方向。在1B至11B参数规模的MoE模型预训练中证实该对齐能提升模型有效性。
阿易AI Notes认为AI是继蒸汽机、铁路、电力、汽车石油、信息互联网后的第六轮康波周期,普通人唯一从开场哨就站进场内的机会。红利不在卷模型或融资,而在自媒体。作者推特5个月做到5万粉,策略跑通后开始进军小红书、公众号、视频号。公众号已非订阅制:头部账号推荐流占30%–60%,搜一搜占30%–40%,订阅仅小部分。新号前十篇决定权重,零粉也能获百万级曝光,老号先发优势减半。康波不缺看见的人,缺一篇篇把内容垒起来的人。
http://x.com/i/article/2064536412670562304
微软更新 GitHub 页面,宣布 Windows 11 本地 Language Model API 不再局限于 Windows 11 AI+ PC(需 40 TOPS NPU),门槛下调至英伟达 GeForce RTX 30 系列及后续显卡,显存不低于 6GB。该 API 由微软小型语言模型 Phi Silica 支持,应用调用后可通过 Windows Update 自动下载模型,利用 GPU 在本地完成推理,目前支持 AI 文本格式化、文本摘要、文本改写、文本转表格及通用提示词生成。
Very pleased to hear Anthropic have walked back this policy https://simonwillison.net/2026/Jun/11/anthropic-walks-back-p...
论文认为稀疏自编码器作为LLM控制工具并非此前认为的那么差,失败源于特征标注方式与模型内部实际因果不匹配。作者提出用监督管道替代模糊标签,验证特征活动是否真实追踪数据标签,使特征具有因果权重。例如,强制“酒精”特征增强可使模型输出转向酒精话题。论文还发现极高稀疏度并非必要。与提示工程相比,提示更强(模型经训练服从提示),而特征控制更像直接拨动机器。
Anthropic 宣布更改 Fable 5 中针对前沿 LLM 开发的安全措施,使其变得可见,并撤回此前隐藏在系统卡中的政策——该政策会使 Claude Fable/Mythos 识别“针对前沿 LLM 开发的请求”并在不通知用户的情况下“限制有效性”。Anthropic 在声明中承认做出了错误的权衡,并为未能达到平衡而道歉。
We Asked AI To Simulate What Would Happen If AOC Was Forced To Learn Economics Made with @grok.
Anthropic首席执行官Dario Amodei仅有一名直接下属。正文对此评论:若你曾怀疑他的天才,现在无需再怀疑。
V8.1 is live! Our iconic aesthetics are back w native 2K HD rendering - 3x faster and 3x cheaper vs V8. Full quality V8....
Midjourney 已将默认模型从 V7 升级为 V8.1。V8.1 在智能性、连贯性、对详细提示的遵循度以及文本渲染效果上均有提升,HD 模式也已支持。
Arbor是一个结合长期协调器、短期执行器和假设树优化(HTR)的通用自主研究框架。该框架通过持久化树结构跨时间链接假设、工件、证据和提炼洞察,将自主研究从局部尝试转变为累积过程。在模型训练、工具工程和数据合成等六个真实研究任务中,Arbor均取得最佳留出结果,平均相对留出增益超过Codex和Claude Code的2.5倍。在MLE-Bench Lite上,Arbor使用GPT-5.5达到86.36%的Any Medal,为对比中最优成绩。
Usage share of OpenAI grew vs Anthropic yesterday despite Mythos 5 / Fable 5 launch Multiple power users at SemiAnalysis...
据华尔街日报报道,OpenAI 正考虑大幅削减 Token 收费价格,以从竞争对手 Anthropic 手中赢得客户,知情人士预计 Anthropic 也将类似降价。OpenAI CEO 萨姆·奥尔特曼表示,公司仍在迭代模型并探索降本增效,力求“以更低成本创造更高价值”,并称 AI 成本问题在 2026 年初突然浮现,如今已成难题。此外,OpenAI 于 6 月 9 日向美国证券交易委员会递交保密版 S-1 注册草案,为上市预留通道,但尚未做决定。Anthropic 也已秘密递交 IPO 申请,具体安排未定。
京东 618 期间,京东 MALL 引入多款智能机器人担任实习员工,覆盖迎宾、导购、理货、咨询等岗位。迎宾岗采用智元 X2 人形机器人,实现点位导航;导购岗由宇树 Go2 四足机器狗接入 JoyInside 能力;理货岗的智元 G2、睿尔曼 RealBOT 基于 JoyAI-RA 模型,单品上架成功率突破 90%;咨询岗众擎导购机器人对接京东数万 SKU 商品体系。此外,京东已建成具身智能数据采集中心,计划发动数十万人参与覆盖超百个场景的数据采集。
xAI 前工程师迪文·金起诉马斯克旗下 xAI 及 SpaceX,称其因多次警示 Grok 项目存在 AI 安全风险、提议设置安全管控机制而遭管理层针对,并于去年九月被解雇。诉状指控 xAI 未将 AI 安全置于优先位置,可能助长歧视行为及大规模杀伤性武器技术扩散。xAI 与 SpaceX 尚未回应。
理想汽车将于 6 月 15 日 16:30 举办 Livis Day 发布会,探讨具身智能定义与用户价值。CEO 李想回应质疑,认为基于汽车形态的具身智能是首个进入物理世界的人工智能机器人。内部消息称理想已规划双轮和双足两款人形机器人,双轮机器人已准备就绪,最佳状态下将于今年年中发布用于工厂。李想强调 2026 年是 AI 头部公司上车最后一年,最晚 2028 年 L4 落地,理想将布局基座模型、芯片、操作系统、具身智能,并一定会做人形机器人。
Xcode 27 Beta 新增原生谷歌 Gemini 集成,成为继 OpenAI Codex 和 Anthropic Claude Agent 之后第三个内置的 AI 编程智能体。开发者无需切换工具或窗口,即可在 Xcode 内完成构建新功能、审查代码和修复 Bug 等复杂多步骤任务。通过 Intelligence 设置面板配置 Gemini 后,Gemini 能理解项目上下文、辅助生成样板代码,并根据项目文档和文件结构更新整个项目。
推文批评 Anthropic 新发布的 Fable 5 模型三个问题:1)安全护栏极严,初中生物问题也被拒,影响生物学研究;2)数据明文强制存储最长两年,微软已禁止内部使用;3)最严重的是隐形降级——若系统判断用户试图“蒸馏”模型,会偷偷降级至 Opus 4.8 甚至更低,并修改提示词使模型变笨,导致评估失效。批评者认为这与 CEO 达里奥宣称的透明、问责相悖,对开源研究者、小实验室和科学界伤害最大。
视频完全摒弃 Premiere/Final Cut,由 Claude Code 配合 Fable 5 通过代码与命令行自动剪辑。流程:本地 Whisper 转写 25GB 素材(17 个 Take,4 场景),生成毫秒级单词时间戳 JSON;Subagent 剔除停顿废片选出最佳镜头;代码调用 FFmpeg 自动粗剪;AI 手写 LUTs 调色代码并生成带滑块的 HTML 页面供人工调整;静态图形转为 React 的 Remotion 动画组件,利用时间戳精准卡点;通过 Figma MCP 将画面导出至 Figma 供设计优化,再自动抓回代码,渲染 4K 24fps。作者全程未触碰视频编辑器。
Lots of people asked how I used Fable to edit its own launch video so I made a video about that! TLDR it wrote a lot of ...