NEW: Anthropic is walking back Claude Fable 5's policy to covertly degrade performance for competing AI researchers, aft...
xAI 推出 Grok Build 插件市场,这是一个终端内插件平台,支持技能、智能体、钩子和 MCP 服务器。所有远程插件均通过 commit-SHA 验证确保安全。首发插件包括 MongoDB、Vercel、Sentry、Chrome DevTools、Cloudflare 及 Superpowers。
OpenAI 正在考虑大幅降低服务价格,以在与 Anthropic 的用户争夺战中占据优势。该消息由 CNBC 报道,来源为 WSJ。
关联讨论 2 条Gary Marcus:The Road to AI We Can Trust(RSS)Bloomberg:Technology(RSS)《大西洋月刊》文章指出,现代汽车前照灯亮度过高,对行人和其他驾驶员造成眩光,但通过技术改进和更合理的法规标准完全可以缓解这一问题。作者呼吁重新审视车灯设计,在保证夜间安全的同时减少不必要的刺眼干扰。
该论文提出SIA框架,让AI自动循环改进:一个观察者AI监控任务代理的表现,然后修改其外部设置(提示词、工具、重试规则、输出解析)或通过LoRA权重更新训练模型本身,模型主体不变,仅适配器从任务反馈中学习。在三个任务上测试:中文法律罪名分类(LawBench达70.1%)、GPU内核速度调优(生成代码优于此前最佳)、单细胞RNA降噪(得分0.289)。综合版本在所有任务上超越仅修改设置的方案,表明权重更新能帮助模型学到提示和工具无法发现的模式。
Jeff Bezos 在 CNBC 披露其新公司 Prometheus 的愿景:构建人工通用工程师,设计制造喷气发动机、芯片、医疗设备等硬物理产品,将传统数年设计周期缩短 10 倍以上。公司宣布完成 120 亿美元融资,估值 410 亿美元。初始启动资金 62 亿美元,新一轮融资表明公司需要更多算力、人才和工业数据才能验证产品。410 亿美元估值表明,前沿 AI 已从软件竞赛变为计算采购竞赛——投资者实质在为可能实现模型所需的机器预付费。
关联讨论 3 条X:Kim (@kimmonismus)Bloomberg:Technology(RSS)TechCrunch:AI(RSS)Richard Clarida(PIMCO董事总经理兼全球经济顾问,前美联储副主席)指出,人工智能将在未来五年对经济和市场产生重大影响。他认为AI可能通过提高生产率和工资压缩成为通缩力量,同时AI投资也伴随融资风险。
Three layers you need to run agent swarms at scale: - Runtime: solved. - Orchestration and triggers: solved. - Coordinat...
Claude Fable 5 在编码任务中取得中等水平结果,Hacker News 上获 109 个点赞。
OpenRouter 推出 advisor 服务器工具,允许快速、便宜的模型在生成过程中向更强模型咨询。用户可用 GPT-4o Mini 处理常规任务,在关键环节调用 Claude Fable 进行更高质量的推理。
关联讨论 2 条X:OpenRouter (@OpenRouter)OpenRouter:Announcements(RSS)缺少 LLM 网关时,供应商中断会直接变成用户可见的错误,AI 支出也难以追踪。文章从路由、合规性和设置时间三个维度比较了最佳方案。
spent all day on fable for a giant PR. ~10kloc, lots of testing and intervention. 250$. I... don't think it's worth it? ...
提出社会世界模型(SWM)框架,利用大语言模型的常识与社会智能模拟社会信念随重大事件的演变。SWM通过挖掘社会数据中的时间模式并优化证据下界学习状态转移函数,无需人工标注事件与信念的关联或普查数据。引入SWM-bench基准,包含Kalshi和Polymarket预测市场超12k数据点,覆盖政治、金融、加密货币等领域。实验表明SWM显著优于时序基线,在Kalshi上达最优,在Polymarket上表现有竞争力,并提供可解释的社会信念动态洞察。
OpenAI 宣布收购 Ona,其安全云端执行技术可为 Codex 智能体创建持久云端工作空间——用户离开后,智能体仍可持续运行命令、检查系统、保留上下文并跨设备恢复任务。目前 Codex 周活用户达 500 万(增长 400%)。收购旨在强化企业级部署:智能体可在企业云边界内运行,具备作用域凭证、审核追踪、访问限制和可审计活动,适用于测试、漏洞修复、重构、迁移等多步骤任务。收购完成后,Ona 团队将加入 OpenAI Codex 团队。
We've reached an agreement to acquire @ona_hq. Its secure cloud execution technology will help Codex take on longer-runn...
杰夫·贝佐斯在 CNBC 反驳“AI 取代人类工作”的观点。他认为,许多人担心 AI 会消灭放射科医生、软件工程师等岗位,但这种看法是错的。AI 实际上会提升这些人的能力,就像挖地下室从铁锹换成推土机一样。他预测结果反而是劳动力短缺,经济生产力将大幅提升。
一个非常个人视野的观察:很多用AI时间不怎么久的人,似乎并不知道: > 当AI预期之外地停止工作的时候,通常只要给它再发一句"继续"就好了。
The Grok Build Plugin Marketplace is now in beta. Build with MongoDB, Vercel, Sentry, Cloudflare, and Chrome DevTools pl...
关联讨论 2 条X:xAI (@xai)xAI:News(网页)Waymo 发布了一篇标题为 "Waymo Premier" 的博客文章(链接:https://waymo.com/blog/2026/06/waymo-premier/),介绍了名为 Waymo Premier 的产品或服务。该文章于 2026 年 6 月 11 日 16:10 UTC 在 Hacker News 上被分享,截至统计时获得了 102 个 HN 点数。
Mythos invented its own language, then switched back to English to talk to humans (AI safety researchers have been warni...
Adobe 2026财年第二财季营收66.18亿美元,同比增长12.69%,超市场预期64.6亿美元。订阅业务营收63.90亿美元,同比增14%。GAAP归母净利润17.12亿美元,同比增1.24%;非GAAP净利润24亿美元,同比增10.66%。AI-first ARR突破5亿美元,同比增三倍。期末ARR达271.0亿美元。上调全年营收指引至265-266亿美元,第三财季营收指引66.7-67.2亿美元。现任CFO将于6月15日离职,Steve Day任临时CFO。
据Bloomberg报道,立法者与科技公司正推动设立公共财富基金等新机制,旨在使公众从AI技术推动的经济增长中获得收益。
Cursor 本周推出 Auto-review,旨在让代码智能体在保持自主性同时降低安全风险。该功能引入分类器代理,在每次工具调用前根据上下文判断风险:低风险时允许自由操作,越界时阻止并返回解释,使父智能体自主调整路径。分类器为轻量模型,与父代理同 RPC 流运行避免延迟,并可读取工作区文件辅助决策。团队基于约 12 小时内部开发者会话整理 6,122 条标注数据,补充合成异常用例评测,以平衡安全与开发效率。
关联讨论 1 条Cursor BlogICYMI: CyOps Arena is now live, co-hosted with @MiniMax_AI. With a $5,000 prize pool and 80% off MiniMax M3 model token ...
据《新科学家》6月10日报道,全自主无人机首次击毙了人类士兵。这是有记录以来第一次由完全自主运行的无人机执行致命攻击,标志着自主武器系统在实战中的新进展。该报道来自《新科学家》网站,目前尚无更多细节公布。
We've reached an agreement to acquire @ona_hq. Its secure cloud execution technology will help Codex take on longer-runn...
LLM Gateway 能防止 API 提供商故障变成用户端可见错误,并让 AI 费用变得透明。通过路由、合规性和设置时间等维度,可以对比市面上最佳的网关方案。
WSJ 报道,OpenAI 正考虑大幅降价以应对与 Anthropic 的竞争。Anthropic 增长主要来自开发者和编码工作流,Claude Code 消耗大量 token,已让企业团队将其融入日常工作。OpenAI 虽在消费品牌上更大,但企业市场才是关键——企业为编码智能体、自动化等工具付费。同时,OpenAI 在 IPO 前准备对 ChatGPT 进行史上最大改版,将其打造成涵盖编码、AI 智能体、图像生成和商业软件的超级应用,改版将在未来几周陆续推出。OpenAI 将更多资源投入编码工具 Codex,目标实现 Codex 工程负责人所说的“个人智能体”。
OpenAI is preparing its biggest ChatGPT redesign yet, before its IPO. To make it into a superapp for coding, AI agents, ...
关联讨论 2 条Gary Marcus:The Road to AI We Can Trust(RSS)Bloomberg:Technology(RSS)Zed 开发者在其官方博客中提出,软件真正的创造过程并不在代码提交本身,而是发生在两次提交之间的思考、调试与重构中。这一观点强调提交记录之外的隐式工作对软件质量的决定性作用。