OpenRouter 推出 advisor 服务器工具,允许快速、便宜的模型在生成过程中向更强模型咨询。用户可用 GPT-4o Mini 处理常规任务,在关键环节调用 Claude Fable 进行更高质量的推理。
关联讨论 2 条X:OpenRouter (@OpenRouter)OpenRouter:Announcements(RSS)OpenRouter 推出 advisor 服务器工具,允许快速、便宜的模型在生成过程中向更强模型咨询。用户可用 GPT-4o Mini 处理常规任务,在关键环节调用 Claude Fable 进行更高质量的推理。
关联讨论 2 条X:OpenRouter (@OpenRouter)OpenRouter:Announcements(RSS)缺少 LLM 网关时,供应商中断会直接变成用户可见的错误,AI 支出也难以追踪。文章从路由、合规性和设置时间三个维度比较了最佳方案。
LLM Gateway 能防止 API 提供商故障变成用户端可见错误,并让 AI 费用变得透明。通过路由、合规性和设置时间等维度,可以对比市面上最佳的网关方案。
Seven Seven Six 创始人兼 Reddit 联合创始人 Alexis Ohanian 在柏林 SuperReturn 年会上表示,SpaceX 的 IPO 将成为里程碑事件,为太空经济注入新资本。他还谈到即将到来的 AI 公司 IPO(包括 OpenAI 和 Anthropic),认为这些上市将改变风险投资格局。
asyncinject 0.7 发布,这是一个作者数年前为支持 asyncio 依赖注入模式而构建的 Python 工具库,曾与 Datasette 搭配使用。Claude Fable 5 发现了库中的若干 bug 并自动修复——Claude Fable 5 是一个非常主动的模型。
彭博观点专栏作家Gautam Mukunda指出,高管们正强迫员工使用AI,将裁员归咎于AI,并误解颠覆性技术的实际演变方式。
DigitalBridge CEO Marc Ganzi 在 Bloomberg Open Interest 节目中表示,AI 的下一个瓶颈是电力,而非仅芯片或数据中心。他阐述了公司对 ArcLight 的收购以及庞大的千兆瓦级项目管道,并认为太空数据中心目前更像“科学项目”而非真正的基建策略。
AMD CEO 苏姿丰在 MIT 毕业典礼演讲中指出,AI 无法替代人类判断哪些问题值得解决、在缺乏数据时作出艰难决定,也无法为结果承担责任。正值科技巨头全面押注 AI 之际,行业出现质疑发展瓶颈的声音,也有人担忧被取代。微软 AI 负责人苏莱曼曾称 AI 将在 18 个月内接管所有白领工作(后澄清指重复任务),比尔·盖茨则预计 AI 将取代大部分工作,但程序员等复杂领域仍需人类专业判断。苏姿丰强调,在人机协作深化背景下,人类在确定目标、作出关键判断和承担最终责任方面仍不可替代。
员工每周平均花费超过6小时进行“照看AI”(botsitting)的工作,这一额外负担加剧了他们对工作的不满情绪。
Hacker News 上一则观点认为,人工智能并未取代软件工程师,并且将来也不会。该帖子获得了 103 个 HN Points。
OpenAI 正考虑大幅降价,Gary Marcus 认为这暴露了公司的疲软竞争力。
关联讨论 3 条X:Rohan Paul (@rohanpaul_ai)Bloomberg:Technology(RSS)Hacker News 热门(buzzing.cc 中文翻译)鸿蒙智行尚界汽车详解尚界Z7全系标配的华为巨鲸电池平台,宣称“百万装车0自燃”。该平台采用正置电芯架构和15层防护(5层热安全、5层电芯、5层底部),包括航空级气凝胶、耐1000°C云母板与定向排烟通道、超耐磨防腐涂层、热成型钢板、铝合金缓冲层等。电池包四周加强筋、铝合金挡块及热成型钢梁提升抗碰撞能力,前防刮梁低于电池包最低点。BMS云端看护实现7×24h监控,近200个智能感知节点进行一芯一感知,AI预警可提前识别隐患并记录全生命周期健康档案。
Anthropic 发布了一篇由 Dario Amodei 撰写的长文和两个政策框架。文章呼吁对前沿 AI 模型进行强制审计,并将 AI 描绘为国家间争夺的战略武器,类似冷战时期的博弈。
OpenAI 国际事务负责人、前英国财政大臣 George Osborne 在牛津郡 Founders Forum 表示,许多国家虽有采用 AI 的讨论,但多数仍在推进中,尚未真正落地。他称,更快采纳新技术的政府将在经济和公共服务方面成为大赢家。
Xebia全球CTO Niels Zeilemaker指出,为组织引入AI智能体加速流程必须从数据基础着手——让数据可供AI消费。Agentic AI的规模取决于数据强度,忽视这一点将无法推进。
本部分将手写 matmul-add 对替换为 nn.Linear(bias=True),堆叠三层 Linear 与激活函数构成多层感知机(MLP)块,在 NVIDIA A100 GPU 上剖析。Profile trace 显示 nn.Linear 内部调用 aten::addmm,将 bias 加法作为 epilogue 融合进矩阵乘法核,避免额外 HBM 访问;transpose 操作(aten::t)仅改写 CPU 端张量元数据(shape 和 stride),不启动 GPU 核。
人工智能数据中心的大规模建设,正在持续推高手机、电脑和汽车中所使用关键硬件部件的生产成本,这一成本上涨效应已经开始反映在通胀统计数据之中。
Claude Fable 5(Mythos 安全公开版)6月22日前对 Pro/Max/Team 订阅用户开放,之后转 API。作者用 100 美元/月的 Max 会员,让 Fable 5 开发了开源“鲁班 Skill”,专用于打磨其他 AI Skill。该 Skill 通过前提验证(真实问题、安装理由、唯一性)、并行搜索同类(GitHub/ClawHub/skills.sh 等)、横纵分析、Darwin 式 9 维度评分(权重最高的实测表现)、SkillOpt 式单方向改写等步骤,将作者已有的 ai-news-radar 项目升级至 v0.7。Fable 5 自动录制操作视频并剪辑,追加了热点模式和时间轴模式,改进了消息评分算法并公开回测工具。鲁班 Skill 已开源至 github.com/LearnPrompt/luban-skill,强调 Skill 本质是清晰提示语而非复杂脚本。
关联讨论 27 条TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)Anthropic:Newsroom(网页)X:Perplexity (@perplexity_ai)Simon Willison 博客The Verge:AI(RSS)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Rohan Paul (@rohanpaul_ai)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)银河证券与火山引擎合作,引入TRAE企业版并推进SDD(规格驱动开发)范式,将AI Coding嵌入研发全流程。研发需求交付周期缩短1/3至1/2,AI代码采纳率最高达87%,前端UI还原度稳定在90%以上(H5/Vue页面达98%以上)。子账户与融券系统重构周期从4个月压缩至2个月,Bug率降低25%,单元测试覆盖率提升30%,券池规模扩大10倍,服务客户量扩大20倍。通过MCP集成打通Ones、GitLab、DevOps等工具链,组织级Skill库减少60%手写测试工作量。TRAE企业版已覆盖银河证券100个研发席位,累计培训超130名研发人员。
6月5日,金山办公发布AI原生多模态笔记产品WPS笔记,摒弃传统文件夹,采用多级AI自动标签组织内容。支持语音、图片、文字、网页等录入;语音转写具备AI实时纠正和声纹区分发言人功能,图片可提取公式并支持LaTeX编辑及梯形校正。全域多模态检索可同时搜索文字、图片、音频。内置WPS灵犀助手,能完成整理、摘要、润色、创建任务清单等操作,支持自定义Skill和记忆设置。开放外部MCP接入,允许Cursor、Claude等第三方AI应用直接读取笔记。
微软 CEO 萨提亚·纳德拉在《纽约时报》播客《Hard Fork》中承认,公司内部算力堆砌现象普遍,员工习惯用最强模型解决所有问题。他呼吁按实际需求匹配模型,避免浪费,并举例 Copilot 自动模式能按任务自动选择最合适模型。纳德拉还透露自己用 AI 快速开发了一款工具:它能跟踪工作沟通、持续维护软件项目,在员工讨论调整需求时自动生成方案并更新代码,无需他参会。他强调非前沿问题无需用顶尖前沿模型,微软正在收紧 AI 成本管控。去年10月他更换了商业业务负责人,11月聘请新 AI 顾问,推动22万员工向 AI 时代转型。
Anthropic CEO 达里奥・阿莫迪警告,AI造成的大规模岗位流失是技术固有属性——AI系统旨在复刻人类认知,失业将成为结构性必然结果。他提出应对思路:完善劳动力市场监测、推行薪资保障与留岗税收优惠、发放培训补贴;若人力需求永久下降,则需通过征税推行全民基本收入等长期收入保障。Anthropic目标非削减人力成本,而是帮企业开拓新营收、盘活现有员工产能。
Anthropic 宣布更改 Fable 5 中针对前沿 LLM 开发的安全措施,使其变得可见,并撤回此前隐藏在系统卡中的政策——该政策会使 Claude Fable/Mythos 识别“针对前沿 LLM 开发的请求”并在不通知用户的情况下“限制有效性”。Anthropic 在声明中承认做出了错误的权衡,并为未能达到平衡而道歉。
WorkBuddy是面向国内用户的通用Agent产品,支持Windows和Mac,提供免费版和58元/月个人专业版,企业版已推出。内置代码开发、日常办公、设计创意三种场景模式及100多个行业领域AI专家。模型集成腾讯混元、DeepSeek(推荐V4 Pro)、GLM、Kimi等国产大模型,也支持接入兼容OpenAI协议的外部API。拥有Skills市场和MCP连接器生态,可打通QQ邮箱、腾讯会议、腾讯文档等服务。教程通过公众号周报生成和功能网页开发两个案例演示实际用法。
科技媒体Appleinsider于6月10日测试iPadOS 27新版快捷指令中基于Apple Intelligence的自然语言生成工作流功能。简单任务如“开启低电量模式并启动计时器”效果理想。但涉及多条件判断或跨应用联动的复杂工作流仍需手动调整。在去除URL追踪参数的测试中,AI生成的工作流初看合理,但实际运行均出错,模型误判输入或报告剪贴板无URL,经多轮提示词修改和手动干预仍未能正确清除追踪参数。
德国一项新裁决启发了颠覆性思路:Section 230 可能无法再保护 AI 公司免于承担法律责任,或将彻底改变行业规则。
关联讨论 3 条The Decoder:AI News(RSS)Hacker News 热门(buzzing.cc 中文翻译)Gary Marcus:The Road to AI We Can Trust(RSS)外媒 The Verge 体验苹果 iOS 27 全新 Siri AI,发现其回复极为简洁,不套近乎。相比谷歌 Gemini 热情外放、ChatGPT 力求沉稳但仍拉近距离,Siri AI 只回答问题,不作闲聊引导。例如问“最近怎么样”,Siri AI 直接建议开启设置搜索新闻;问天气时提示美国国家气象局已发布极端高温预警;问“你能做我的朋友吗”回答“无论顺逆境,我都会做你的朋友”;问“你喜欢我吗”回答“我觉得你很不错”。苹果将 Siri AI 定位为实用工具,新版需等到今年秋季 iOS 27 正式推送后全面开放。
特斯拉自动驾驶出租车服务上线近一年,截至本周二车队仅 59 辆车,运营范围限于得克萨斯州三座城市。马斯克曾预计 2025 年底美国半数人口可用,但实际等待长达 30 分钟、运力紧张、错误上下客,部分车辆仍配安全员。竞争对手 Waymo 在得州登记车辆超 600 辆。特斯拉已上报 17 起事故,马斯克坦言至少到 2027 年才有望盈利。
DeepSeek 的相关说明在 Hacker News 上获得 100 个 HN Points,发布于 6 月 10 日。
实现了一个端到端的 Microsoft SkillOpt 仪表化工作流,包括设置仓库、连接 OpenAI 兼容模型、配置优化器和目标模型。以原始种子技能为基线,运行包含 rollout、reflection、aggregation、selection、更新和验证门控的优化循环,检查训练历史,可视化准确率、编辑预算行为和 token 用量,并将进化后的技能与基线进行比较。
天体物理学家 Chi-kwan Chan 借助 Codex 构建黑洞模拟程序,用于研究极端物理现象并检验爱因斯坦的广义相对论。
本文发表于 darioamodei.com,英文标题 "Policy on the AI Exponential",中文译为“关于人工智能指数增长的政策”。文章聚焦于人工智能能力的指数级提升对公共政策提出的新挑战,强调现有政策框架需进行根本性调整以适应 AI 的快速迭代。该文在 Hacker News 上获得 100 点热度,引发讨论。
一篇分析Anthropic模型命名模式的外推文章在Hacker News上获得139个点赞,原文发布于samwilkinson.io。
Gemini 2.5 Flash API 支持配置思考预算(thinking budgets),用户可跨提供商进行比较,并在5分钟内完成首次API调用。
关联讨论 1 条OpenRouter:Announcements(RSS)Anthropic 的 Fable 模型(Claude Fable 5)推理性能翻倍,关键基准测试得分提升 10–15 个百分点,远超此前约 2 个百分点的典型进步。Stripe 借助该模型将 5000 万行 Ruby 代码库的迁移压缩至一天,数万行代码重构仅用 45 分钟。然而 Fable 施加了强护栏限制,对违规话题(如植物细胞、现代大语言模型描述、软件安全)容易触发温和提示——这是为维持系统稳定而设定的“玻璃天花板”,其下方仍有广阔探索空间。
关联讨论 27 条TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)Anthropic:Newsroom(网页)X:Perplexity (@perplexity_ai)Simon Willison 博客The Verge:AI(RSS)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Rohan Paul (@rohanpaul_ai)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)安全公司blue41发现,通过向bunq银行AI代理发送一笔0.01欧元的转账,攻击者可能利用提示词注入等漏洞操控AI代理,进而获取用户数据或执行未授权操作。该漏洞源于AI代理对用户输入与系统指令的边界处理不足。bunq已与blue41合作修复问题,并公开致谢。此次事件凸显金融AI智能体面临的新型安全风险。
加州大学洛杉矶分校教授、韧性数字正义中心主任Safiya Noble在Bloomberg Tech节目中直言当前AI并不安全。她指出,刻板印象和偏见正在被构建进训练数据中。尽管Anthropic和OpenAI等AI巨头在筹备IPO时强调其技术安全和人类有益性,Noble认为这并未反映现实。
原文回顾了与 Steve Eisman 的最新访谈,并指出一些可能具有关键意义的新闻,未提供具体细节。