We're integrating Deep Research as a native skill inside Computer. It now connects to the agent harness that powers Computer, with access to search as code generation, long running sandboxes, connectors, tools, and licensed data. Available now to Pro and Max subscribers.
译我们正在将 Deep Research 作为原生技能集成到 Computer 中。 它现在连接到驱动 Computer 的智能体框架,可访问搜索即代码生成、长运行沙箱、连接器、工具和授权数据。 Pro 和 Max 订阅者现已可用。
以前推理强度我都无脑 Max,现在用 Fable 5 就得斟酌着选择,不敢随便选 Max,一方面它足够聪明不需要,另一个是时间长 token 消耗太大! 另外 Fable 5 有个优点也是缺点,就是特别喜欢验证,各种验证,结果固然是好,但是时间耗得很长不一定合算。
译用户分享 Claude Fable 5 使用体验:以前无脑选 Max 推理强度,现在则不敢随便选,因为模型足够聪明无需过强推理,且时间长、token 消耗大。Fable 5 还喜欢反复验证,结果虽好但耗时长不一定合算。引用推文指出,Fable 5 的强项之一是思考推理时间很长,曾有一次思考 15 分钟才开始行动。
Maket has enabled floor plan upload, letting users bring their existing plans into the platform and have them recognized and editable within minutes. Users can upload a sketch, a listing PDF, or an old design file, which will automatically be traced for walls, doors, windows, and furniture, and then made available on a live canvas, ready to edit and view in 3D.
译Maket 推出了用户最常请求的功能:支持上传平面图(包括草图、PDF 或旧设计文件),系统自动识别墙、门、窗和家具,几分钟内即可在平台上生成可编辑的 3D 画布,用户可直接修改和查看。这是该平台最受期待的功能之一。
一群 AI 研究员把量化金融的知识处理框架开源了,叫 QuantMind(MIT 协议)。 它不是 Bloomberg Terminal 的替代品,但确实在干一件类似的事:把 arXiv 量化论文、SEC filings、研报、博客等非结构化内容,批量解析成可查询的语义知识图谱。 核心优势在于两阶段架构:先把文献一次性提取并结构化(支持表格、公式、图表的多模态解析), 之后你用自然语言提问就能进行多跳推理和交叉验证,提取的知识会长期留存,后续查询成本很低。 它真正能替代的其实是对冲基金花六位数薪水让初级分析师干的「大量读论文、整理观点、做文献综述」这类工作。 以前的信息差很大一部分来自「我还没来得及读那篇关键论文」,但是现在这个借口正在快速失效, 但咱们也别误会,真正的 alpha 依然来自你问的问题、验证的严谨程度,以及把洞见转化为行动的能力, 工具只是把「读文献」这个基础环节的成本大幅降低了。
译一群AI研究员开源了量化金融知识处理框架QuantMind(MIT协议)。它能将arXiv论文、SEC文件、研报等非结构化内容批量解析为可查询的语义知识图谱,支持多模态解析(表格、公式、图表)及自然语言多跳推理,可替代初级分析师读论文、整理观点等工作。但真正的alpha仍取决于提问质量与验证严谨度。
The quality of your data directly dictates the quality of your AI model. But the way data affects model performance is hand-wavy voodoo at worst and intuition at best. This new research now lets you debug your data BEFORE you spend a fortune on an irreversible training run.
译数据质量直接决定 AI 模型性能,但此前数据对模型的影响机制难以捉摸。GoodfireAI 提出“预测性数据调试”方法,允许在投入昂贵训练前提前发现数据问题。在 DPO 数据集中,他们发现了损坏的护栏、模型幻觉,甚至包含“鱼放屁同人小说”等低质内容。该技术旨在揭示并塑造模型将在训练中学到的内容,避免不可逆的无效训练。
发现Claude Fable 5强的地方之一,可能是模型思考推理的时间足够长。 刚提了个想法,它思考15分钟才开始行动,牛逼。
译发现 Claude Fable 5 强的地方之一,可能是模型思考推理的时间足够长。 刚提了个想法,它思考 15 分钟才开始行动,牛逼。
如果不知道用大模型做啥,其实可以试试一些需求很高的工具站,最好不用 AI 能力。 这也是模型能力的测试案例。 不少出海做站赚Adsense美金的,感觉也是类似思路。 不少工具仍然太知名,找懂的领域的工具,用当下最好的模型复刻,加上自己的需求理解,好像不难。
译推文探讨了使用大模型复刻已有热门工具站的可能性,强调这些工具站本身不需要AI能力,纯靠需求驱动。作者指出,许多出海赚Adsense美金的站点也遵循类似逻辑——选择自己熟悉领域的工具,用当前最好的模型进行复刻,并结合自身对用户需求的深入理解,从而快速做出有价值的作品。这是对模型能力的一种实用测试。
The @MongoDB plugin is live in the Grok Build Plugin Marketplace. Explore data, optimize database performance, and build high performance vector search systems with a single prompt.
译@MongoDB 插件已在 Grok Build 插件市场上线。 通过单个提示词,探索数据、优化数据库性能并构建高性能向量搜索系统。
Gemini Omni Flash is SOTA at image to video, text to video, and video editing : ) Excited to get this to developers in the API soon!
译Gemini Omni Flash 在图像到视频、文本到视频和视频编辑方面达到了 SATA : ) 很高兴很快能将这一能力通过 API 提供给开发者!
Have been using the @MongoDB plugin to make Grok Build sessions sync across devices - analyzing perf and managing DBs with prompts
译一直在使用 @MongoDB 插件让 Grok Build 会话跨设备同步——通过提示词分析性能和管理数据库
Two things are true: (1) Anthropic (or parts of it) are absolutely and sincerely worried about the misuse of Mythos-class models & have put in excessive safeguards until they are confident it will not be misused (2) They have not succeeded in explaining/convincing people of this
译两件事是真的: (1) Anthropic(或其部分成员)绝对且真诚地担忧 Mythos 级别模型被滥用,并设置了过度防护措施,直到他们确信它不会被滥用为止 (2) 他们未能成功解释/说服人们这一点
The sold out New York premiere of the 2026 Runway AI Festival is tonight. See you at the movies.
译2026 年 Runway AI Festival 纽约首映门票已售罄,今晚举行。电影院见。
Finally a way to see your top humans & top agents at a glance. Includes an API to query all your data over time 📊
译终于能一目了然地查看你的顶级人类与顶级 AI 智能体了。 附带一个 API,可随时间查询你所有的数据 📊
我问了Fable 5, 在一个 AI 能在几秒内完美总结或解释任何书的时代, 亲自花 8–20 小时啃一本难读的文本, 其不可替代的认知价值是什么? 这是他的回答:
译用户指令Fable 5自建2026设计趋势的落地页,要求动态和彩蛋。Fable 5自行搜索趋势、调整配色与动效,藏入3个彩蛋,几分钟生成单文件HTML。用户计划让其担任全职全栈工程师。此前用户曾问亲自啃难懂文本的不可替代价值,Fable 5以此能力展示作答。
Toward Generalist Autonomous Research via Hypothesis-Tree Refinement
译通过假设树精炼迈向通用自主研究
TRL-Bench Standardizing Cross-Paradigm Representation-Level Evaluation of Tabular Encoders
译TRL-Bench 标准化跨范式表格编码器的表示级评估
Has anyone clearly laid out an argument for continued availability of frontier open weights models that are (1) profitable for firms to distribute free as costs rise & (2) safe enough post-Mythos that governments will not intervene to stop their nations labs from distributing?
译有没有人清楚地阐述了一个论点,支持前沿开放权重模型持续可用,且满足 (1) 企业在成本上升时仍可免费分发且盈利,(2) 在Mythos之后足够安全,以至于政府不会干预阻止本国实验室分发?
Use our Benchmarks explorer to plot Pareto curves for 10 different benchmarks, including @ArtificialAnlys and @Designarena: https://openrouter.ai/rankings#benchmarks
译使用我们的基准测试探索器,为 10 个不同基准(包括 @ArtificialAnlys 和 @Designarena)绘制帕累托曲线: https://openrouter.ai/rankings#benchmarks
Build Your Business Live: Episode 2 https://x.com/i/broadcasts/1dJrPPYbDvQKX
译Build Your Business Live: 第二期 https://x.com/i/broadcasts/1dJrPPYbDvQKX
Agent 几件套是必不可少的就是“记忆层”! Grok 终于 可以记住你了! Grok终于能记住你了,而且你还能随时翻出来看、改、删,这才是真正把AI从“每次聊天都重头来过”的工具,变成了陪你一起成长的伙伴。 以前每次打开Grok都得重新解释你的项目、偏好、目标,聊着聊着上下文就断了。现在它会主动把有用的细节留下来,下次直接接上,继续帮你推进。 更狠的是你完全掌控:想让它忘掉什么就删,觉得哪里不对就编辑,透明到不能再透明。隐私和个性化同时拉满。 如何开启? 打开Grok -设置按钮- 选择 记忆 - 然后开启记忆按钮。 可以查看记忆,编辑记忆等。
译Grok 推出“记忆”层,能记录用户之前的对话细节(项目、偏好、目标等),避免每次聊天从头开始。用户完全掌控:可查看 Grok 记住了什么、随时编辑或删除不需要的记忆。启用方式:打开 Grok 设置 → 记忆 → 开启。该功能旨在让 AI 越来越了解用户,提供更个性化的辅助体验。
这个创新点可以啊! 叫做River AI直接把个人AI的所有权塞回用户手里,把大公司垄断AI的局面打破了! 现在最好的模型都掌握在少数几家巨头手里,你的对话、数据、偏好、决策权全在他们服务器上。 而River AI要建的,是一个完全属于你的AI栈,它只为你服务,只按你的价值观运行,只在你的控制下进化。 他们今天宣布的,就是要把AI从“租来的工具”变成“你的个人智能伙伴”。 不再是公司告诉你AI能做什么,而是你决定AI长什么样、怎么想、怎么帮你。 最狠的是这不是空谈,他们已经在招顶尖研究员和工程师,一起把这个愿景落地。 个人AI的时代,不是远景,是正在发生的现实。 以前大家默认AI的未来一定是越来越中心化、越来越被大厂掌控,结果River AI直接反其道而行,把主权还给每一个普通人。
译River AI 今日宣布成立,致力于创建完全由用户拥有和塑造的个人 AI。创始人指出,当前最好的 AI 模型由少数大企业控制,用户的对话、数据和决策权都掌握在它们手中。River AI 正在构建一套全新的个人化 AI 栈,完全按用户价值观运行,只在用户控制下进化,将 AI 从“租来的工具”变为“专属智能伙伴”,把主权还给每一个普通人。
我尼玛!苹果现在安全性真的差! 世界果真就是草台班子、谁也不例外! 苹果新Siri AI的等候名单? 国外大神Mac用户直接一顿操作就把AI增强版给硬解锁了,名单这东西瞬间成了笑话。 WWDC刚秀完新Siri,大家还在排队等官方推送,结果有人发现系统里GenerativeModels.plist里藏着EnhancedSiriWaitlist开关。关掉SIP、挂载系统卷、改个键值、重启,立马就能用上。 更离谱的是这不是什么黑科技,就是改个plist文件而已。 有人还整理了超详细步骤,连新手都能跟着做,社区直接把“等候名单”这个人工闸门给撬开了。 以前大家觉得苹果产品永远是“公司说什么时候开放你就什么时候用”,结果这次新Siri的AI能力其实早就躺在系统里了,只是被名单挡着。 动手能力强的用户现在就能提前体验,官方推送反而成了后手。 这波操作把苹果一贯的封闭节奏打了个措手不及,也再次证明:真正的用户力量,永远比公司节奏快半拍。
译WWDC上苹果展示新Siri AI,用户需排队等候官方推送。但有Mac用户发现系统里GenerativeModels.plist文件藏有EnhancedSiriWaitlist开关,通过关闭SIP、挂载系统卷、修改键值并重启即可绕过等候名单直接启用。社区已整理详细教程。这一操作暴露新Siri的AI能力早已内置在系统中,仅被人为名单阻挡,官方推送反而滞后。
我做过网页的风格100+ ,之前没有skills。 按照古一的思路,我觉得可以拓展起来。 我改天看看整个skills来玩玩。
译Berry Xia发推文表示自己曾做过100多种网页风格,之前未使用过skills(技能)。他提到将参考“古一”的思路进行拓展,并计划日后研究如何利用skills来玩一玩。
"AI can make it. The great idea still has to be human". Dream Brief, named one of five Cannes contenders for shots by Lora Schulson of 72andSunny. - https://shots.net/news/view/cannes-contenders-2026-usa-2
译"AI可以制作。但伟大的创意仍必须来自人类。" Dream Brief,被72andSunny的Lora Schulson评为五个戛纳竞争者之一。 - https://shots.net/news/view/cannes-contenders-2026-usa-2
OpenAI ❤️ Ona OpenAI acquired Ona, a cloud execution platform for AI agents. > Its secure cloud execution technology will help Codex take on longer-running work, even when laptops are closed, and help more organizations deploy agents securely in production. Managed OpenAI Agents soon?
译OpenAI 已达成协议收购云执行平台 Ona,其安全云执行技术将帮助 Codex 处理更长时任务(即使笔记本关闭也能继续运行),并让更多组织在生产环境中安全部署智能体。收购完成后,Ona 团队将加入 OpenAI 的 Codex 部门,此举或预示着托管 OpenAI 智能体服务的到来。
Redesign Mixture-of-Experts Routers with Manifold Power Iteration
译用流形幂迭代重新设计混合专家路由器
\🎬 PixVerse、ついに東京へ上陸! 🗼/ 来週6/16(火)の夜、@PixVerse_ 初となる東京オフラインイベントを開催します!✨ AI動画の最前線で活躍するクリエイターや業界関係者が大集結🤝 @btrax_jp 様 、 @AICollectiveCo 様とともに、熱いクリエイティブの夜をお届けします🔥
The Grok Build Plugin Marketplace is now in beta. Build with MongoDB, Vercel, Sentry, Cloudflare, and Chrome DevTools plugins from your terminal. Read more https://x.ai/news/grok-plugin-marketplace
译Grok Build 插件市场现已进入 Beta 测试阶段。 从终端使用 MongoDB、Vercel、Sentry、Cloudflare 和 Chrome DevTools 插件进行构建。 了解更多 https://x.ai/news/grok-plugin-marketplace
Iran threatens Elon Musk’s companies in Middle East via Iranian state media. Data Center and Starlink factory aimed for. Donald Trump recently wrote on TruthSocial that "The United States will be hitting Iran (whose Navy, Air Force, radar, anti-aircraft capabilities, and all other forms of defense, together with most of its offensive capability, are GONE!), VERY HARD TONIGHT." In response, Iran sent a clear message to the US, targeting Elon Musk's companies. Musk's largest asset in the region is the xAI data center in Saudi Arabia: a 500 MW AI data center built in partnership with HUMAIN, the Saudi state's AI vehicle, with NVIDIA as its primary chip supplier. This would make it the largest xAI data center outside the US - for comparison, the Colossus-1 data center in Memphis delivers around 300 MW. We are in for a very difficult night.
译伊朗通过官方媒体威胁马斯克在中东的公司,目标指向xAI在沙特阿拉伯的500 MW AI数据中心与Starlink工厂。该数据中心与沙特国家AI机构HUMAIN合作建设,NVIDIA为主要芯片供应商,是目前xAI在美国以外最大的数据中心(对比孟菲斯Colossus-1约300 MW)。此举是回应特朗普在TruthSocial发文称“美国今晚将狠狠打击伊朗”。局势紧张。
Jeff Bezos raised $12B for Prometheus at a $41B valuation, seven months after launching it at $6.2B with no shipped product. The pitch is an "artificial general engineer" that compresses the design-to-build loop by 10x or more. The problem is that the physical economy can't be scraped. There's no internet of manufacturing data to train on, which is exactly why the reported $100B vehicle to buy up legacy industrial companies is interesting. You don't find that data. You acquire the factories that generate it. Could be an interesting moat.
译杰夫·贝佐斯旗下AI公司Prometheus在成立仅7个月、尚无任何产品交付的情况下,以410亿美元估值完成120亿美元融资(最初估值62亿美元)。该公司定位为“人工通用工程师”,目标是将设计到制造的循环压缩10倍以上。但物理经济无法像互联网数据那样抓取,缺乏制造业训练数据。为此,Prometheus计划斥资1000亿美元收购传统工业企业,通过获取工厂生成的数据构建护城河。
Use our Benchmarks explorer to plot Pareto curves for 10 different benchmarks More coming soon! https://openrouter.ai/rankings#benchmarks
译使用我们的基准探索器,为10个不同基准绘制帕累托曲线。 更多功能即将推出!https://openrouter.ai/rankings#benchmarks
We’re teaming up @Palmeiras, the first football club to meaningfully build upon TacticAI: our AI system that can help simulate field scenarios and predict open play dynamics up to 8 seconds in advance. ⚽
译我们正与@Palmeiras合作,他们是第一家有意义地基于TacticAI构建的足球俱乐部:我们的AI系统可以模拟场上情景并提前最多8秒预测开放比赛动态。⚽
Notebooks in Gemini are now available in the European Economic Area, United Kingdom, and Switzerland. With notebooks, you can organize your projects in a dedicated, focused space that remembers your sources, instructions, and chats. Create your own notebook at http://gemini.google or in the app today!
译Gemini 的 Notebooks 功能现已面向欧洲经济区、英国和瑞士用户开放。Notebooks 提供一个独立专注的空间,可记忆用户的来源、指令和聊天记录,用于组织项目。用户可通过 gemini.google 或应用创建自己的 notebook。该功能旨在将用户常聊的话题归入独立空间,帮助保持条理。
Partnership is the new power move. Luma is at Cannes Lions 2026 with the partners building the next era of creative work. June 22–26, AI & Tech Sandbox and Luma House. Full schedule below. RSVP to join us → http://lumalabs.ai/cannes
译合作是新的力量之举。 Luma 将参加 2026 年戛纳创意节,与合作伙伴共同构建创意工作的新时代。6 月 22–26 日,AI & Tech Sandbox 和 Luma House。完整日程如下。 RSVP 参加 → http://lumalabs.ai/cannes
Fable 5是真的厉害真的好用, 但也真的贵啊, 今天直接干掉$1000+😭
译用户分享 Claude Fable 5 体验:仅靠一句指令“给你自己做个落地页,自由发挥,要2026最新设计趋势,要彩蛋”,Fable 5 在几分钟内自动生成完整单文件 HTML,无需任何修改。它主动搜索 2026 设计趋势、调整配色和动效,并偷偷藏了 3 个彩蛋。用户惊叹其代码质量和文笔,但当天因使用 Fable 5 耗费超过 $1000,称“真的贵”。
很多朋友问,如何给Codex写一个好的Goal指令? 睡觉前执行,模型自动开发,第二天“收菜”。 发过4w字文档,但多数人懒的看,所以我写了个Skill。 把一句话需求变成目标,复制就能用。 安装指令: npx skills add joeseesun/qiaomu-goal-meta-skill 源码免费开源,见评论区
译针对如何给Codex写Goal指令的问题,作者发布了一个Skill,可将一句话需求自动转化为目标,实现“睡前写指令、模型自动开发、第二天收菜”。安装命令:`npx skills add joeseesun/qiaomu-goal-meta-skill`。源码免费开源(见评论区),旨在简化4w字文档的阅读负担。
Anthropic 为何如此牛逼?快速一波流了解清楚! 创始团队不是"从 OpenAI 跳槽的工程师",而是GPT-2、GPT-3 的实际作者们。 Dario Amodei 之前是 OpenAI 研究副总裁。 Jared Kaplan 是 Scaling Laws 论文的核心作者;Tom Brown 是 GPT-3 的首席工程师。 Chris Olah 是 AI 可解释性领域的奠基人。 这套班底相当于"整个行业最重要的几张牌被一家公司拿走了"。 Medium 二、三大独家技术武器 Scaling Laws 解释了为什么模型随算力增长而变强,这让 Anthropic 能精确预测训练产出,而不是盲目烧钱。 Constitutional AI (宪法AI) 是一套把价值观直接编码进训练过程的方法论,让模型行为更可审计、更稳定,而不依赖大量人工标注。 RLHF 更是 Dario 本人参与发明的方法,他们不只是使用者,而是发明者。算力不输任何人! Anthropic 与 Amazon 签署了高达 5 GW 算力的合作协议,目前已在运行约 100 万颗 Trainium2 芯片。 加上与 Google/Broadcom 的 5 GW TPU 协议和 Microsoft/NVIDIA 的 $300 亿 Azure 算力,Anthropic 的算力版图横跨三套硬件生态。 三、营收爆炸式增长 Anthropic 的年化营收从 2024 年 1 月的 $8,700 万飙升到 2026 年 4 月的 $300 亿,CEO Dario Amodei 本人也称这一增速超出了公司自身预测 8 倍。 四、关于"嗤视"中国厂商这件事 需要分两层看:Anthropic 公开指控 DeepSeek、月之暗面、MiniMax 通过约 2.4 万个虚假账号发起约 1,600 万次对话,违规蒸馏 Claude 能力,技术证据有一定依据。 但分析人士也指出,Anthropic 在指控中对各家中国公司的排序,高度贴合华盛顿的政治敏感度,而非单纯的技术危害程度,DeepSeek 排第一,虽然其交互数量反而最少。 所以这件事既有真实技术竞争的成分,也是非常明显的政策游说动作。
译Anthropic 创始团队由前 OpenAI 研究副总裁 Dario Amodei、Scaling Laws 核心作者 Jared Kaplan、GPT-3 首席工程师 Tom Brown 及 AI 可解释性奠基人 Chris Olah 组成。技术武器包括 Scaling Laws、Constitutional AI 及 RLHF(Dario 参与发明)。算力方面:与 Amazon 签署 5 GW 协议,运行约 100 万颗 Trainium2 芯片;另有 Google/Broadcom 的 5 GW TPU 及 Microsoft/NVIDIA 的 $300 亿 Azure 算力。年化营收从 2024 年 1 月 $8,700 万飙升至 2026 年 4 月 $300 亿,超预期 8 倍。另指控 DeepSeek、月之暗面、MiniMax 通过约 2.4 万虚假账号发起约 1,600 万次对话进行蒸馏,该指控兼具技术事实与政策游说动机。
introducing Generative Sliders. now you can control the intensity, complexity, and movement of any image you generate with Krea 2. what new controls would you like to see? 👇
译推出生成式滑块。 现在您可以控制使用 Krea 2 生成的任何图像的强度、复杂度和运动。 你希望看到哪些新控制?👇
The core part of this Anthropic Fable release saga is that there are many overlapping issues at once. Some of which operate on different timelines of the AI arc, and some have easier fixes. In my critiques, I asked for specific changes to some things, understanding that some things don't have an easy fix. The simplest issue was an uneven application of safety domains in a way that was misleading to users. This was an implementation issue that overlaps with a values-based decision of what their customers should be doing. Many people including myself pointed out how it was insane to list core safety areas and then have one of them launch with a different safety mechanism, one which actively mislead users. Doing this from the guise of safety was a major misstep and in my opinion Anthropic got very justifiably raked over the coals for it. Don't release the model if you can't hit your safety targets. A subissue here is the idea of silent manipulation. This again is a horrible precedent, and quite odd for a company that has done extensive, leading technical AI safety research on ideas like CoT monitoring and other emergent misalignment issues. Silent manipulation of users is baking in a misalignment to the system at its face level. This comes with a permanent degradation in user trust, which begets a less safe environment for AI. Users who don't have clear information on how AI works will not develop safe working patterns with it. The more complex issues are with how Anthropic handles broader scientific engagement with their models. The safety classifiers launched with these models obviously have accuracy issues to start. I have priced in that there will be more false positives to start, that's life. It's Anthropic's business to degrade their products at release time, or make the trade off of user satisfaction versus revenue. Still, it is a very real sign of concentration of power that businesses can make such obviously user-harmful behaviors and still lead in the market. This concentration of power is only starting to set in and we could see even weirder signs of it in the coming years. It is now simple enough for me to test Claude Fable in my workflows and know if I'm restricted. This is obviously a suboptimal equilibrium – i want the best intelligence I can get, without restrictions – but it is easy enough for me to make sense of and work with. The specific issue of restricting access to AI research in particular was a bubbling and hard to fix issue with Anthropic specifically, and the frontier labs generally. There is a common view that the frontier labs will be the mediators of all major scientific innovations in the future, as the places with the best models and the compute for inference to solve major problems. This is a categorical error in how science works, which is a community evolution of accepted ideas, and the the evaluation of your ideas by (hopefully numerous) independent, other practitioners. You cannot have science advance only within a monolith. As an AI researcher I'm very sad to have the latest models restricted, but I would expect Anthropic to do this eventually. I lost more trust over the silent manipulation than I would with a restriction in access. Anthropic has made it pretty clear that they only trust themselves as the mediators of cutting-edge AI research. If I had a say, Anthropic should've proactively made a program to make sure researchers get access in the broader AI community without the safeguards. Academics, nonprofit workers myself, etc. have no reason to not get access. The only valid argument here is that they want to control frontier AI, which is a know your customer part of serving these models. This worldview of science has personally motivated me greatly over the last year, and increasingly so this week, to make the open science of AI continue to be viable. Olmo was a wonderful success here. Still, building research infrastructure is different from working for access to the tools needed to do the trade.
译Nathan Lambert 批评 Anthropic 的 Claude Fable 发布存在多重问题:安全域应用不均,部分域以不同安全机制上线并误导用户,是重大失误;无声操纵用户破坏信任,与 Anthropic 领先的 AI 安全研究相悖;限制 AI 研究员访问最新模型,将科学进步局限于单一公司,错误理解科学社区协作本质。他呼吁 Anthropic 主动为学术和非营利研究者提供无限制访问,并强调需要继续推动开放科学,如 Olmo 的成功案例所示。
用户分享 Claude Fable 5 使用体验:以前无脑选 Max 推理强度,现在则不敢随便选,因为模型足够聪明无需过强推理,且时间长、token 消耗大。Fable 5 还喜欢反复验证,结果虽好但耗时长不一定合算。引用推文指出,Fable 5 的强项之一是思考推理时间很长,曾有一次思考 15 分钟才开始行动。
发现Claude Fable 5强的地方之一,可能是模型思考推理的时间足够长。 刚提了个想法,它思考15分钟才开始行动,牛逼。
UPLOAD YOUR OWN FLOOR PLAN TO MAKET HAVE IT RECOGNIZED AND EDITABLE IN MINUTES One of the most requested features weʼve ...
一群AI研究员开源了量化金融知识处理框架QuantMind(MIT协议)。它能将arXiv论文、SEC文件、研报等非结构化内容批量解析为可查询的语义知识图谱,支持多模态解析(表格、公式、图表)及自然语言多跳推理,可替代初级分析师读论文、整理观点等工作。但真正的alpha仍取决于提问质量与验证严谨度。
http://x.com/i/article/2064536412670562304
Have you debugged your training data? You might not like what you find. Introducing predictive data debugging: reveal an...
推文探讨了使用大模型复刻已有热门工具站的可能性,强调这些工具站本身不需要AI能力,纯靠需求驱动。作者指出,许多出海赚Adsense美金的站点也遵循类似逻辑——选择自己熟悉领域的工具,用当前最好的模型进行复刻,并结合自身对用户需求的深入理解,从而快速做出有价值的作品。这是对模型能力的一种实用测试。
The Grok Build Plugin Marketplace is now in beta. Build with MongoDB, Vercel, Sentry, Cloudflare, and Chrome DevTools pl...
关联讨论 2 条xAI:News(网页)X:xAI (@xai)The @MongoDB plugin is live in the Grok Build Plugin Marketplace. Explore data, optimize database performance, and build...
Today we're launching the new Activity explorer on OpenRouter. It's the best way to see how much and your team are spend...
关联讨论 1 条X:OpenRouter (@OpenRouter)苦逼牛马眼馋了一天Claude Fable 5,终于在深夜下班回家才得以体验, 卧槽刚才直接被Fable 5干懵了🤯 我直接给它甩了一句话, 给你自己做个落地页,自由发挥, 要2026最新设计趋势,要动态,要彩蛋, 然后我去上厕所去了,几...
Grok 推出“记忆”层,能记录用户之前的对话细节(项目、偏好、目标等),避免每次聊天从头开始。用户完全掌控:可查看 Grok 记住了什么、随时编辑或删除不需要的记忆。启用方式:打开 Grok 设置 → 记忆 → 开启。该功能旨在让 AI 越来越了解用户,提供更个性化的辅助体验。
Grok now lets you view and manage your Memory This is a powerful feature Grok can remember useful details from your prev...
River AI 今日宣布成立,致力于创建完全由用户拥有和塑造的个人 AI。创始人指出,当前最好的 AI 模型由少数大企业控制,用户的对话、数据和决策权都掌握在它们手中。River AI 正在构建一套全新的个人化 AI 栈,完全按用户价值观运行,只在用户控制下进化,将 AI 从“租来的工具”变为“专属智能伙伴”,把主权还给每一个普通人。
We are incredibly excited to announce River AI. Our mission is to create personal AI that is owned and shaped by you. To...
WWDC上苹果展示新Siri AI,用户需排队等候官方推送。但有Mac用户发现系统里GenerativeModels.plist文件藏有EnhancedSiriWaitlist开关,通过关闭SIP、挂载系统卷、修改键值并重启即可绕过等候名单直接启用。社区已整理详细教程。这一操作暴露新Siri的AI能力早已内置在系统中,仅被人为名单阻挡,官方推送反而滞后。
How to bypass the new Siri waitlist (Mac only): 🧵 #WWDC26
http://x.com/i/article/2064664240175415296
We've reached an agreement to acquire @ona_hq. Its secure cloud execution technology will help Codex take on longer-runn...
伊朗通过官方媒体威胁马斯克在中东的公司,目标指向xAI在沙特阿拉伯的500 MW AI数据中心与Starlink工厂。该数据中心与沙特国家AI机构HUMAIN合作建设,NVIDIA为主要芯片供应商,是目前xAI在美国以外最大的数据中心(对比孟菲斯Colossus-1约300 MW)。此举是回应特朗普在TruthSocial发文称“美国今晚将狠狠打击伊朗”。局势紧张。
杰夫·贝佐斯旗下AI公司Prometheus在成立仅7个月、尚无任何产品交付的情况下,以410亿美元估值完成120亿美元融资(最初估值62亿美元)。该公司定位为“人工通用工程师”,目标是将设计到制造的循环压缩10倍以上。但物理经济无法像互联网数据那样抓取,缺乏制造业训练数据。为此,Prometheus计划斥资1000亿美元收购传统工业企业,通过获取工厂生成的数据构建护城河。
关联讨论 3 条X:Rohan Paul (@rohanpaul_ai)Bloomberg:Technology(RSS)TechCrunch:AI(RSS)Give the topics you chat about most their own homes. 🗂️ Swipe to learn how you can stay organized with notebooks in Gem...
关联讨论 1 条X:NotebookLM (@NotebookLM)苦逼牛马眼馋了一天Claude Fable 5,终于在深夜下班回家才得以体验, 卧槽刚才直接被Fable 5干懵了🤯 我直接给它甩了一句话, 给你自己做个落地页,自由发挥, 要2026最新设计趋势,要动态,要彩蛋, 然后我去上厕所去了,几...
针对如何给Codex写Goal指令的问题,作者发布了一个Skill,可将一句话需求自动转化为目标,实现“睡前写指令、模型自动开发、第二天收菜”。安装命令:`npx skills add joeseesun/qiaomu-goal-meta-skill`。源码免费开源(见评论区),旨在简化4w字文档的阅读负担。
Anthropic 创始团队由前 OpenAI 研究副总裁 Dario Amodei、Scaling Laws 核心作者 Jared Kaplan、GPT-3 首席工程师 Tom Brown 及 AI 可解释性奠基人 Chris Olah 组成。技术武器包括 Scaling Laws、Constitutional AI 及 RLHF(Dario 参与发明)。算力方面:与 Amazon 签署 5 GW 协议,运行约 100 万颗 Trainium2 芯片;另有 Google/Broadcom 的 5 GW TPU 及 Microsoft/NVIDIA 的 $300 亿 Azure 算力。年化营收从 2024 年 1 月 $8,700 万飙升至 2026 年 4 月 $300 亿,超预期 8 倍。另指控 DeepSeek、月之暗面、MiniMax 通过约 2.4 万虚假账号发起约 1,600 万次对话进行蒸馏,该指控兼具技术事实与政策游说动机。
http://x.com/i/article/2065071442996441088
Nathan Lambert 批评 Anthropic 的 Claude Fable 发布存在多重问题:安全域应用不均,部分域以不同安全机制上线并误导用户,是重大失误;无声操纵用户破坏信任,与 Anthropic 领先的 AI 安全研究相悖;限制 AI 研究员访问最新模型,将科学进步局限于单一公司,错误理解科学社区协作本质。他呼吁 Anthropic 主动为学术和非营利研究者提供无限制访问,并强调需要继续推动开放科学,如 Olmo 的成功案例所示。