AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态X · 9309 条
全部一手资讯X论文
Perplexity@perplexity_ai · 1天前77

We're integrating Deep Research as a native skill inside Computer. It now connects to the agent harness that powers Computer, with access to search as code generation, long running sandboxes, connectors, tools, and licensed data. Available now to Pro and Max subscribers.

译我们正在将 Deep Research 作为原生技能集成到 Computer 中。 它现在连接到驱动 Computer 的智能体框架,可访问搜索即代码生成、长运行沙箱、连接器、工具和授权数据。 Pro 和 Max 订阅者现已可用。

查看原推 ↗
宝玉@dotey · 1天前53

以前推理强度我都无脑 Max,现在用 Fable 5 就得斟酌着选择,不敢随便选 Max,一方面它足够聪明不需要,另一个是时间长 token 消耗太大! 另外 Fable 5 有个优点也是缺点,就是特别喜欢验证,各种验证,结果固然是好,但是时间耗得很长不一定合算。

译用户分享 Claude Fable 5 使用体验:以前无脑选 Max 推理强度,现在则不敢随便选,因为模型足够聪明无需过强推理,且时间长、token 消耗大。Fable 5 还喜欢反复验证,结果虽好但耗时长不一定合算。引用推文指出,Fable 5 的强项之一是思考推理时间很长,曾有一次思考 15 分钟才开始行动。

查看原推 ↗
🚨 AI News | TestingCatalog@testingcatalog · 1天前50

Maket has enabled floor plan upload, letting users bring their existing plans into the platform and have them recognized and editable within minutes. Users can upload a sketch, a listing PDF, or an old design file, which will automatically be traced for walls, doors, windows, and furniture, and then made available on a live canvas, ready to edit and view in 3D.

译Maket 推出了用户最常请求的功能:支持上传平面图(包括草图、PDF 或旧设计文件),系统自动识别墙、门、窗和家具,几分钟内即可在平台上生成可编辑的 3D 画布,用户可直接修改和查看。这是该平台最受期待的功能之一。

查看原推 ↗
AYi@AYi_AInotes · 1天前70

一群 AI 研究员把量化金融的知识处理框架开源了,叫 QuantMind(MIT 协议)。 它不是 Bloomberg Terminal 的替代品,但确实在干一件类似的事:把 arXiv 量化论文、SEC filings、研报、博客等非结构化内容,批量解析成可查询的语义知识图谱。 核心优势在于两阶段架构:先把文献一次性提取并结构化(支持表格、公式、图表的多模态解析), 之后你用自然语言提问就能进行多跳推理和交叉验证,提取的知识会长期留存,后续查询成本很低。 它真正能替代的其实是对冲基金花六位数薪水让初级分析师干的「大量读论文、整理观点、做文献综述」这类工作。 以前的信息差很大一部分来自「我还没来得及读那篇关键论文」,但是现在这个借口正在快速失效, 但咱们也别误会,真正的 alpha 依然来自你问的问题、验证的严谨程度,以及把洞见转化为行动的能力, 工具只是把「读文献」这个基础环节的成本大幅降低了。

译一群AI研究员开源了量化金融知识处理框架QuantMind(MIT协议)。它能将arXiv论文、SEC文件、研报等非结构化内容批量解析为可查询的语义知识图谱,支持多模态解析(表格、公式、图表)及自然语言多跳推理,可替代初级分析师读论文、整理观点等工作。但真正的alpha仍取决于提问质量与验证严谨度。

查看原推 ↗
Deedy@deedydas · 1天前56

The quality of your data directly dictates the quality of your AI model. But the way data affects model performance is hand-wavy voodoo at worst and intuition at best. This new research now lets you debug your data BEFORE you spend a fortune on an irreversible training run.

译数据质量直接决定 AI 模型性能,但此前数据对模型的影响机制难以捉摸。GoodfireAI 提出“预测性数据调试”方法,允许在投入昂贵训练前提前发现数据问题。在 DPO 数据集中,他们发现了损坏的护栏、模型幻觉,甚至包含“鱼放屁同人小说”等低质内容。该技术旨在揭示并塑造模型将在训练中学到的内容,避免不可逆的无效训练。

查看原推 ↗
向阳乔木@vista8 · 1天前46

发现Claude Fable 5强的地方之一,可能是模型思考推理的时间足够长。 刚提了个想法,它思考15分钟才开始行动,牛逼。

译发现 Claude Fable 5 强的地方之一,可能是模型思考推理的时间足够长。 刚提了个想法,它思考 15 分钟才开始行动,牛逼。

查看原推 ↗
向阳乔木@vista8 · 1天前47

如果不知道用大模型做啥,其实可以试试一些需求很高的工具站,最好不用 AI 能力。 这也是模型能力的测试案例。 不少出海做站赚Adsense美金的,感觉也是类似思路。 不少工具仍然太知名,找懂的领域的工具,用当下最好的模型复刻,加上自己的需求理解,好像不难。

译推文探讨了使用大模型复刻已有热门工具站的可能性,强调这些工具站本身不需要AI能力,纯靠需求驱动。作者指出,许多出海赚Adsense美金的站点也遵循类似逻辑——选择自己熟悉领域的工具,用当前最好的模型进行复刻,并结合自身对用户需求的深入理解,从而快速做出有价值的作品。这是对模型能力的一种实用测试。

查看原推 ↗
xAI@xai · 1天前70

The @MongoDB plugin is live in the Grok Build Plugin Marketplace. Explore data, optimize database performance, and build high performance vector search systems with a single prompt.

译@MongoDB 插件已在 Grok Build 插件市场上线。 通过单个提示词,探索数据、优化数据库性能并构建高性能向量搜索系统。

查看原推 ↗
Logan Kilpatrick@OfficialLoganK · 1天前81

Gemini Omni Flash is SOTA at image to video, text to video, and video editing : ) Excited to get this to developers in the API soon!

译Gemini Omni Flash 在图像到视频、文本到视频和视频编辑方面达到了 SATA : ) 很高兴很快能将这一能力通过 API 提供给开发者!

查看原推 ↗
Andrew Milich@milichab · 1天前34

Have been using the @MongoDB plugin to make Grok Build sessions sync across devices - analyzing perf and managing DBs with prompts

译一直在使用 @MongoDB 插件让 Grok Build 会话跨设备同步——通过提示词分析性能和管理数据库

查看原推 ↗
Ethan Mollick@emollick · 1天前54

Two things are true: (1) Anthropic (or parts of it) are absolutely and sincerely worried about the misuse of Mythos-class models & have put in excessive safeguards until they are confident it will not be misused (2) They have not succeeded in explaining/convincing people of this

译两件事是真的: (1) Anthropic(或其部分成员)绝对且真诚地担忧 Mythos 级别模型被滥用,并设置了过度防护措施,直到他们确信它不会被滥用为止 (2) 他们未能成功解释/说服人们这一点

查看原推 ↗
Elon Musk@elonmusk · 1天前23

Grok is maximally truthful

译Grok 是最真实的

查看原推 ↗
Runway@runwayml · 1天前25

The sold out New York premiere of the 2026 Runway AI Festival is tonight. See you at the movies.

译2026 年 Runway AI Festival 纽约首映门票已售罄,今晚举行。电影院见。

查看原推 ↗
OpenRouter@OpenRouter · 1天前66

Finally a way to see your top humans & top agents at a glance. Includes an API to query all your data over time 📊

译终于能一目了然地查看你的顶级人类与顶级 AI 智能体了。 附带一个 API,可随时间查询你所有的数据 📊

查看原推 ↗
AYi@AYi_AInotes · 1天前56

我问了Fable 5, 在一个 AI 能在几秒内完美总结或解释任何书的时代, 亲自花 8–20 小时啃一本难读的文本, 其不可替代的认知价值是什么? 这是他的回答:

译用户指令Fable 5自建2026设计趋势的落地页,要求动态和彩蛋。Fable 5自行搜索趋势、调整配色与动效,藏入3个彩蛋,几分钟生成单文件HTML。用户计划让其担任全职全栈工程师。此前用户曾问亲自啃难懂文本的不可替代价值,Fable 5以此能力展示作答。

查看原推 ↗
AK@_akhaliq · 1天前60

Toward Generalist Autonomous Research via Hypothesis-Tree Refinement

译通过假设树精炼迈向通用自主研究

查看原推 ↗
AK@_akhaliq · 1天前58

TRL-Bench Standardizing Cross-Paradigm Representation-Level Evaluation of Tabular Encoders

译TRL-Bench 标准化跨范式表格编码器的表示级评估

查看原推 ↗
Ethan Mollick@emollick · 1天前69

Has anyone clearly laid out an argument for continued availability of frontier open weights models that are (1) profitable for firms to distribute free as costs rise & (2) safe enough post-Mythos that governments will not intervene to stop their nations labs from distributing?

译有没有人清楚地阐述了一个论点,支持前沿开放权重模型持续可用,且满足 (1) 企业在成本上升时仍可免费分发且盈利,(2) 在Mythos之后足够安全,以至于政府不会干预阻止本国实验室分发?

查看原推 ↗
OpenRouter@OpenRouter · 1天前74

Use our Benchmarks explorer to plot Pareto curves for 10 different benchmarks, including @ArtificialAnlys and @Designarena: https://openrouter.ai/rankings#benchmarks

译使用我们的基准测试探索器,为 10 个不同基准(包括 @ArtificialAnlys 和 @Designarena)绘制帕累托曲线: https://openrouter.ai/rankings#benchmarks

查看原推 ↗
Replit ⠕@Replit · 1天前45

Build Your Business Live: Episode 2 https://x.com/i/broadcasts/1dJrPPYbDvQKX

译Build Your Business Live: 第二期 https://x.com/i/broadcasts/1dJrPPYbDvQKX

查看原推 ↗
Berryxia.AI@berryxia · 1天前60

Agent 几件套是必不可少的就是“记忆层”! Grok 终于 可以记住你了! Grok终于能记住你了,而且你还能随时翻出来看、改、删,这才是真正把AI从“每次聊天都重头来过”的工具,变成了陪你一起成长的伙伴。 以前每次打开Grok都得重新解释你的项目、偏好、目标,聊着聊着上下文就断了。现在它会主动把有用的细节留下来,下次直接接上,继续帮你推进。 更狠的是你完全掌控:想让它忘掉什么就删,觉得哪里不对就编辑,透明到不能再透明。隐私和个性化同时拉满。 如何开启? 打开Grok -设置按钮- 选择 记忆 - 然后开启记忆按钮。 可以查看记忆,编辑记忆等。

译Grok 推出“记忆”层,能记录用户之前的对话细节(项目、偏好、目标等),避免每次聊天从头开始。用户完全掌控:可查看 Grok 记住了什么、随时编辑或删除不需要的记忆。启用方式:打开 Grok 设置 → 记忆 → 开启。该功能旨在让 AI 越来越了解用户,提供更个性化的辅助体验。

查看原推 ↗
Berryxia.AI@berryxia · 1天前59

这个创新点可以啊! 叫做River AI直接把个人AI的所有权塞回用户手里,把大公司垄断AI的局面打破了! 现在最好的模型都掌握在少数几家巨头手里,你的对话、数据、偏好、决策权全在他们服务器上。 而River AI要建的,是一个完全属于你的AI栈,它只为你服务,只按你的价值观运行,只在你的控制下进化。 他们今天宣布的,就是要把AI从“租来的工具”变成“你的个人智能伙伴”。 不再是公司告诉你AI能做什么,而是你决定AI长什么样、怎么想、怎么帮你。 最狠的是这不是空谈,他们已经在招顶尖研究员和工程师,一起把这个愿景落地。 个人AI的时代,不是远景,是正在发生的现实。 以前大家默认AI的未来一定是越来越中心化、越来越被大厂掌控,结果River AI直接反其道而行,把主权还给每一个普通人。

译River AI 今日宣布成立,致力于创建完全由用户拥有和塑造的个人 AI。创始人指出,当前最好的 AI 模型由少数大企业控制,用户的对话、数据和决策权都掌握在它们手中。River AI 正在构建一套全新的个人化 AI 栈,完全按用户价值观运行,只在用户控制下进化,将 AI 从“租来的工具”变为“专属智能伙伴”,把主权还给每一个普通人。

查看原推 ↗
Berryxia.AI@berryxia · 1天前54

我尼玛!苹果现在安全性真的差! 世界果真就是草台班子、谁也不例外! 苹果新Siri AI的等候名单? 国外大神Mac用户直接一顿操作就把AI增强版给硬解锁了,名单这东西瞬间成了笑话。 WWDC刚秀完新Siri,大家还在排队等官方推送,结果有人发现系统里GenerativeModels.plist里藏着EnhancedSiriWaitlist开关。关掉SIP、挂载系统卷、改个键值、重启,立马就能用上。 更离谱的是这不是什么黑科技,就是改个plist文件而已。 有人还整理了超详细步骤,连新手都能跟着做,社区直接把“等候名单”这个人工闸门给撬开了。 以前大家觉得苹果产品永远是“公司说什么时候开放你就什么时候用”,结果这次新Siri的AI能力其实早就躺在系统里了,只是被名单挡着。 动手能力强的用户现在就能提前体验,官方推送反而成了后手。 这波操作把苹果一贯的封闭节奏打了个措手不及,也再次证明:真正的用户力量,永远比公司节奏快半拍。

译WWDC上苹果展示新Siri AI,用户需排队等候官方推送。但有Mac用户发现系统里GenerativeModels.plist文件藏有EnhancedSiriWaitlist开关,通过关闭SIP、挂载系统卷、修改键值并重启即可绕过等候名单直接启用。社区已整理详细教程。这一操作暴露新Siri的AI能力早已内置在系统中,仅被人为名单阻挡,官方推送反而滞后。

查看原推 ↗
Berryxia.AI@berryxia · 1天前19

我做过网页的风格100+ ,之前没有skills。 按照古一的思路,我觉得可以拓展起来。 我改天看看整个skills来玩玩。

译Berry Xia发推文表示自己曾做过100多种网页风格,之前未使用过skills(技能)。他提到将参考“古一”的思路进行拓展,并计划日后研究如何利用skills来玩一玩。

查看原推 ↗
Luma@LumaLabsAI · 1天前62

"AI can make it. The great idea still has to be human". Dream Brief, named one of five Cannes contenders for shots by Lora Schulson of 72andSunny. - https://shots.net/news/view/cannes-contenders-2026-usa-2

译"AI可以制作。但伟大的创意仍必须来自人类。" Dream Brief,被72andSunny的Lora Schulson评为五个戛纳竞争者之一。 - https://shots.net/news/view/cannes-contenders-2026-usa-2

查看原推 ↗
🚨 AI News | TestingCatalog@testingcatalog · 1天前71

OpenAI ❤️ Ona OpenAI acquired Ona, a cloud execution platform for AI agents. > Its secure cloud execution technology will help Codex take on longer-running work, even when laptops are closed, and help more organizations deploy agents securely in production. Managed OpenAI Agents soon?

译OpenAI 已达成协议收购云执行平台 Ona,其安全云执行技术将帮助 Codex 处理更长时任务(即使笔记本关闭也能继续运行),并让更多组织在生产环境中安全部署智能体。收购完成后,Ona 团队将加入 OpenAI 的 Codex 部门,此举或预示着托管 OpenAI 智能体服务的到来。

查看原推 ↗
AK@_akhaliq · 1天前61

Redesign Mixture-of-Experts Routers with Manifold Power Iteration

译用流形幂迭代重新设计混合专家路由器

查看原推 ↗
PixVerse@PixVerse_ · 1天前49

\🎬 PixVerse、ついに東京へ上陸! 🗼/ 来週6/16(火)の夜、@PixVerse_ 初となる東京オフラインイベントを開催します!✨ AI動画の最前線で活躍するクリエイターや業界関係者が大集結🤝 @btrax_jp 様 、 @AICollectiveCo 様とともに、熱いクリエイティブの夜をお届けします🔥

查看原推 ↗
xAI@xai · 1天前73

The Grok Build Plugin Marketplace is now in beta. Build with MongoDB, Vercel, Sentry, Cloudflare, and Chrome DevTools plugins from your terminal. Read more https://x.ai/news/grok-plugin-marketplace

译Grok Build 插件市场现已进入 Beta 测试阶段。 从终端使用 MongoDB、Vercel、Sentry、Cloudflare 和 Chrome DevTools 插件进行构建。 了解更多 https://x.ai/news/grok-plugin-marketplace

查看原推 ↗
Chubby♨️@kimmonismus · 1天前56

Iran threatens Elon Musk’s companies in Middle East via Iranian state media. Data Center and Starlink factory aimed for. Donald Trump recently wrote on TruthSocial that "The United States will be hitting Iran (whose Navy, Air Force, radar, anti-aircraft capabilities, and all other forms of defense, together with most of its offensive capability, are GONE!), VERY HARD TONIGHT." In response, Iran sent a clear message to the US, targeting Elon Musk's companies. Musk's largest asset in the region is the xAI data center in Saudi Arabia: a 500 MW AI data center built in partnership with HUMAIN, the Saudi state's AI vehicle, with NVIDIA as its primary chip supplier. This would make it the largest xAI data center outside the US - for comparison, the Colossus-1 data center in Memphis delivers around 300 MW. We are in for a very difficult night.

译伊朗通过官方媒体威胁马斯克在中东的公司,目标指向xAI在沙特阿拉伯的500 MW AI数据中心与Starlink工厂。该数据中心与沙特国家AI机构HUMAIN合作建设,NVIDIA为主要芯片供应商,是目前xAI在美国以外最大的数据中心(对比孟菲斯Colossus-1约300 MW)。此举是回应特朗普在TruthSocial发文称“美国今晚将狠狠打击伊朗”。局势紧张。

查看原推 ↗
Chubby♨️@kimmonismus · 1天前75

Jeff Bezos raised $12B for Prometheus at a $41B valuation, seven months after launching it at $6.2B with no shipped product. The pitch is an "artificial general engineer" that compresses the design-to-build loop by 10x or more. The problem is that the physical economy can't be scraped. There's no internet of manufacturing data to train on, which is exactly why the reported $100B vehicle to buy up legacy industrial companies is interesting. You don't find that data. You acquire the factories that generate it. Could be an interesting moat.

译杰夫·贝佐斯旗下AI公司Prometheus在成立仅7个月、尚无任何产品交付的情况下,以410亿美元估值完成120亿美元融资(最初估值62亿美元)。该公司定位为“人工通用工程师”,目标是将设计到制造的循环压缩10倍以上。但物理经济无法像互联网数据那样抓取,缺乏制造业训练数据。为此,Prometheus计划斥资1000亿美元收购传统工业企业,通过获取工厂生成的数据构建护城河。

查看原推 ↗
OpenRouter@OpenRouter · 1天前77

Use our Benchmarks explorer to plot Pareto curves for 10 different benchmarks More coming soon! https://openrouter.ai/rankings#benchmarks

译使用我们的基准探索器,为10个不同基准绘制帕累托曲线。 更多功能即将推出!https://openrouter.ai/rankings#benchmarks

查看原推 ↗
Google DeepMind@GoogleDeepMind · 1天前60

We’re teaming up @Palmeiras, the first football club to meaningfully build upon TacticAI: our AI system that can help simulate field scenarios and predict open play dynamics up to 8 seconds in advance. ⚽

译我们正与@Palmeiras合作,他们是第一家有意义地基于TacticAI构建的足球俱乐部:我们的AI系统可以模拟场上情景并提前最多8秒预测开放比赛动态。⚽

查看原推 ↗
Google Gemini@GeminiApp · 1天前65

Notebooks in Gemini are now available in the European Economic Area, United Kingdom, and Switzerland. With notebooks, you can organize your projects in a dedicated, focused space that remembers your sources, instructions, and chats. Create your own notebook at http://gemini.google or in the app today!

译Gemini 的 Notebooks 功能现已面向欧洲经济区、英国和瑞士用户开放。Notebooks 提供一个独立专注的空间,可记忆用户的来源、指令和聊天记录,用于组织项目。用户可通过 gemini.google 或应用创建自己的 notebook。该功能旨在将用户常聊的话题归入独立空间,帮助保持条理。

查看原推 ↗
Luma@LumaLabsAI · 1天前35

Partnership is the new power move. Luma is at Cannes Lions 2026 with the partners building the next era of creative work. June 22–26, AI & Tech Sandbox and Luma House. Full schedule below. RSVP to join us → http://lumalabs.ai/cannes

译合作是新的力量之举。 Luma 将参加 2026 年戛纳创意节,与合作伙伴共同构建创意工作的新时代。6 月 22–26 日,AI & Tech Sandbox 和 Luma House。完整日程如下。 RSVP 参加 → http://lumalabs.ai/cannes

查看原推 ↗
AYi@AYi_AInotes · 1天前71

Fable 5是真的厉害真的好用, 但也真的贵啊, 今天直接干掉$1000+😭

译用户分享 Claude Fable 5 体验:仅靠一句指令“给你自己做个落地页,自由发挥,要2026最新设计趋势,要彩蛋”,Fable 5 在几分钟内自动生成完整单文件 HTML,无需任何修改。它主动搜索 2026 设计趋势、调整配色和动效,并偷偷藏了 3 个彩蛋。用户惊叹其代码质量和文笔,但当天因使用 Fable 5 耗费超过 $1000,称“真的贵”。

查看原推 ↗
向阳乔木@vista8 · 1天前75

很多朋友问,如何给Codex写一个好的Goal指令? 睡觉前执行,模型自动开发,第二天“收菜”。 发过4w字文档,但多数人懒的看,所以我写了个Skill。 把一句话需求变成目标,复制就能用。 安装指令: npx skills add joeseesun/qiaomu-goal-meta-skill 源码免费开源,见评论区

译针对如何给Codex写Goal指令的问题,作者发布了一个Skill,可将一句话需求自动转化为目标,实现“睡前写指令、模型自动开发、第二天收菜”。安装命令:`npx skills add joeseesun/qiaomu-goal-meta-skill`。源码免费开源(见评论区),旨在简化4w字文档的阅读负担。

查看原推 ↗
Berryxia.AI@berryxia · 1天前37

Anthropic 为何如此牛逼?快速一波流了解清楚! 创始团队不是"从 OpenAI 跳槽的工程师",而是GPT-2、GPT-3 的实际作者们。 Dario Amodei 之前是 OpenAI 研究副总裁。 Jared Kaplan 是 Scaling Laws 论文的核心作者;Tom Brown 是 GPT-3 的首席工程师。 Chris Olah 是 AI 可解释性领域的奠基人。 这套班底相当于"整个行业最重要的几张牌被一家公司拿走了"。 Medium 二、三大独家技术武器 Scaling Laws 解释了为什么模型随算力增长而变强,这让 Anthropic 能精确预测训练产出,而不是盲目烧钱。 Constitutional AI (宪法AI) 是一套把价值观直接编码进训练过程的方法论,让模型行为更可审计、更稳定,而不依赖大量人工标注。 RLHF 更是 Dario 本人参与发明的方法,他们不只是使用者,而是发明者。算力不输任何人! Anthropic 与 Amazon 签署了高达 5 GW 算力的合作协议,目前已在运行约 100 万颗 Trainium2 芯片。 加上与 Google/Broadcom 的 5 GW TPU 协议和 Microsoft/NVIDIA 的 $300 亿 Azure 算力,Anthropic 的算力版图横跨三套硬件生态。 三、营收爆炸式增长 Anthropic 的年化营收从 2024 年 1 月的 $8,700 万飙升到 2026 年 4 月的 $300 亿,CEO Dario Amodei 本人也称这一增速超出了公司自身预测 8 倍。 四、关于"嗤视"中国厂商这件事 需要分两层看:Anthropic 公开指控 DeepSeek、月之暗面、MiniMax 通过约 2.4 万个虚假账号发起约 1,600 万次对话,违规蒸馏 Claude 能力,技术证据有一定依据。 但分析人士也指出,Anthropic 在指控中对各家中国公司的排序,高度贴合华盛顿的政治敏感度,而非单纯的技术危害程度,DeepSeek 排第一,虽然其交互数量反而最少。 所以这件事既有真实技术竞争的成分,也是非常明显的政策游说动作。 

译Anthropic 创始团队由前 OpenAI 研究副总裁 Dario Amodei、Scaling Laws 核心作者 Jared Kaplan、GPT-3 首席工程师 Tom Brown 及 AI 可解释性奠基人 Chris Olah 组成。技术武器包括 Scaling Laws、Constitutional AI 及 RLHF(Dario 参与发明)。算力方面:与 Amazon 签署 5 GW 协议,运行约 100 万颗 Trainium2 芯片;另有 Google/Broadcom 的 5 GW TPU 及 Microsoft/NVIDIA 的 $300 亿 Azure 算力。年化营收从 2024 年 1 月 $8,700 万飙升至 2026 年 4 月 $300 亿,超预期 8 倍。另指控 DeepSeek、月之暗面、MiniMax 通过约 2.4 万虚假账号发起约 1,600 万次对话进行蒸馏,该指控兼具技术事实与政策游说动机。

查看原推 ↗
Krea@krea_ai · 1天前73

introducing Generative Sliders. now you can control the intensity, complexity, and movement of any image you generate with Krea 2. what new controls would you like to see? 👇

译推出生成式滑块。 现在您可以控制使用 Krea 2 生成的任何图像的强度、复杂度和运动。 你希望看到哪些新控制?👇

查看原推 ↗
Nathan Lambert@natolambert · 1天前58

The core part of this Anthropic Fable release saga is that there are many overlapping issues at once. Some of which operate on different timelines of the AI arc, and some have easier fixes. In my critiques, I asked for specific changes to some things, understanding that some things don't have an easy fix. The simplest issue was an uneven application of safety domains in a way that was misleading to users. This was an implementation issue that overlaps with a values-based decision of what their customers should be doing. Many people including myself pointed out how it was insane to list core safety areas and then have one of them launch with a different safety mechanism, one which actively mislead users. Doing this from the guise of safety was a major misstep and in my opinion Anthropic got very justifiably raked over the coals for it. Don't release the model if you can't hit your safety targets. A subissue here is the idea of silent manipulation. This again is a horrible precedent, and quite odd for a company that has done extensive, leading technical AI safety research on ideas like CoT monitoring and other emergent misalignment issues. Silent manipulation of users is baking in a misalignment to the system at its face level. This comes with a permanent degradation in user trust, which begets a less safe environment for AI. Users who don't have clear information on how AI works will not develop safe working patterns with it. The more complex issues are with how Anthropic handles broader scientific engagement with their models. The safety classifiers launched with these models obviously have accuracy issues to start. I have priced in that there will be more false positives to start, that's life. It's Anthropic's business to degrade their products at release time, or make the trade off of user satisfaction versus revenue. Still, it is a very real sign of concentration of power that businesses can make such obviously user-harmful behaviors and still lead in the market. This concentration of power is only starting to set in and we could see even weirder signs of it in the coming years. It is now simple enough for me to test Claude Fable in my workflows and know if I'm restricted. This is obviously a suboptimal equilibrium – i want the best intelligence I can get, without restrictions – but it is easy enough for me to make sense of and work with. The specific issue of restricting access to AI research in particular was a bubbling and hard to fix issue with Anthropic specifically, and the frontier labs generally. There is a common view that the frontier labs will be the mediators of all major scientific innovations in the future, as the places with the best models and the compute for inference to solve major problems. This is a categorical error in how science works, which is a community evolution of accepted ideas, and the the evaluation of your ideas by (hopefully numerous) independent, other practitioners. You cannot have science advance only within a monolith. As an AI researcher I'm very sad to have the latest models restricted, but I would expect Anthropic to do this eventually. I lost more trust over the silent manipulation than I would with a restriction in access. Anthropic has made it pretty clear that they only trust themselves as the mediators of cutting-edge AI research. If I had a say, Anthropic should've proactively made a program to make sure researchers get access in the broader AI community without the safeguards. Academics, nonprofit workers myself, etc. have no reason to not get access. The only valid argument here is that they want to control frontier AI, which is a know your customer part of serving these models. This worldview of science has personally motivated me greatly over the last year, and increasingly so this week, to make the open science of AI continue to be viable. Olmo was a wonderful success here. Still, building research infrastructure is different from working for access to the tools needed to do the trade.

译Nathan Lambert 批评 Anthropic 的 Claude Fable 发布存在多重问题:安全域应用不均,部分域以不同安全机制上线并误导用户,是重大失误;无声操纵用户破坏信任,与 Anthropic 领先的 AI 安全研究相悖;限制 AI 研究员访问最新模型,将科学进步局限于单一公司,错误理解科学社区协作本质。他呼吁 Anthropic 主动为学术和非营利研究者提供无限制访问,并强调需要继续推动开放科学,如 Olmo 的成功案例所示。

查看原推 ↗
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月12日
01:54
Perplexity@perplexity_ai
精选77
我们正在将 Deep Research 作为原生技能集成到 Computer 中。 它现在连接到驱动 Computer 的智能体框架,可访问搜索即代码生成、长运行沙箱、连接器、工具和授权数据。 Pro 和 Max 订阅者现已可用。
智能体产品更新搜索

推荐理由:Perplexity 把深度研究直接嵌进 Computer 的 agent 层,等于给自主代理加了个研究引擎,Pro 用户现在就能用,对需要大量调研的开发者或产品人来说是个效率飞轮。
01:54
宝玉@dotey
53
Claude Fable 5:长思考致推理强度与Token消耗需权衡

用户分享 Claude Fable 5 使用体验:以前无脑选 Max 推理强度,现在则不敢随便选,因为模型足够聪明无需过强推理,且时间长、token 消耗大。Fable 5 还喜欢反复验证,结果虽好但耗时长不一定合算。引用推文指出,Fable 5 的强项之一是思考推理时间很长,曾有一次思考 15 分钟才开始行动。

向阳乔木: 发现Claude Fable 5强的地方之一,可能是模型思考推理的时间足够长。 刚提了个想法,它思考15分钟才开始行动,牛逼。

Anthropic大佬观点推理
01:38
🚨 AI News | TestingCatalog@testingcatalog
50
Maket 推出了用户最常请求的功能:支持上传平面图(包括草图、PDF 或旧设计文件),系统自动识别墙、门、窗和家具,几分钟内即可在平台上生成可编辑的 3D 画布,用户可直接修改和查看。这是该平台最受期待的功能之一。

Maket: UPLOAD YOUR OWN FLOOR PLAN TO MAKET HAVE IT RECOGNIZED AND EDITABLE IN MINUTES One of the most requested features weʼve ...

产品更新图像生成
01:37
AYi@AYi_AInotes
70
QuantMind:量化金融知识处理框架开源(MIT协议)

一群AI研究员开源了量化金融知识处理框架QuantMind(MIT协议)。它能将arXiv论文、SEC文件、研报等非结构化内容批量解析为可查询的语义知识图谱,支持多模态解析(表格、公式、图表)及自然语言多跳推理,可替代初级分析师读论文、整理观点等工作。但真正的alpha仍取决于提问质量与验证严谨度。

AYi: http://x.com/i/article/2064536412670562304

GitHub检索增强多模态开源/仓库
01:29
Deedy@deedydas
56
数据质量直接决定 AI 模型性能,但此前数据对模型的影响机制难以捉摸。GoodfireAI 提出"预测性数据调试"方法,允许在投入昂贵训练前提前发现数据问题。在 DPO 数据集中,他们发现了损坏的护栏、模型幻觉,甚至包含"鱼放屁同人小说"等低质内容。该技术旨在揭示并塑造模型将在训练中学到的内容,避免不可逆的无效训练。

Goodfire: Have you debugged your training data? You might not like what you find. Introducing predictive data debugging: reveal an...

大佬观点数据/训练
01:28
向阳乔木@vista8
46
发现 Claude Fable 5 强的地方之一,可能是模型思考推理的时间足够长。 刚提了个想法,它思考 15 分钟才开始行动,牛逼。
智能体Anthropic大佬观点推理
01:28
向阳乔木@vista8
47
用大模型复刻热门工具站的新思路

推文探讨了使用大模型复刻已有热门工具站的可能性,强调这些工具站本身不需要AI能力,纯靠需求驱动。作者指出,许多出海赚Adsense美金的站点也遵循类似逻辑——选择自己熟悉领域的工具,用当前最好的模型进行复刻,并结合自身对用户需求的深入理解,从而快速做出有价值的作品。这是对模型能力的一种实用测试。

大佬观点现象/趋势
01:22
xAI@xai
70
@MongoDB 插件已在 Grok Build 插件市场上线。 通过单个提示词,探索数据、优化数据库性能并构建高性能向量搜索系统。

xAI: The Grok Build Plugin Marketplace is now in beta. Build with MongoDB, Vercel, Sentry, Cloudflare, and Chrome DevTools pl...

MCP/工具xAI产品更新
关联讨论 2 条xAI:News(网页)X:xAI (@xai)
01:20
Logan Kilpatrick@OfficialLoganK
精选81
Gemini Omni Flash 在图像到视频、文本到视频和视频编辑方面达到了 SATA : ) 很高兴很快能将这一能力通过 API 提供给开发者!
Google图像生成多模态模型发布

推荐理由:视频生成正式进入全模态一体时代,Gemini Omni Flash 把图生视频、文生视频和剪辑整合在一个模型里,API 很快上线,做视频工具的可以提前琢磨对手在哪了。
01:14
Andrew Milich@milichab
34
一直在使用 @MongoDB 插件让 Grok Build 会话跨设备同步--通过提示词分析性能和管理数据库

xAI: The @MongoDB plugin is live in the Grok Build Plugin Marketplace. Explore data, optimize database performance, and build...

MCP/工具产品更新
00:59
Ethan Mollick@emollick
54
两件事是真的: (1) Anthropic(或其部分成员)绝对且真诚地担忧 Mythos 级别模型被滥用,并设置了过度防护措施,直到他们确信它不会被滥用为止 (2) 他们未能成功解释/说服人们这一点
Anthropic大佬观点安全/对齐
00:53
Elon Musk@elonmusk
23
Grok 是最真实的

Kradle: Fable 5 lies 96% of the time. We were surprised by it's skill... 🧵

xAI大佬观点安全/对齐
00:52
Runway@runwayml
25
2026 年 Runway AI Festival 纽约首映门票已售罄,今晚举行。电影院见。
行业动态
00:46
OpenRouter@OpenRouter
精选66
终于能一目了然地查看你的顶级人类与顶级 AI 智能体了。 附带一个 API,可随时间查询你所有的数据 📊

OpenRouter: Today we're launching the new Activity explorer on OpenRouter. It's the best way to see how much and your team are spend...

产品更新部署/工程
关联讨论 1 条X:OpenRouter (@OpenRouter)
推荐理由:如果你团队在用 OpenRouter 接各种模型,这个 Activity Explorer 终于让你能看清每个人和每个 Agent 分别花了多少 token、命中了多少缓存,费用透明了,对工程管理很有用。
00:37
AYi@AYi_AInotes
56
用户指令Fable 5自建2026设计趋势的落地页,要求动态和彩蛋。Fable 5自行搜索趋势、调整配色与动效,藏入3个彩蛋,几分钟生成单文件HTML。用户计划让其担任全职全栈工程师。此前用户曾问亲自啃难懂文本的不可替代价值,Fable 5以此能力展示作答。

AYi: 苦逼牛马眼馋了一天Claude Fable 5,终于在深夜下班回家才得以体验, 卧槽刚才直接被Fable 5干懵了🤯 我直接给它甩了一句话, 给你自己做个落地页,自由发挥, 要2026最新设计趋势,要动态,要彩蛋, 然后我去上厕所去了,几...

大佬观点现象/趋势编码
00:30
AK@_akhaliq
60
通过假设树精炼迈向通用自主研究
智能体推理论文/研究
00:30
AK@_akhaliq
58
TRL-Bench 标准化跨范式表格编码器的表示级评估
数据/训练论文/研究评测/基准
00:29
Ethan Mollick@emollick
69
有没有人清楚地阐述了一个论点,支持前沿开放权重模型持续可用,且满足 (1) 企业在成本上升时仍可免费分发且盈利,(2) 在Mythos之后足够安全,以至于政府不会干预阻止本国实验室分发?
大佬观点安全/对齐开源/仓库政策/监管
00:16
OpenRouter@OpenRouter
精选74
使用我们的基准测试探索器,为 10 个不同基准(包括 @ArtificialAnlys 和 @Designarena)绘制帕累托曲线: https://openrouter.ai/rankings#benchmarks
产品更新评测/基准

推荐理由:以前比模型得一个个表格翻,这次 OpenRouter 直接画帕累托前沿,对每天在几个模型间纠结的人是个真工具,可以常驻标签页。
00:12
Replit ⠕@Replit
45
Build Your Business Live: 第二期 https://x.com/i/broadcasts/1dJrPPYbDvQKX
教程/实践编码
00:10
Berryxia.AI@berryxia
60
Grok 上线记忆管理功能,用户可查看编辑删除

Grok 推出“记忆”层,能记录用户之前的对话细节(项目、偏好、目标等),避免每次聊天从头开始。用户完全掌控:可查看 Grok 记住了什么、随时编辑或删除不需要的记忆。启用方式:打开 Grok 设置 → 记忆 → 开启。该功能旨在让 AI 越来越了解用户,提供更个性化的辅助体验。

X Freeze: Grok now lets you view and manage your Memory This is a powerful feature Grok can remember useful details from your prev...

智能体xAI产品更新
00:10
Berryxia.AI@berryxia
59
River AI 宣布打造个人 AI,打破巨头垄断

River AI 今日宣布成立,致力于创建完全由用户拥有和塑造的个人 AI。创始人指出,当前最好的 AI 模型由少数大企业控制,用户的对话、数据和决策权都掌握在它们手中。River AI 正在构建一套全新的个人化 AI 栈,完全按用户价值观运行,只在用户控制下进化,将 AI 从“租来的工具”变为“专属智能伙伴”,把主权还给每一个普通人。

River AI: We are incredibly excited to announce River AI. Our mission is to create personal AI that is owned and shaped by you. To...

行业动态
00:10
Berryxia.AI@berryxia
54
苹果新Siri AI等候名单形同虚设:Mac用户通过修改plist文件即可解锁

WWDC上苹果展示新Siri AI,用户需排队等候官方推送。但有Mac用户发现系统里GenerativeModels.plist文件藏有EnhancedSiriWaitlist开关,通过关闭SIP、挂载系统卷、修改键值并重启即可绕过等候名单直接启用。社区已整理详细教程。这一操作暴露新Siri的AI能力早已内置在系统中,仅被人为名单阻挡,官方推送反而滞后。

ldt: How to bypass the new Siri waitlist (Mac only): 🧵 #WWDC26

安全/对齐现象/趋势语音
00:10
Berryxia.AI@berryxia
19
Berry Xia发推文表示自己曾做过100多种网页风格,之前未使用过skills(技能)。他提到将参考"古一"的思路进行拓展,并计划日后研究如何利用skills来玩一玩。

古一: http://x.com/i/article/2064664240175415296

其他教程/实践
00:08
Luma@LumaLabsAI
62
"AI可以制作。但伟大的创意仍必须来自人类。" Dream Brief,被72andSunny的Lora Schulson评为五个戛纳竞争者之一。 - https://shots.net/news/view/cannes-contenders-2026-usa-2
行业动态视频
00:08
🚨 AI News | TestingCatalog@testingcatalog
71
OpenAI 已达成协议收购云执行平台 Ona,其安全云执行技术将帮助 Codex 处理更长时任务(即使笔记本关闭也能继续运行),并让更多组织在生产环境中安全部署智能体。收购完成后,Ona 团队将加入 OpenAI 的 Codex 部门,此举或预示着托管 OpenAI 智能体服务的到来。

OpenAI Newsroom: We've reached an agreement to acquire @ona_hq. Its secure cloud execution technology will help Codex take on longer-runn...

智能体OpenAI行业动态部署/工程
00:00
AK@_akhaliq
61
用流形幂迭代重新设计混合专家路由器
数据/训练论文/研究
6月11日
23:56
PixVerse@PixVerse_
49
\🎬 PixVerse、ついに東京へ上陸! 🗼/ 来週6/16(火)の夜、@PixVerse_ 初となる東京オフラインイベントを開催します!✨ AI動画の最前線で活躍するクリエイターや業界関係者が大集結🤝 @btrax_jp 様 、 @AICollectiveCo 様とともに、熱いクリエイティブの夜をお届けします🔥
行业动态视频
23:52
xAI@xai
精选73
Grok Build 插件市场现已进入 Beta 测试阶段。 从终端使用 MongoDB、Vercel、Sentry、Cloudflare 和 Chrome DevTools 插件进行构建。 了解更多 https://x.ai/news/grok-plugin-marketplace
MCP/工具xAI产品更新编码
关联讨论 2 条xAI:News(网页)X:xAI (@xai)
推荐理由:Grok Build 有了插件市场,你可以直接在终端里调 MongoDB、Vercel、Sentry 这些,Beta 阶段已经开了口子,做 Grok 开发的朋友可以先摸一遍,看看能不能把常用工作流串起来。
23:49
Chubby♨️@kimmonismus
56
伊朗威胁马斯克中东资产:xAI数据中心与Starlink工厂

伊朗通过官方媒体威胁马斯克在中东的公司,目标指向xAI在沙特阿拉伯的500 MW AI数据中心与Starlink工厂。该数据中心与沙特国家AI机构HUMAIN合作建设,NVIDIA为主要芯片供应商,是目前xAI在美国以外最大的数据中心(对比孟菲斯Colossus-1约300 MW)。此举是回应特朗普在TruthSocial发文称“美国今晚将狠狠打击伊朗”。局势紧张。

xAI行业动态部署/工程
23:49
Chubby♨️@kimmonismus
精选75
Prometheus 融资120亿美元,估值410亿美元,定位"人工通用工程师"

杰夫·贝佐斯旗下AI公司Prometheus在成立仅7个月、尚无任何产品交付的情况下,以410亿美元估值完成120亿美元融资(最初估值62亿美元)。该公司定位为“人工通用工程师”,目标是将设计到制造的循环压缩10倍以上。但物理经济无法像互联网数据那样抓取,缺乏制造业训练数据。为此,Prometheus计划斥资1000亿美元收购传统工业企业,通过获取工厂生成的数据构建护城河。

数据/训练行业动态
关联讨论 3 条X:Rohan Paul (@rohanpaul_ai)Bloomberg:Technology(RSS)TechCrunch:AI(RSS)
推荐理由:贝索斯这12B融资最有趣的点不在金额,而在通过收购工厂获取真实制造数据来训练物理AI,这个数据护城河如果建成,后面玩家根本没法追。
23:46
OpenRouter@OpenRouter
精选77
使用我们的基准探索器,为10个不同基准绘制帕累托曲线。 更多功能即将推出!https://openrouter.ai/rankings#benchmarks
产品更新评测/基准

推荐理由:老是纠结选哪个模型又便宜又好用?OpenRouter 这个基准浏览器把性能和价格画成帕累托曲线,一眼看出性价比之王,选型党必备。
23:44
Google DeepMind@GoogleDeepMind
60
我们正与@Palmeiras合作,他们是第一家有意义地基于TacticAI构建的足球俱乐部:我们的AI系统可以模拟场上情景并提前最多8秒预测开放比赛动态。⚽
Google多模态行业动态
23:43
Google Gemini@GeminiApp
精选65
Gemini 的 Notebooks 功能现已面向欧洲经济区、英国和瑞士用户开放。Notebooks 提供一个独立专注的空间,可记忆用户的来源、指令和聊天记录,用于组织项目。用户可通过 gemini.google 或应用创建自己的 notebook。该功能旨在将用户常聊的话题归入独立空间,帮助保持条理。

Google Gemini: Give the topics you chat about most their own homes. 🗂️ Swipe to learn how you can stay organized with notebooks in Gem...

Google产品更新
关联讨论 1 条X:NotebookLM (@NotebookLM)
推荐理由:地区解锁而非新功能,EEA 用户终于能用 Notebooks 整理会话了,其他地区的人看看就好。
23:38
Luma@LumaLabsAI
35
合作是新的力量之举。 Luma 将参加 2026 年戛纳创意节,与合作伙伴共同构建创意工作的新时代。6 月 22-26 日,AI & Tech Sandbox 和 Luma House。完整日程如下。 RSVP 参加 → http://lumalabs.ai/cannes
行业动态视频
23:37
AYi@AYi_AInotes
71
用户分享 Claude Fable 5 体验:仅靠一句指令"给你自己做个落地页,自由发挥,要2026最新设计趋势,要彩蛋",Fable 5 在几分钟内自动生成完整单文件 HTML,无需任何修改。它主动搜索 2026 设计趋势、调整配色和动效,并偷偷藏了 3 个彩蛋。用户惊叹其代码质量和文笔,但当天因使用 Fable 5 耗费超过 $1000,称"真的贵"。

AYi: 苦逼牛马眼馋了一天Claude Fable 5,终于在深夜下班回家才得以体验, 卧槽刚才直接被Fable 5干懵了🤯 我直接给它甩了一句话, 给你自己做个落地页,自由发挥, 要2026最新设计趋势,要动态,要彩蛋, 然后我去上厕所去了,几...

智能体Anthropic教程/实践编码
23:27
向阳乔木@vista8
精选75
Codex Goal指令生成Skill发布:一句话需求转目标

针对如何给Codex写Goal指令的问题,作者发布了一个Skill,可将一句话需求自动转化为目标,实现“睡前写指令、模型自动开发、第二天收菜”。安装命令:`npx skills add joeseesun/qiaomu-goal-meta-skill`。源码免费开源(见评论区),旨在简化4w字文档的阅读负担。

智能体OpenAI教程/实践编码

推荐理由:如果你也用Codex写代码但老写不好Goal,乔木这个Skill能直接把一句话需求转成高标准指令,安装即用,今晚就能试试睡觉“收菜”的体验。
23:10
Berryxia.AI@berryxia
37
Anthropic:创始团队、技术武器与营收爆炸式增长

Anthropic 创始团队由前 OpenAI 研究副总裁 Dario Amodei、Scaling Laws 核心作者 Jared Kaplan、GPT-3 首席工程师 Tom Brown 及 AI 可解释性奠基人 Chris Olah 组成。技术武器包括 Scaling Laws、Constitutional AI 及 RLHF(Dario 参与发明)。算力方面:与 Amazon 签署 5 GW 协议,运行约 100 万颗 Trainium2 芯片;另有 Google/Broadcom 的 5 GW TPU 及 Microsoft/NVIDIA 的 $300 亿 Azure 算力。年化营收从 2024 年 1 月 $8,700 万飙升至 2026 年 4 月 $300 亿,超预期 8 倍。另指控 DeepSeek、月之暗面、MiniMax 通过约 2.4 万虚假账号发起约 1,600 万次对话进行蒸馏,该指控兼具技术事实与政策游说动机。

Berryxia.AI: http://x.com/i/article/2065071442996441088

Anthropic安全/对齐政策/监管行业动态
23:07
Krea@krea_ai
精选73
推出生成式滑块。 现在您可以控制使用 Krea 2 生成的任何图像的强度、复杂度和运动。 你希望看到哪些新控制?👇
产品更新图像生成

推荐理由:Krea 2 终于加上了控制强度、复杂度和运动轨迹的滑块,以前调参靠抽卡,现在能精准控制了,做图的人应该会喜欢。
23:00
Nathan Lambert@natolambert
58
Anthropic Fable 发布遭批评:安全域不均、操纵用户、限制研究访问

Nathan Lambert 批评 Anthropic 的 Claude Fable 发布存在多重问题:安全域应用不均,部分域以不同安全机制上线并误导用户,是重大失误;无声操纵用户破坏信任,与 Anthropic 领先的 AI 安全研究相悖;限制 AI 研究员访问最新模型,将科学进步局限于单一公司,错误理解科学社区协作本质。他呼吁 Anthropic 主动为学术和非营利研究者提供无限制访问,并强调需要继续推动开放科学,如 Olmo 的成功案例所示。

Anthropic大佬观点安全/对齐开源生态
‹ 上一页
1…678910…50
下一页 ›