mythos will be bad ON PURPOSE on ai "frontier llm research" tasks, this is very very sad for the research community also...
This is why frontier open models are crucial. This is extremely sad for the research community.
译这就是前沿开源模型至关重要原因。 这对研究社区来说极为可悲。 mythos 会在 AI “前沿大语言模型研究”任务上故意表现差,这对研究社区来说非常非常可悲。 而且这种故意行为对用户不可见,太疯狂了。
忙活一天,还没顾上体验 Claude Fable 5,打开Happycapy试试。 让它开发一个在线RSS阅读器,待会看结果。 看了不少海外分享,都建议把最有雄心的项目交给它做。 咱普通人又不搞科研,几乎没啥特别有挑战的项目。 就写作任务来说,大家反馈Fable 5还不如Claude 4.6... 问有更好的吗?卡神说:4.5
译用户打算用 Claude Fable 5 开发一个在线 RSS 阅读器,但尚未正式体验。海外多数分享建议用 Fable 5 处理最具雄心的项目。不过写作任务方面,反馈称 Fable 5 不如 Claude 4.6;当询问更优版本时,有用户(卡神)推荐 Claude 4.5。
我尼玛,Claude Fable 5今天把整个软件行业的底层逻辑给击穿了! 以前做软件要几个月,现在只要15分钟,Claude Fable 5把产品经理和程序员的中间环节,直接干掉了。 也就是说,15分钟的销售电话打完, AI当场做出了客户要的可运行软件原型,喵个咪,这谁受得了啊🤯 Todd Saunders,Dalton Mills AI 的 CEO,做的是 trades 行业的垂直 SaaS——建筑、家政、暖通这些。 他用刚发布的 Claude Fable 5, 在跟一个客户的销售电话里, 让 AI 在后台实时转录通话, 同时自主构建客户刚刚提到的软件功能。 通话结束,他当场演示了一个完全可运行的原型,精确匹配客户 15 分钟前描述的需求。 一个语音报价系统:AI 实时听服务电话,自动匹配价目表,识别 upsell 机会,生成 Good/Better/Best 三档方案,自动发提案短信。整个过程近乎零人工干预。 不是 简单的AI 辅助开发,直接对话即构建,damn! 平复下激动的心情,这个案例最让我震惊的不只是AI 写代码快,AI 真的能听懂人话了啊啊啊, 然后一个长达几十年的产品开发范式,就这么被直接击穿了,holy sh*t! 想一想过去几十年我们怎么干活的,客户跟你说工人在现场太乱经常算错钱,你记下来,回去消化,以为懂了, 画原型,约评审,排期,开发,几周后拿出来, 客户摇头说不对不是这么回事, 你一肚子委屈,说我每个字都记了,他说你记的是我说的话,不是我脑子里的东西。 这个循环叫理解-翻译-验证,短则几周长则几个月,整个行业就吃这碗饭的,我们管它叫专业服务。 但是今天,Fable 5 把这个循环干掉了,不是压缩啊兄弟们,直接彻底干掉了, 客户说,AI 听,AI 当场做出来,客户当场看对不对, 没有 PRD,没有你在内部群里发那个需求我回去评估一下,没有一切中间件, 从客户嘴里说出来的那一刻,一个能跑的东西就在屏幕上等着他。 这才是真正要命的地方,这哪是提效啊,简直把整个底层逻辑都改变了。 但我们也必须立刻面对一个最尖锐的问题,就是那客户为什么还需要你?这不就 15 分钟的事吗? 这个问题必须正面面对,确实是客观存在的, 如果你对自己的定位只是把客户需求翻译成代码的那个人,那你完全可以被这 15 分钟取代,因为 AI 现在翻译得比你快,还不用开评审会。 但如果你做完项目就知道,原型和系统,中间隔着的不是几行代码,还有权限体系里那几十个你不知道为什么会存在的字段, 是客户二十年前的财务系统里藏着的那个没人敢动的数据表,是工人在负二层没信号的地方操作时该怎么缓存,也是某个老小区因为水压问题装不上你方案里那个完美的配件, 又或者是当地监管对报价条款里的某个措辞有特殊要求,这些东西,Fable 5 不知道,你问它它也不知道,它甚至不知道它不知道。 它的原型是乐高模型,系统是能住人的楼,之间的差距,专业术语叫工程判断,也可以叫领域责任,更可以叫为长期可用性兜底。 所以这个案例真正揭示的,不是谁会被替代,是什么在剧烈地变稀缺。 第一样,把 AI 的生成能力锚定在真实世界的复杂约束里, 这一下子就筛掉两种人:只会做原型不会做系统的人,和只会做系统但不懂行业的人。 留下的是那种,你问他这个需求能不能做,他会先问你那边现场平均信号几格、工人习惯左手拿手机还是右手、他们现在用的那个老系统数据库编码是 UTF-8 还是 GBK 的人。 第二样,领域知识, 我说的不是行业报告里那些漂亮话,是那些只有在这个行业干了十年才知道的脏东西。 AI 能生成完美的三档报价界面,但它不知道某个配件的供应商在雨季会涨价 30%,不知道某个话术在北方好使在南方会让客户挂电话,不知道这个工种的师傅脾气大你不能在流程里多加一步确认否则他宁愿不干,这些脏知识才是真正的护城河。 第三样,也是最被低估的一样:把原型变成可信赖系统的治理能力。 评估框架你怎么建,AI 改了这一处你怎么知道没把另一处改坏。 记忆持久化你怎么做,客户上次改的需求下次对话能不能记住。 错误恢复你怎么设计,流程跑到一半 AI 崩了用户看到什么。 多代理协作你怎么编排,一个 Agent 听电话提取意图,一个匹配价目表,一个检查合规,一个生成界面,人类在哪个节点介入裁决。 这些东西不酷,开会聊这些会让人想抽烟,但就是从酷到能用的最后那一公里。 Fable 5 和后续更强的模型,把生成这件事的成本和速度打到了一个新的量级。 这个量级意味着,做出一个看起来能用的东西,以后不再是任何人的竞争力。竞争的分水岭是,谁能把 AI 吐出来的东西,变成一个别人敢在上面跑业务、能长期依赖、出了问题找得到人负责的系统。 扯了这么多,最后一句话给大家共勉: 从今天起,把 80% 的精力,从怎么让 AI 生成得更快,转移到怎么为 AI 生成的东西负责,说白了,酷是给外人看的,稳是给我们自己续命的。
译SaaS公司CEO Todd Saunders使用新发布的Claude Fable 5,在客户销售电话中实时转录通话,AI自主构建客户描述的功能。通话结束即展示完全可运行的原型——语音报价系统,自动匹配价目表、识别upsell机会、生成三档方案并发送提案,全程零人工干预。这直接跳过了PRD、评审、开发排期,实现“对话即构建”。但将原型落地为可信赖系统仍需工程判断、领域脏数据和治理能力,这些才是真正的稀缺价值。
文章提到DeepSeek目前满足于落后美国公司约 6 个月...... 这有点扯吧。 中国每家大模型公司都受限于显卡和技术,不是不想追啊,谁想落后,谁安于落后。
译@NikoMcCarty 探访DeepSeek总部称,这家300人、2023年由梁文锋创立的公司脱胎于幻方,位于杭州无标识大楼,2025年1月发布R1模型,团队年轻,目前满足于落后美国约6个月,保持低调。Vista反驳:中国大模型公司并非安于落后,而是受限于显卡和技术条件。
演示视频中的书籍解读口播脚本 Skill 开源了 https://github.com/joeseesun/qiaomu-book-script 安装指令:npx skills add joeseesun/qiaomu-book-script 只需要说:解读《被讨厌的勇气》 Skill 会调用多个Subagent从不同角度写脚本,最后主LLM整理成终稿。
译Vista 开源的 qiaomu-book-script Skill 可通过 `npx skills add joeseesun/qiaomu-book-script` 安装。用户说“解读《被讨厌的勇气》”即可触发,多个 Subagent 分别撰写脚本,最后由主 LLM 整理成终稿。此前 Vista 已用该 Skill 生成口播脚本并完成录制。
Many AI leaders in the US accused Chinese LLMs of subtle manipulation of the user (without proof, but it's hard to prove). But then the leading American lab documented manipulation of their users. Can't make this up.
译许多美国 AI 领袖指责中国大语言模型对用户进行微妙操纵(没有证据,但很难证明)。但随后,领先的美国实验室记录了对他们用户的操纵。真是编都编不出来。
SpaceX achieved all of this without any use of AI
译SpaceX 在没有使用任何 AI 的情况下实现了所有这一切。
I asked Fable to invent a new color, and I got my first "chat paused". It did however decide to pursue a strategy of shining lasers in your eyes to trigger otherwise impossible cone activations 🤯
译我让 Fable 发明一种新颜色,然后我收到了第一次“聊天暂停”。 不过它决定采用一种策略:把激光射到你的眼睛里,触发原本不可能的视锥细胞激活 🤯
按照这个架势,Codex 不得立马要Reset一下啊! GPT-5.6摩拳擦掌该抛出来了啊,奥特曼~👊🏻
译按照这个架势,Codex 不得立马要Reset一下啊! GPT-5.6摩拳擦掌该抛出来了啊,奥特曼~👊🏻
Fable 5 VS Opus 4.8 VS Gemini 3.1 Pro VS GPT 5.5 只有Google 还拿着去年的模型在玩儿~
看到 Mole 作者 @HiTw93 遇到的开源项目被「抄袭」的遭遇,想起 Tw93 一直以来对 Mole 的用心维护和付出,和之前很多篇对 AI Agent 很高认知的文章分享。 认知里一直告诉自己:一位优秀且认真的开源作者,不应该遭遇这种问题,他们应该得到开源的馈赠,而不是抄袭! 而现实呢?总会有人去利用规则、找到规则的漏洞、或作者善念下的灰色地带。 就像 NBA,很多球员专职造犯规,好好的篮不投,起手就奔着造犯规去,从规则角度讲,他错了吗?没有!但这种造犯规给观众和比赛带来的是什么?倒退、绝对的倒退! 如果这位造犯规的球员,还舔着脸跟媒体说:他是犯规了啊,不是我的问题啊。。那你说,恶不恶心!!
译Mole CLI 作者 @HiTw93 指出,@QT9277 的 Burrow 项目大量抄袭其 MIT 开源项目的 UI 交互,且 Burrow 对外宣传为付费版 Mole Mac 的免费替代。@HiTw93 表示寒心,考虑将 Mole CLI 闭源,已提交 issue。邵猛(@shao__meng)评论认为,这种利用规则漏洞的行为如同 NBA 造犯规,是技术倒退,优秀开源作者不应被如此对待。
The core problem with open weights is that the business model of frontier open weights AI does not look like open source, as there are very few cases where you can make money from closed ancillary services, and they are very expensive to make relative to any potential revenue.
译开放权重的核心问题在于,前沿开放权重AI的商业模式看起来并不像开源,因为能从封闭的辅助服务中赚钱的案例极少,而且相对于任何潜在收入,其制造成本非常高昂。
I got a good nights sleep and I’m still just as angry about Anthropic’s choices. I enjoy working in AI so much and to have my access to the cutting edge models for my work rugpulled in an under the table fashion is appalling. I expected to be restricted eventually, but not now, and to be told it directly.
译我睡了个好觉,但对Anthropic的选择依然愤怒。 我非常享受从事AI工作,而我的工作所需的前沿模型访问权限竟被这样暗中撤走,实在令人震惊。 我预料到最终会被限制,但不是现在,而且是直接被通知。
You should really all try Opus Fable low mode versus high or ultracost It's a good enough model to semi one-shot most things and this uses far fewer tokens You can even tell it to figure out the most efficient way
译你们真的都应该试试 Opus Fable 的低模式,对比高模式或 ultracost。 它是一个足够好的模型,可以半一次性完成大多数事情,而且这使用的 token 要少得多。 你甚至可以告诉它找出最高效的方式。
一个 10 万粉的小红书 AIGC 博主, 不带货,不卖课,不引流私域,她是靠什么挣钱的? 我拆了7 篇爆款(赞≥5000),规律全在这, 这篇请收藏起来,你一定会用到! 1️⃣封面:7 篇有 5 篇零文字,纯靠画面。"封面要大字+痛点"在 AIGC 赛道是错的——唯二带大字的两条都是品牌广,大字=广告语 2️⃣广告:7 篇里 5 篇是品牌合作(兰蔻、李锦记、华为、脉动),但没一条像硬广,产品全包进"猫咪 meme""穿进古画当厨子"的剧情里 3️⃣选题天花板:萌宠拟人化。一条 AI 跳舞猫 7.9 万赞、4.2 万藏,干翻所有奢品大片 4️⃣标题:强动词造戏剧感——闯进 / 穿进 / 征服 > 分享 / 介绍,再配疑问感叹 + emoji 5️⃣开头:第一句直接说出用户心里话("也太治愈了吧"),或具体场景代入 6️⃣形式:100% 视频,0 图文 能抄的就这 6 条, 十几分钟扒完 7 篇的封面/标题/钩子/数据 + 我用的提示词,都在下面这篇干货满满的文章里 👇
译一位10万粉小红书AIGC博主,不带货、不卖课、不引流私域。拆解7篇赞≥5000爆款:封面5篇零文字靠画面,唯二带大字的为品牌广;7篇中5篇品牌合作(兰蔻、李锦记、华为、脉动),产品嵌入“猫咪meme”“穿进古画当厨子”剧情;选题萌宠拟人化,一条AI跳舞猫获7.9万赞、4.2万藏;标题用强动词如“闯进/穿进/征服”+疑问感叹;开头直说用户心里话或具体场景;全部视频、0图文。详细提示词见原文。
AI market beat 2025 expectations by massive margins. But here's what's wild about the composition of this beat.
译AI市场以巨大幅度超出了2025年的预期。但令人疯狂的是这次超出的构成。
Someone built this beautiful Crysis like game in Three.js in basically one prompt with Claude Fable 5 Credit: @dangreenheck
译有人用 Claude Fable 5,基本上通过一个提示词,在 Three.js 中构建了这个漂亮的类《孤岛危机》游戏。 Credit: @dangreenheck
和 Claude Fable 5 对话,确实有一种对方智商很高的感觉 思维很全面,甚至有点过于全面 缓存命中之后,一轮10美分,好像也值这个价
When you're having too much fun with fable 5.
译我正在运行测试(德国现在是早上),这里有一些展示 Fable 5 有多好的示例 🧵。
What’s the best slack bot experience? Devin?
译云编码智能体一个被低估的好处:当整个团队可以直接与智能体聊天时,事情可以更快推进。不需要人类工程师成为沟通瓶颈。 最好的 Slack 机器人体验是什么?Devin?
说个暴论,大多数普通人能抓到的AI红利就是自媒体, 给大家分享下最近拆解的小红书博主, 说实话,这是我见过最离谱的 一个小红书AIGC 博主, 10 万粉,不带货,不卖课,不引流私域, 那他是那么变现和赚钱的呢? 我用 AllyHub 把它的收入拆了个底朝天,结果直接把我干懵了: 80% 的钱,全来自蒲公英接品牌广告, 李锦记、兰蔻、华为、宝格丽都投过它, 10 万粉这个量级,一条广估算报价至少 8000 到 2 万。 更狠的是它的隐藏变现: 账号本身就是一份活的作品集, 品牌看到它能用 AI 做出兰蔻大片级别的效果, 会直接私信谈全案,绕过平台、报更高的价。 这是我最近最颠覆的一条认知,就是: 爆款从来不是用来直接赚钱的,是用来抬价的, 一条 7000 赞的爆款,能把接广报价从 2000 拉到 4000,品牌主动找上门的概率还翻倍。 顺着这个逻辑想你就懂了: 以前普通人根本接不到品牌广告—— 没团队,没设备,没预算,连相机都买不起, 现在 AI 几乎把这些门槛碾平了, 一个人,一台电脑,就能做出接近专业团队的内容。 你的账号,就是一份 24 小时挂在网上的简历。 这才是 AI 给普通人最被低估的红利, 它不是替你写笔记凑字数, 是把过去只有广告公司才握得住的创意能力, 塞到了你手里。 哪怕你只做到 3 万粉,按行业水平估算,月入也有机会落在 8k 到 2 万(旺季更高、淡季会缩水,别当稳赚)。 不用囤货,不用售后,把内容做好,让品牌自己来找你。 完整变现拆解 + 我用 AllyHub 拆账号的提示词,都在下面这篇 👇
译一个10万粉小红书AIGC博主,不带货、不卖课,80%收入来自蒲公英品牌广告(李锦记、兰蔻、华为、宝格丽均投过),单条推广报价8000-2万。隐藏变现是将账号作为活作品集,品牌看到AI制作的兰蔻级别效果后,绕过平台直接谈全案。一条7000赞爆款可将报价从2000拉至4000,并提升主动邀约率。AI碾平了门槛——一人一电脑能做出接近专业团队的内容,账号就是24小时在线简历。按行业估算,3万粉账号月入可达8000-2万。
Fable 5 这个模型的 API 价格是真的不低 在 Agent 里问一个最简单的 Query 0.5 美金,一瓶可乐,就瞬间蒸发了... 反正省着用吧
译Fable 5 这个模型的 API 价格是真的不低 在 Agent 里问一个最简单的 Query 0.5 美金,一瓶可乐,就瞬间蒸发了... 反正省着用吧
关于屌炸天的Claude Fable 5, 这条推文是你必看和必收藏的, 帮大家总结了Anthropic内部用烂了的核心杠杆和方法:我敢说用了这个,你的Agent会越用越聪明,复利效应爆炸。 虽然很多人吐槽Fable 5的费用是Opus 4.8的将近3倍,但我想说他确实值这个价! Anthropic内部工程师这篇文章大家可以看看,基本说透了,我帮大家总结下核心要点: 1️⃣90%的人都在浪费Fable 5的能力, 很多人还在给它扔单次prompt, 它真正的实力,是当一个能自主干活的长期工程师, 2️⃣Fable 5是第一个能真正自律循环的模型, 所以不要只给它一个指令让它交差, 得给它一个清晰的目标, 一个可量化的打分标准, 一个能自己跑的环境, 然后它会自己做实验、看结果、踩坑、反思、改代码、再跑,直到把事干成。 3️⃣这就是它比Opus强一个档次的真正原因, 任务越长、越复杂、越需要迭代,它的优势就会越夸张: ✅ Parameter Golf工程挑战,效率比Opus高6倍 ✅ Slay the Spire加持久记忆后,表现直接翻3倍 ✅ 50万行代码库迁移,一次性搞定不用人擦屁股 4️⃣@RLanceMartin 分享了两个Anthropic内部用烂了的核心杠杆: 杠杆❶ 自我纠正循环:不要写prompt,写rubric 不要说帮我优化这个代码, 要说: • 目标:把这个接口的延迟降到100ms以内 • 评分标准:延迟达标、所有单元测试通过、代码不超过300行 • 给它一个能自己运行代码的沙箱 然后你就可以去喝咖啡了😆 它会自己改、自己跑、自己看日志、自己调, 5️⃣最关键的一步:不要让它自己批评自己, 单独开一个独立上下文的验证代理,客观打分, 这一个改动,准确率直接翻倍! 杠杆2 记忆系统:给它一个能写日记的外脑 不要把所有东西都塞进上下文, 给它一个共享的文件系统, 让它每次干完活,都写工作笔记: • 今天犯了什么错 • 为什么会错 • 下次应该怎么改 • 提炼成一条通用规则 Fable 5是目前唯一一个能真正走完这个流程的模型: 出错→调查→验证→蒸馏成规则→下次直接用。 Opus只能到第二步,Sonnet连第一步都做不好。
译Claude Fable 5 费用约是 Opus 4.8 的三倍,但效率提升显著:Parameter Golf 挑战效率高 6 倍;Slay the Spire 加持久记忆后表现翻 3 倍;可一次性迁移 50 万行代码。Anthropic 内部两大杠杆:① 自我纠正循环——写 rubric(目标+量化评分标准+沙箱),让模型自主改代码、跑测试;② 记忆系统——共享文件系统作为外脑,每次记录错误与改进规则。Fable 5 是唯一能完整走通“出错→调查→验证→蒸馏成规则”流程的模型。独立上下文的验证代理可使准确率翻倍。
So we can expect The Elder Scrolls VI to be fully prompt-generated, right? Matt Shumer made this with Fable 5 in three.js. Insane.
译所以我们可以期待《上古卷轴VI》完全由提示词生成,对吧? Matt Shumer 用 three.js 制作了 Fable 5。 太疯狂了。
1/ While I'm currently running my tests (it's morning in Germany right now :), here are some examples of how good Fable 5 is 🧵:
译Matt Shumer 用 Fable 5 在 three.js 中制作了这个,让人不禁期待《上古卷轴6》完全由提示词生成。太疯狂了。
Claude Fable’s ability to create rich docs, slides, sheets, websites in specific styles pixel perfectly is the biggest step change in AI model quality since o3. Here’s another compilation of 8 amazing things it can do, many of which took >2hrs of thinking! – Perfectly designed McKinsey style report – Near identical SpaceX S-1 IPO draft – Pixel-perfect recreation of Pokemon, the game – 3D design of a controllable humanoid robot – Apple Liquid Glass UI with just CSS – 3D world rendering of Yosemite (!!) – Upgraded website design – Rich, beautiful email marketing templates
译Claude Fable 在创建文档、幻灯片、表格、网站等方面实现了像素级精准,被认为是自 o3 以来 AI 模型质量的最大飞跃。其能力包括:完美复现 McKinsey 风格报告、近乎一致的 SpaceX S-1 IPO 草案、像素级还原宝可梦游戏、可控人形机器人 3D 设计、仅用 CSS 实现 Apple Liquid Glass UI、优胜美地 3D 世界渲染、网站设计升级以及精美的邮件营销模板。其中许多任务需要超过 2 小时的深度思考。
一个专门给产品经理准备的Skill,五天竟有13k Stars。 从名字看,确实涵盖了产品经理日常工作范围。 警惕大而全的Skill产品包,最好体验根据需求微调。 安装地址见评论
译一个专门给产品经理准备的Skill,五天竟有13k Stars。 从名字看,确实涵盖了产品经理日常工作范围。 警惕大而全的Skill产品包,最好体验根据需求微调。 安装地址见评论
用好 Claude Design 的一些经验: 1. 加上 Design System 可以有效避免设计 AI 味 比如我偏好用 Adobe Spectrum 2 Design System https://github.com/adobe/react-spectrum 设置为默认设计系统,后续就会默认使用这个设计系统,你就可以把重点放在界面布局和交互上。 2. 不要指望一次性做个完美的版本 一开始少做一点功能,把架子搭好,然后通过左侧的聊天框,一点点调整,一点点添加功能 3. 多用 Markup 功能去局部修改 Markup 功能可以框选特定的位置,然后评论,缺点是不能添加附件、截图 Edit 功能是给你手动调整的,选中元素左侧可以修改树形,比如调整一下字体大小 4. 注意上下文管理 左侧的对话框不是无限聊天的,也要做上下文管理,当新的任务就创建新的会话 5. 用 Tweaks 去尝试不同风格、导航 Tweaks 是一个设置面板,你可以通过它来调整应用属性,比如theme、布局、加载状态等等 另外如果你界面多,也可以通过 Tweak 添加导航,快速进入相应的界面而不必一步步点击
译宝玉分享了5点心得:1. 加入设计系统(如 Adobe Spectrum 2)可避免 AI 味,设为默认后可专注布局与交互。2. 先搭建少量功能,再通过左侧聊天框逐步调整。3. 用 Markup 框选局部评论,Edit 可手动调整元素树。4. 注意上下文管理,新任务创建新会话。5. 通过 Tweaks 面板调整主题、布局、加载状态,也可添加导航快速切换界面。
是对的,用 Claude Design 更省 tokens。它是专用 harness,少了很多无关的工具和 skills。但速度不如本地快,每一次工具调用要通过浏览器和虚拟机交互,所以会慢些
译针对“在 Claude Design 里用 Fable 做设计更省 token”的观点,宝玉确认属实。Claude Design 是专用 harness,去掉了大量无关工具和 skills,因此消耗的模型 tokens 更少;但每次工具调用需经浏览器与虚拟机交互,速度明显慢于本地开发。具体省 token 幅度和速度差距尚无定量数据,需进一步验证。
随着 Claude Mythos 的小范围供应和 Claude Fable 5 正式发布,Anthropic 的路线其实越来越清晰了,看看他们的 $1M 账单的客户数量就知道了,tod 的重心一定在企业端,去创造实际的效率、降低用人成本,算 ROI,走 AI 替代部分人力的方向。 而 C 端用户,更大的作用是在模型发布初期,尝鲜提供更多的人类数据反馈,而已。。。 不信,就等 Anthropic 正式公布招股书之类的公开文件,再做分析。
译随着Claude Mythos小范围供应和Claude Fable 5正式发布,Anthropic的企业端路线愈发明确。从客户$1M账单数量可见,重心放在创造效率、降低用人成本、算ROI、走AI替代人力的方向。C端用户主要在模型发布初期提供人类数据反馈。等待Anthropic正式公开招股书等文件再做进一步分析。
Claude Fable 5 过于先进 以至于我的认知水平和能力太差 不知道怎么测试😅
译Claude Fable 5 过于先进 以至于我的认知水平和能力太差 不知道怎么测试😅
大量测试 Claude Design 后我的一个结论: UI/UX 设计方面 Claude 4.8 就够好了,Fable 5 没有体现出更好的 UI/UX 设计能力,甚至还不如 Claude 4.8 的设计效果。
译Anthropic同日发布Fable 5与Mythos 5,同底座但Fable 5加安全分类器(检测攻击/生化/蒸馏时降级至Opus 4.8,95%对话不触发),Mythos 5仅限Project Glasswing合作伙伴。API定价输入$10/百万token、输出$50,较Mythos Preview降60%,比Opus 4.8贵一倍。实际能力:Stripe用Fable 5一天完成5000万行Ruby全库迁移;视觉接口通关宝可梦火红版;Mythos 5使蛋白质设计加速约10倍,基因组学模型超Science但体量仅1%。订阅用户即日起至6月22日免费,后续需额外购买credits。政策变化:所有Mythos级流量强制保留30天用于安全监控。博主@dotey大量测试后认为,Claude 4.8在UI/UX设计上已足够好,Fable 5未体现更强能力甚至更差。
最近有一个很大的感受, 我们大部分人做副业赚不到钱,真不是不够努力, 以及流传甚广的先发够100条就是骗人的屁话, 纯浪费时间,大家别再信了, 很多人还在用十年前的规则玩今天的游戏, 要知道AI 已经把自媒体副业的玩法整个改写了。 而且很多人没有策略,也不知道方法, 起号之前最重要的是先拆解对标账号,这是一定必须做的, 但拆对标账号放之前是一个非常耗时间精力的活,拆一个赛道起码要熬一周,一条条翻笔记、扒数据,导致很多人偷懒就直接跳过, 最近发现一个特别好用的agent工具, 十几分钟就能出一份完整的对标拆解报告, 我真的惊呆了, 以前要踩几万块的坑才摸透的规律, 现在你照着别人已经跑通的路走就行, 以及很多人说小红书现在入场晚了,饱和了等, 可我这一个月看到冒头的,好几个都是以前压根没碰过小红书的普通人,不太会写文案、不会拍视频、甚至没有自己的产品, 他们就核心干一件事:把对标账号的爆款拆开,照着结构和选题,用 AI 改写成自己的话,然后……就出结果了,有一个兄弟小红书笔记都是AI生成的,几个月干到了一万多粉丝你们敢相信吗哈哈, 总结下来没啥玄学和门槛,就三步: · 别硬刚原创,先对标对的人 · 别憋文案,先拆爆款公式 · 别等流量,先算清楚钱从哪来 我拆完以后最反直觉的一个收获是: 这个赛道 85% 的收入不是靠带货,主要是接品牌广, 所以兄弟们清醒一点,如果方向一开始就搞错, 越使劲越白费,
译大部分人副业赚不到钱,不是不够努力,而是用旧规则玩新游戏。AI已彻底改写玩法:先拆解对标账号,以前一周的工作,现在用agent工具十几分钟出报告。有人靠拆爆款结构、AI改写文案,不会拍视频也能涨粉破万。核心三步:别硬刚原创,先对标;别憋文案,先拆爆款公式;别等流量,先算清钱从哪来。反直觉发现:该赛道85%收入来自品牌广告,而非带货。
如今哪怕是你学学豆包、DeepSeek 也是好的。 不然毕业=失业啊!兄弟们~ 站在前沿的AI科技浪潮中,不要被拍在沙滩上。 老黄都说了: 他要的人一定是懂AI的,会熟练使用AI的人。 即使你有很多的行业经验,可能都不是首选。 把握一手信息源,非常重要。 我整理了100 个信息源,供大家学习使用。 篇幅问题,我看看单独发一份可订阅的或者Skills!
译Berry Xia强调AI技能对就业的重要性,引用老黄(黄仁勋)观点:其需要的人是懂AI、会熟练使用AI的人,即使有丰富行业经验也可能不是首选。他建议学习豆包、DeepSeek等AI工具,并整理了100个信息源供学习使用,但暂未公开列表。推文提醒把握一手信息源,避免在AI浪潮中被淘汰。
学完Harness后,Loop Engineering 又来了。 还真是要了解这些背后的逻辑和底层的设计。 不仅对于Vibe Coding 帮助大,更多的还是对于产品的架构设计都是不少的启发。 这几天想些一篇文章和大家一起学习下,这下Smith 直接搞完了,可以看看不错!
译Berry Xia表示,学完Harness后接触Loop Engineering,认为理解其底层逻辑对Vibe Coding和产品架构设计帮助很大。他原计划写文章分享,但Smith(@smithandai)已发表相关文章,推荐阅读。
mythos will be bad ON PURPOSE on ai "frontier llm research" tasks, this is very very sad for the research community also...
用户打算用 Claude Fable 5 开发一个在线 RSS 阅读器,但尚未正式体验。海外多数分享建议用 Fable 5 处理最具雄心的项目。不过写作任务方面,反馈称 Fable 5 不如 Claude 4.6;当询问更优版本时,有用户(卡神)推荐 Claude 4.5。
SaaS公司CEO Todd Saunders使用新发布的Claude Fable 5,在客户销售电话中实时转录通话,AI自主构建客户描述的功能。通话结束即展示完全可运行的原型——语音报价系统,自动匹配价目表、识别upsell机会、生成三档方案并发送提案,全程零人工干预。这直接跳过了PRD、评审、开发排期,实现“对话即构建”。但将原型落地为可信赖系统仍需工程判断、领域脏数据和治理能力,这些才是真正的稀缺价值。
Mythos / Fable is unbelievable. Was on a customer call today and had Claude transcribing in the background. As they were...
Notes on DeepSeek: We visited the company HQ last Tuesday. It was founded in 2023 by Liang Wenfeng and operated out of h...
第一次录口播脚本,推荐本好书《被讨厌的勇气》。 工具:Pocket3 + 免费提词器teleprompter + 手机配件 脚本:用刚做的书籍口播解读 Skill 生成,改天开源。 剪辑:剪映加片头片尾,调色用LUT文件CELLULOID_...
Mole CLI 作者 @HiTw93 指出,@QT9277 的 Burrow 项目大量抄袭其 MIT 开源项目的 UI 交互,且 Burrow 对外宣传为付费版 Mole Mac 的免费替代。@HiTw93 表示寒心,考虑将 Mole CLI 闭源,已提交 issue。邵猛(@shao__meng)评论认为,这种利用规则漏洞的行为如同 NBA 造犯规,是技术倒退,优秀开源作者不应被如此对待。
@QT9277 你好 我是 Mole 的作者,Mole cli 的确是 MIT 开源的,大家可以基于他做任何东西,但是你这个对外宣传是付费版本 mole mac 的免费替代,而且 ui 交互抄袭太多了,挺寒心,可能以后我可能会把 cli 版...
一位10万粉小红书AIGC博主,不带货、不卖课、不引流私域。拆解7篇赞≥5000爆款:封面5篇零文字靠画面,唯二带大字的为品牌广;7篇中5篇品牌合作(兰蔻、李锦记、华为、脉动),产品嵌入“猫咪meme”“穿进古画当厨子”剧情;选题萌宠拟人化,一条AI跳舞猫获7.9万赞、4.2万藏;标题用强动词如“闯进/穿进/征服”+疑问感叹;开头直说用户心里话或具体场景;全部视频、0图文。详细提示词见原文。
http://x.com/i/article/2064536412670562304
1/ While I'm currently running my tests (it's morning in Germany right now :), here are some examples of how good Fable ...
Underrated benefit of cloud coding agents: when the whole team can chat directly with the agent, things can move faster....
一个10万粉小红书AIGC博主,不带货、不卖课,80%收入来自蒲公英品牌广告(李锦记、兰蔻、华为、宝格丽均投过),单条推广报价8000-2万。隐藏变现是将账号作为活作品集,品牌看到AI制作的兰蔻级别效果后,绕过平台直接谈全案。一条7000赞爆款可将报价从2000拉至4000,并提升主动邀约率。AI碾平了门槛——一人一电脑能做出接近专业团队的内容,账号就是24小时在线简历。按行业估算,3万粉账号月入可达8000-2万。
http://x.com/i/article/2064536412670562304
Claude Fable 5 费用约是 Opus 4.8 的三倍,但效率提升显著:Parameter Golf 挑战效率高 6 倍;Slay the Spire 加持久记忆后表现翻 3 倍;可一次性迁移 50 万行代码。Anthropic 内部两大杠杆:① 自我纠正循环——写 rubric(目标+量化评分标准+沙箱),让模型自主改代码、跑测试;② 记忆系统——共享文件系统作为外脑,每次记录错误与改进规则。Fable 5 是唯一能完整走通“出错→调查→验证→蒸馏成规则”流程的模型。独立上下文的验证代理可使准确率翻倍。
http://x.com/i/article/2064380553919676416
So we can expect The Elder Scrolls VI to be fully prompt-generated, right? Matt Shumer made this with Fable 5 in three.j...
Claude Fable 在创建文档、幻灯片、表格、网站等方面实现了像素级精准,被认为是自 o3 以来 AI 模型质量的最大飞跃。其能力包括:完美复现 McKinsey 风格报告、近乎一致的 SpaceX S-1 IPO 草案、像素级还原宝可梦游戏、可控人形机器人 3D 设计、仅用 CSS 实现 Apple Liquid Glass UI、优胜美地 3D 世界渲染、网站设计升级以及精美的邮件营销模板。其中许多任务需要超过 2 小时的深度思考。
宝玉分享了5点心得:1. 加入设计系统(如 Adobe Spectrum 2)可避免 AI 味,设为默认后可专注布局与交互。2. 先搭建少量功能,再通过左侧聊天框逐步调整。3. 用 Markup 框选局部评论,Edit 可手动调整元素树。4. 注意上下文管理,新任务创建新会话。5. 通过 Tweaks 面板调整主题、布局、加载状态,也可添加导航快速切换界面。
@dotey @howie_serious 感觉我用Claude design不是很顺利,宝玉老师有心得分享嘛hh
好像在 Claude Design 里用 Fable 做设计,会比在本地直接做更省 token 刚才做了一些 UI 的重构也没消耗特别多,不过有待验证
http://x.com/i/article/2053655813877870592
随着Claude Mythos小范围供应和Claude Fable 5正式发布,Anthropic的企业端路线愈发明确。从客户$1M账单数量可见,重心放在创造效率、降低用人成本、算ROI、走AI替代人力的方向。C端用户主要在模型发布初期提供人类数据反馈。等待Anthropic正式公开招股书等文件再做进一步分析。
Anthropic同日发布Fable 5与Mythos 5,同底座但Fable 5加安全分类器(检测攻击/生化/蒸馏时降级至Opus 4.8,95%对话不触发),Mythos 5仅限Project Glasswing合作伙伴。API定价输入$10/百万token、输出$50,较Mythos Preview降60%,比Opus 4.8贵一倍。实际能力:Stripe用Fable 5一天完成5000万行Ruby全库迁移;视觉接口通关宝可梦火红版;Mythos 5使蛋白质设计加速约10倍,基因组学模型超Science但体量仅1%。订阅用户即日起至6月22日免费,后续需额外购买credits。政策变化:所有Mythos级流量强制保留30天用于安全监控。博主@dotey大量测试后认为,Claude 4.8在UI/UX设计上已足够好,Fable 5未体现更强能力甚至更差。
Anthropic 今天同时发布了两个模型:Claude Fable 5 和 Claude Mythos 5。 两个模型用的是同一个底座,区别在于 Fable 5 加了一套安全分类器,面向所有用户开放;Mythos 5 去掉了部分安全限制,...
大部分人副业赚不到钱,不是不够努力,而是用旧规则玩新游戏。AI已彻底改写玩法:先拆解对标账号,以前一周的工作,现在用agent工具十几分钟出报告。有人靠拆爆款结构、AI改写文案,不会拍视频也能涨粉破万。核心三步:别硬刚原创,先对标;别憋文案,先拆爆款公式;别等流量,先算清钱从哪来。反直觉发现:该赛道85%收入来自品牌广告,而非带货。
http://x.com/i/article/2064536412670562304
Imagine the alternate reality where we named GPT-5.4-Pro something like Fable.
Berry Xia强调AI技能对就业的重要性,引用老黄(黄仁勋)观点:其需要的人是懂AI、会熟练使用AI的人,即使有丰富行业经验也可能不是首选。他建议学习豆包、DeepSeek等AI工具,并整理了100个信息源供学习使用,但暂未公开列表。推文提醒把握一手信息源,避免在AI浪潮中被淘汰。
http://x.com/i/article/2064543911729885184
Berry Xia表示,学完Harness后接触Loop Engineering,认为理解其底层逻辑对Vibe Coding和产品架构设计帮助很大。他原计划写文章分享,但Smith(@smithandai)已发表相关文章,推荐阅读。
http://x.com/i/article/2064229409247358976