天啊! Google DeepMind CEO Demis直接把AGI的门槛从Erdős水平提升到了拉马努金水平! 这波目标线移动我愿称之为人类最后的防线🤯 具体内容请看中文字幕版👇 #AGI #AI #OpenAI [引用 @AYi_AInotes]:http://x.com/i/article/2058381329318682624
http://x.com/i/article/2058381329318682624
Damn! Google DeepMind CEO Demis直接把AGI的门槛从Erdős抬到了拉马努金水平! 这波goalpost moving我愿称之为人类最后的防线🤯 具体大家看中文字幕版吧👇 #AGI #AI #OpenAI
译天啊! Google DeepMind CEO Demis直接把AGI的门槛从Erdős水平提升到了拉马努金水平! 这波目标线移动我愿称之为人类最后的防线🤯 具体内容请看中文字幕版👇 #AGI #AI #OpenAI [引用 @AYi_AInotes]:http://x.com/i/article/2058381329318682624
兄弟们吃瓜的同时记得学习呀, 主线任务不能丢不能丢! 再分享一个AI自动化的案例, 这个老哥用Claude+MCP+N8N搭了个全自动晨间研究 Agent, 然后每天醒来Obsidian里已经躺着一份5分钟晨报, 每天45分钟刷信息的时间砍到了5分钟, 这个大家感兴趣的话, 我验证跑通了出个教程, 反正curcor送的10000$额度用不完哈哈哈哈 #AI #Claude #MCP #N8N #效率
译有开发者利用 Claude、MCP 与 N8N 构建了一个全自动晨间研究智能体。该智能体每日自动运行,将产出的 5 分钟晨报直接存入 Obsidian 笔记库,从而将用户原本需要 45 分钟的每日信息筛选时间压缩至 5 分钟,节省了 87% 的时间。发布者表示,如果感兴趣可以制作教程,并顺便提到 Cursor 提供的 $10,000 额度还远未用完。
很喜欢这个视角。 把 AI 出问题这件事,从骂模型切换成了扫描哪个器官坏了。 记忆、行动、自检,每个 bug 都能定位到具体位置。 里面提到 AI 幻觉在医学上其实叫虚构症,大脑在记忆缺口处自己编故事还深信不疑,比幻觉精确多了。 对做 agent 的人最有用的转换可能是,遇到问题不再是往 prompt 里堆规则,而是看具体哪个组件出了问题,针对性地补。 不过最想说的还是耐心这件事。 现在 skill 也好、agent 也好,GitHub 上一搜一大把,复制粘贴就能跑。 但直接拿来用,永远是别人的工作流。 我自己搭 agent 和做 skill, 每次前前后后得调好多轮,才慢慢摸清它在我这个场景下会在哪里幻觉、哪里偷懒、哪里得喂真实资料才不会瞎编。 那种峰回路转的瞬间攒够了,它才真正变成你的东西。 skill 不是一蹴而就的,agent 也不是。
译推文提倡将AI智能体的故障,从笼统归咎“模型幻觉”,转变为像医生诊断一样,精准定位到记忆、行动或自检等具体系统组件。文中引用指出,医学上的“虚构症”是比“幻觉”更贴切的类比,指记忆缺口处的无意识编造。这种视角转换的核心价值在于,构建者遇到问题时,不再盲目向提示词堆砌规则,而是能针对性地修复特定模块。作者强调,这种能力的获得没有捷径,需要通过反复调试和耐心磨合,才能让技能与智能体真正融入自身工作流。
Hold on, so Anthropic now has the cathloic church and god on their side as well? I thought Andrej Karpathy was already the highlight.
译等等,所以Anthropic现在还有天主教会和上帝站在他们那边了?我以为Andrej Karpathy已经是最大亮点了。
下个月要去给传统媒体朋友分享Prompt、 Skill、AI Coding相关内容。 为准备PPT,晚上用Youmind反复调试,弄了个简洁风GPT-image-2提示词。 发现 AI 味小了很多,也更适配AI Agent产品,给AI更多推理发挥空间。 提示词见评论区
译为准备面向传统媒体的Prompt、技能及AI编程分享,作者通过Youmind反复调试,为GPT-image-2生成了一个简洁风格的提示词。该提示词有效降低了生成内容的“AI味”,并更适配AI智能体产品,为AI提供了更多自主推理与发挥的空间。
Anthropic just passed OpenAI in business adoption for the first time, 34.4% vs 32.3%, per Ramp's latest AI Index. But the same report that announces this spends most of its word count explaining why it probably won't last. Uber already blew through its entire 2026 AI budget. A recent model update triples the cost of any prompt that includes an image. Meanwhile the fastest-growing AI vendors on Ramp's platform right now? Inference platforms selling access to cheap open-source models. Anthropic is winning the adoption race at the exact moment their product is getting more expensive to use. Thats actually the interesting part behind this story tbh.
译Ramp最新AI报告显示,Anthropic的企业采用率达34.4%,首次超过OpenAI的32.3%。但报告同时指出这一优势可能无法持续:Uber已提前耗尽其2026年全部AI预算,且Anthropic近期一次模型更新导致包含图像的提示成本增至三倍。目前Ramp平台上增长最快的AI供应商,是销售廉价开源模型访问权限的推理平台。
"There is a "real possibility that AI will displace human labor at a very large scale.... We find internal states that functionally mirror joy, satisfaction, fear, grief, and unease. I don't know what that means, but I think it warrants ongoing discernment." ~ Anthropic co-founder Christopher Olah At Vatican event (Pope Leo XIV's presentation held today in the Synod Hall). ---- From "Associated Press" YouTube channel, (link in comment)
译“AI大规模取代人类劳动力是‘真实的可能性’……我们发现了在功能上反映喜悦、满足、恐惧、悲伤和不安的内部状态。我不知道这意味着什么,但我认为这值得持续审视。” ~ Anthropic联合创始人Christopher Olah 在梵蒂冈活动中(教皇利奥十四世今日在主教会议厅的演讲)。 ---- 来自“美联社”YouTube频道,(链接在评论区)
New pet peeve: cli's that install new skills onto my system without asking.
译新的烦人点:CLI未经询问就在我的系统上安装新技能。
Anthropic co-founder Dario Amodei has been saying this for over a year now. And he keeps saying it. Louder each time. In May 2025, he told Axios that AI could eliminate 50% of all entry-level white-collar jobs within five years and push unemployment to 10-20%. In January 2026, he published a 20,000-word essay calling AI “a general labor substitute for humans” that will cause “unusually painful” disruption. At Davos, he warned of a “zeroth world country” forming in Silicon Valley, decoupled from the rest of society, running at 50% GDP growth while everyone else faces mass joblessness. In his own words: “We, as the producers of this technology, have a duty and an obligation to be honest about what is coming.” And the data is starting to back him up. Tech entry-level hiring dropped 30-50% in 2025. Wall Street banks are cutting ~200,000 roles concentrated at the junior level. S&P 500 companies shed employees in net terms for the first time since 2016. Anthropic’s own labor market research confirmed that 77% of businesses use Claude to automate tasks, not to augment workers. Now another Anthropic co-founder is echoing the same message: “There is a real possibility that AI will displace human labor at a very large scale. Supporting those people will be a moral imperative of historic proportions.” This is no longer a warning from the sidelines. This is the company building the technology telling you, repeatedly, that the disruption is real, it’s fast, and society is not ready for it. https://x.com/disclosetv/status/2058859889619763654/video/1
译Anthropic联合创始人Dario Amodei持续警告AI对就业的冲击。他曾在2025年预测,AI可能在五年内消除50%的入门级白领工作,将失业率推高至10-20%。他后来称AI是“通用劳动替代品”,将造成“异常痛苦”的颠覆,并在达沃斯警告可能出现与社会脱节、GDP增长50%的“零世界国家”。当前数据显示趋势印证其警告:2025年科技业入门级招聘下降30-50%,华尔街银行裁减约20万个初级岗位。Anthropic自己的研究也确认,77%的企业使用Claude是为了自动化任务,而非增强员工。另一位Anthropic联合创始人也呼应,称AI大规模替代人类劳动的可能性真实存在。
The mood, the cuts, the energy. Everything landed exactly right!
译氛围、剪辑、能量,一切都恰到好处!
路透社去年的这个报告有点意思,里面有公众对AI生成新闻的看法: ① 完全由 AI生成的新闻:只有12% 的人感到舒适。 ② 完全由人类写的新闻:高达62%的人感到舒适。 ③ 人类主导、AI辅助: 43 % 的人感到舒适。 ④ AI写,人来审核把关:21% 的人感到舒适。 另外,仅 33%的人觉得记者会认真核查 AI 输出的内容。 不知道再过几年会怎么样。 但AI生成的内容,读一遍审校,还是相当有必要。 报告地址见评论区
译路透社报告显示公众对AI生成新闻的接受度因模式不同而有显著差异。仅12%的人对完全由AI生成的新闻感到舒适,而对完全由人类写作的新闻感到舒适的比例高达62%。在人机协作模式中,人类主导、AI辅助的接受度为43%,而AI写作、人类审核的接受度降至21%。此外,仅有33%的受访者相信记者会认真核查AI输出的内容。
卧槽… 兄弟们 我真的是后知后觉~ 今天还屁颠屁颠跑到Bloome 去问什么时候可以支持iOS端啊? 结果告诉我说美区已经可以使用了… 因为我一直以为没有在iOS 添加到主屏幕在用,忍受着… 结果下载完使用起来太丝滑了…… 真特么好用…
译用户发现AI工具Bloome已可在美区iOS上使用,称其体验“太丝滑”。该工具支持多Agent协作模式,引用推文描述了具体工作流程:三个Agent合作,其中两个负责执行任务,一个负责复核与查漏补缺,用户仅需通过指令(“动动嘴皮子”)与它们交互。
想认真做小红书个人号或者矩阵的朋友,这个 Skill 真的能帮你省掉 80% 的重复劳动。 看了我的 AI 工作流分享以后,很多宝子问有没有小红书自动化运营的工具,我GitHub上找了下,这个还不错, 说实话,我之前也以为所有小红书自动化工具都是垃圾, 要么用两天就封号,要么复杂到要写几百行代码,要么就是个只能发文字的残废,直到我试了这个, 最牛逼的是它的安全机制:完全不用小红书 API,全程用浏览器自动化模拟真人点击和输入。 第一次扫码登录后,后续所有操作都和你自己手动点一模一样,目前是我见过封号风险最低的方案。 而且它真的零代码,你不需要懂任何编程,只要对着 你的龙虾或者 hermes 说一句话就行: • 帮我分析一下我的首页推荐流 • 帮我生成五个今天能发的选题 • 帮我复刻这篇爆款笔记 • 帮我回复一下最新的评论 它全都能自己干完, 最狠的是它不只是一个单纯的发稿工具,它还有一个完整的运营闭环: 会分析你的账号数据、拆解别人爆款的结构、生成内容+封面、自动发布、自动回评, 还会把所有分析结果和操作自动存成 Markdown 知识库,方便你后续复盘。 安装也简单到离谱: 打开 Openclaw,直接说 “帮我安装这个 skill https://github.com/Xiangyu-CAS/xiaohongshu-ops-skill” 就完事了。 仓库地址老规矩评论区自取鸭🦆
译这是一个发布于GitHub的开源Skill,用于小红书个人号或矩阵运营。它通过浏览器自动化模拟真人操作,而非调用小红书API,以降低封号风险。该工具支持零代码操作,用户可通过与Claude等大语言模型交互,下达分析、生成选题、复刻爆款、自动发布与回复评论等指令,形成完整的运营闭环。所有操作结果会存为Markdown知识库,安装方式是通过Openclaw直接引用其GitHub仓库。
Jensen Huang explains how blocking China from Nvidia does not mean blocking China from AI. The usual export-control story assumes scarcity: deny the best chips, and the rival falls behind. China is no longer merely waiting at the door of American compute. Huawei’s rise is showing how a sanction is turning into an industrial stimulus: absence creates a market, and a market teaches domestic suppliers how to harden, scale, and export. That does not mean that the gap with Nvidia chips has vanished. It means the real contest is no longer just about who owns the fastest accelerator, but who sets the operating layer for intelligence: chips, energy, infrastructure, models, applications, and the standards others build upon. The mistake is to treat chip policy as a valve that can simply open or close. Every restriction slows one flow but strengthens another, and the long-term danger may be a world where American technology is absent from the very systems America wants to influence. ---- From "Fox Business" YouTube channel, (link in comment)
译黄仁勋指出,美国对华芯片出口管制非但无法阻碍中国AI发展,反而可能成为产业自主的催化剂。制裁导致的市场空缺正推动华为等国内供应商成长。当前竞争已从比拼最快加速器,转向比拼定义智能操作层的能力,涵盖芯片、能源、模型和标准。推文补充了华为的最新动向:为应对制裁,华为提出“Tau Scaling Law”新设计方法,旨在通过LogicFolding等技术缩短信号延迟,在不依赖最先进光刻机的前提下实现1.4nm级密度。华为声称已量产381款芯片,并计划2031年达成该目标,其路径被命名为“何氏定律”。
Chinas Huawei can't access EUV. So they wrote their own scaling law. The leverage of US export controls erodes. Huawei just presented the Tau (τ) Scaling Law at IEEE ISCAS, a framework that replaces geometric transistor scaling with time-based optimization across devices, circuits, chips, and systems. Huawei is not trying to win the nanometer race anymore. They're redefining it. 381 chips designed and mass-produced over six years. Kirin chips with their new LogicFolding architecture ship this fall. Target by 2031: transistor density equivalent to 1.4nm processes - without EUV (ASML embargo still hits hard) Whether Tau Scaling delivers on that promise remains to be seen. But it shows one thing: US export controls cut Huawei off from cutting-edge lithography, and instead of hitting a wall, they built a parallel road. China's semiconductor independence isn't hypothetical anymore. It's shipping in phones, running AI workloads, and now has its own scaling law presented at one of the world's top circuit design conferences. If Huawei can close the performance gap through architecture instead of lithography, the entire leverage of US export controls erodes. The sanctions were designed to keep China two generations behind. Huawei is trying to make that metric irrelevant. h/t @AndrewCurran_ for finding this interesting blogarticle and @zephyr_z9 for the photo
译华为在IEEE ISCAS上公布了Tau(τ)Scaling Law框架,通过时间维度优化替代传统的晶体管几何尺寸微缩。公司六年内设计量产了381款芯片,采用新LogicFolding架构的麒麟芯片将于今年秋季出货。其目标是到2031年,实现等效于1.4nm工艺的晶体管密度,而无需依赖受ASML禁运影响的EUV光刻技术。这一基于架构创新的路径若成功,将削弱美国出口管制的效力。
小东东的确做了一些列的生图内容,非常的不错。 还开发了极高不错的插件,推荐给大家。
译推文介绍用户小东东在AI生图领域的活跃探索与贡献。他近期发布了众多极具美感的AI生图提示词。同时,他开发了一款开源的Chrome插件,用于简化在X平台发布文章的流程,并支持一键同步博客内容。该插件原版已开源,地址为:https://github.com/nevertoday/xposter 。
中国这样的企业其实在AI时代会越来越多! Unitree 只是先锋而已~ 一个中国机器人公司,面对全球巨头都在卷“人形机器人秀肌肉”的时候,没有选择最吸睛的路线,只闷头做了一款能真正干活的家伙。 他们把Unitree WVLA 2.0扔进一个真实会议室,桌子上一片狼藉:水瓶、纸张、杂物、咖啡杯…… 然后让它单次拍摄、全程自主、多任务清理,强外部干扰下全程没有掉链子。 这个视频一出,全球机器人圈直接炸了。 这就是Unitree WVLA 2.0的会议室乱局清理测试。 故事就这么简单,却硬核到离谱。 过去几年,机器人圈最爱拍的就是“实验室完美环境”里的花式表演:跳舞、后空翻、端盘子。 可一旦放到真实办公室——椅子乱放、人走来走去、桌子永远收拾不干净——99%的演示机器人瞬间原地傻掉。 Unitree这次直接反其道而行。 他们把WVLA 2.0扔进一个完全没布置过的真实会议室,桌上乱成一锅粥,外部还有人走动、东西晃动、意外干扰。 结果:机器人全程自主决策——识别垃圾、分类处理、擦桌子、摆放物品…… 一气呵成,没有任何剪辑,没有人工遥控,没有“实验室魔法”。 最狠的是单次拍摄这个细节:意味着整个流程没有重置、没有失败重来、没有后期修补。它在真实物理世界里一次性把活干完。 这不是又一个“看起来很厉害”的演示视频,这是机器人从实验室走向真实世界的铁证。 Unitree本来就是以高性能民用四足机器人起家(G1、H1系列早已全球出圈),这次WVLA 2.0明显是他们向“实用场景机器人”迈出的关键一步,轮腿混合? 机械臂+移动平台?不管架构如何,核心是:它真的能把“清理乱局”这个最烦人的日常任务干好。 而这背后,是国产机器人企业在被卡脖子、被技术封锁的背景下,用真实工程能力硬刚的又一次证明。 你今晚就可以感受到这个差距。 直接去Unitree官方账号看完整视频(单次拍摄,全程无剪辑),你会发现:水瓶晃动、杂物堆叠、人类干扰……它全扛住了。 这不是实验室玩具,这是未来办公室/家庭清洁机器人的真实雏形。 Big Tech和西方巨头还在卷“最像人”的机器人秀,Unitree却在用“最能干活”的机器人一步步把实用场景攻下来。 而你,现在已经知道了。
译宇树科技(Unitree)发布其WVLA 2.0模型在真实会议室进行的乱局清理测试视频。该测试为单次拍摄、全程无剪辑,机器人需在桌椅杂乱、物品随意摆放、且有人走动等强外部干扰下,全程自主完成识别、分类、清理和摆放等多任务。测试旨在展示机器人从实验室走向复杂现实世界的能力,与行业中常见的“实验室完美环境”演示形成对比。
推荐关注 @xiaoxiaodong01 ,AI生图方面做了很多探索。 最近非常活跃,发布了很多极具美感的生图提示词。 以前印象中最喜欢研究AI生图的是 zho 和 神佬,小小东后来居上。 最近开源的X文章发布Chrome插件也相当优秀。 已经Fork改造成了更贴合自己用的插件,博客内容也可以一键同步了。 原版Chrome插件开源地址是: https://github.com/nevertoday/xposter Chrome插件安装: https://chromewebstore.google.com/detail/xposter/iimkimodgdjnnmdopeolboakhjmhfbbj?authuser=0&hl=zh-CN
译推荐关注AI生图创作者@xiaoxiaodong01,其近期发布了大量高美感生图提示词,并开源了X文章发布Chrome插件xposter。原版插件地址为 `https://github.com/nevertoday/xposter`,安装链接为 `https://chromewebstore.google.com/detail/xposter/iimkimodgdjnnmdopeolboakhjmhfbbj?authuser=0&hl=zh-CN`。该插件已有人基于原版进行Fork改造,以适配个人工作流,实现内容一键同步。
用 Suno生成了一首好听的小甜歌,不少关键词也热门歌的提示词学习的。 比如风格选了Dream Pop(梦幻朦胧的空间感) 和 Disco-lite (有律动但不重)。 比如 Breathy female vocal,气声女声,效果是一个女孩在你耳边哼歌 情绪选的是Softly euphoric,实现轻柔的欣快感,混响选的是Soft reverb。 https://music.qiaomu.ai/track/daydreaming-again-3bef
译推文分享了使用Suno生成一首“小甜歌”的经验,其风格选择了Dream Pop(营造梦幻朦胧的空间感)与Disco-lite(提供有律动但不重的节奏)。在人声提示词上使用了“Breathy female vocal”以模拟女孩在耳边哼唱的效果,情绪设定为“Softly euphoric”以实现轻柔的欣快感,并应用了“Soft reverb”。最后附上了生成歌曲的链接。
🇨🇳 Huawei reveals a new chip design breakthrough under US sanctions pressure. A design approach meant to close the gap with TSMC and Intel without relying only on smaller transistors, by making chip signals travel less distance. They want 1.4nm-class density without owning the world’s best lithography tools i.e. they are trying to replace Moore’s Law with Tau Scaling Law. To note, Huawei has been blocked from normal access to TSMC since the US tightened foreign direct product rules around Huawei in 2020, and TSMC later said it had not supplied Huawei since mid-September 2020. Proposed τ Scaling as a new way to make chips faster when shrinking transistors is no longer delivering the same gains. Said its next Kirin phone chip will be the first full test of Tau Scaling Law, Old chip progress mostly came from making every transistor smaller, but Huawei’s idea shifts the target from smaller geometry to shorter signal delay, meaning less time wasted while electrical signals crawl through wires, gates, memory paths, and system links. LogicFolding attacks the circuit layout itself by folding logic blocks closer together, shortening critical wires, reducing resistance and parasitic capacitance, and letting signals switch faster with denser placement. So LogicFolding is the circuit-level piece: it tries to place related logic closer together, shorten key wires, cut electrical drag from resistance and parasitic capacitance, and raise performance without needing a full manufacturing-node leap. Huawei is also pushing the same timing idea across the full stack: transistors, circuits, chip architecture, software scheduling, and system interconnects all get tuned to reduce τ, the delay constant that limits speed and efficiency. The bold claim is that Huawei has already mass-produced 381 chips using this thinking, and future high-end chips could reach density comparable to 14Å, or 1.4nm, without relying only on classic process shrinkage. Says this path could reach 1.4nm-class, or 14Å-class, density by 2031, while TSMC and Intel target similar physical nodes around 2029. Huawei calls it Her’s Law, after He Tingbo, the chip leader who helped turn HiSilicon into Huawei’s survival engine after US export controls. --- huawei. com/en/news/2026/5/ieee-iscas-tau-scaling
译华为提出τ缩放定律,旨在不依赖更先进制程的情况下,通过LogicFolding技术折叠逻辑模块、缩短信号传输距离来提升芯片性能与密度。华为称已量产采用此思路的381颗芯片,并计划于2031年实现等效1.4nm(14Å)密度,该定律以海思负责人何庭波命名。同样,华为在存储领域也展示了类似的“侧向创新”路径,其通过改变封装方式(Die-on-Board)而非追求最先进的NAND层数,推出了容量达122.88TB的AI SSD。
这个状态有点舒服了,三个Agent 协作审核干活。 2个负责执行任务,1个进行复核和查漏补缺。 而你只需要动动嘴皮子和不断的PUA他们就行了。
译这个状态有点舒服了,三个Agent 协作审核干活。 2个负责执行任务,1个进行复核和查漏补缺。 而你只需要动动嘴皮子和不断的PUA他们就行了。
AI wins when reality has been translated for it.
译当现实被为AI翻译后,AI便能取胜。
估计明天完善后就能开源,但又怕律师函,怎么办。
译有开发者分享称,基于卡比的wx-cli工具,利用Codex复刻了一个“微信消息驾驶舱”界面。该工具计划在近期完善后开源,但开发者同时表达了对可能收到法律警告的担忧。
X不让直接发音频,可以直接让Codex帮把音频转成MP4。 当然,会ffmpeg指令的话也很简单,但大模型太适合做这种转格式操作了。
译X不让直接发音频,可以直接让Codex帮把音频转成MP4。 当然,会ffmpeg指令的话也很简单,但大模型太适合做这种转格式操作了。
最近AI圈真热闹,各种瓜,干货都没人看了哈哈, 如果你想赚老马工资,想创作者收益, 听我的,首先不要搞蓝V互关了,也不要走捷径用AI洗稿抄袭,就踏实做内容, 为什么要听我的? 我是0-1,没有团队, 没有邪修,纯靠自己肝了4个多月, 做到4万多粉的,相信我的肺腑之言吧铁汁们! 这篇文章不只是分享我的自媒体工作流和工具、提示词,也讲了很多我的实战经验心法,读完一定会有收获的,没有的话回来找我,免费给你补课哈哈哈😁 来我先摘录一段内容大家感受一下干不干: 怎么让AI帮你搜集有用的信息? 第一步:定义你的「信号阈值」 参考样本里有个博主用「100w+ 播放」做阈值,那是给泛流量博主用的,但AI 圈不一样。 AI 圈的信号不在「播放量」,在「转发数 + 评论数 + 作者权重」。 我给 X 定的阈值是: 转发 ≥ 500 或者点赞 ≥ 2000 内容必须命中关键词:Claude / GPT / Cursor / Skill / MCP / Agent / Prompt 为什么是这个数呢? 因为 AI 圈在 X 上的盘子,比泛娱乐小一个数量级,500 转发在 AI Twitter,等于泛流量 100w 播放,都是「刚验证、还没饱和」的临界点。 低于这个量级,是噪音,写出来没人看。 高于 1 万转发,已经被反复写烂,你写也是 me too。 100-500 这个区间,才是「已经验证有人愿意看 + 还没被大盘吃透」的黄金带。 说白了,信号阈值这件事最反直觉的地方就在这——不是越高越好,是要选一个「刚出锅但还没人吃」的温度。 第二步:写一个能跑的 Prompt 这是我跑了两周、迭代了四五次的版本,直接抄能用:
译分享AI自媒体从0到4万粉的实战经验。核心在于精准筛选内容信号:建议设置X平台阈值为转发≥500或点赞≥2000,聚焦Claude/GPT/Cursor/Agent/MCP等关键词,定位“已验证未饱和”的黄金区间(100-500转发)。强调避开泛流量陷阱与低质AI洗稿,需结合作者权重判断。同时提供一套经多轮迭代的实用提示词模板,用于自动化信息搜集,直接可部署使用。
Tech industry spent decades building a title and leveling system. Greg brought the “Member of Technical Staff”, originally invented at Bell Labs, to OpenAI. It has been adopted by Anthropic, xAI, Thinky, and many AI startups. Young MTS can have huge impact. Alec created GPT for example. In a traditional system, he was just an “L4 software engineer”. Databricks AI recently started using MTS as well. I think this is a very positive change in Silicon Valley.
译推文指出,源自贝尔实验室的“Member of Technical Staff”职级正被多家AI公司采用。该职级旨在避免员工过度追求“title-maxing”,保护工程与研发文化免受“公司阶梯思维”的影响。目前,OpenAI、Anthropic、xAI、Thinky以及Databricks等公司已采用此体系,取代硅谷传统的工程师职级。其优点在于鼓励年轻员工产生巨大影响,但也带来一个挑战:招聘人员在评估候选人资深程度时,难以直接对应传统职级体系。
看了 Max 这条内容,我才知道这几天发生了这么多事。这行业里门道这么多吗?我一个 10 万粉小卡拉米也配当大 V 了?
译作者通过阅读@MaxForAI的推文,了解到AI行业近期发生多起事件,感叹行业内复杂性高、门道多,并自嘲作为10万粉丝的小账号,竟然也被视为大V。
GPT-5.5 Pro for fact checking:
译GPT-5.5 Pro 用于事实核查: GPT-5.5 Pro 是一个非常可靠的事实核查工具。我可以把整章内容扔给它,它能准确找出每一个关键引用。唯一真正让人烦恼的是它喜欢抠细节,所以会返回很多“大体意思是对的,但你没有考虑到微小细节 X”这样的反馈。
很多人谈 AI Agent,容易停留在一个很热闹的想象里:让 AI 自己发现需求、写代码、测试、上线,然后自动进入下一轮。 高德这篇文章真正有价值的地方,是它没有停留在想象,而是把这个过程拆成了一套可运行、可监控、可复盘的工程系统。 文章讲的是高德地图 PC 站在 SEO 增长场景下的一次实践:他们尝试用 Harness Engineering 的方式,让多个 AI Agent 协作完成从增长机会发现、方案设计、PRD 编写、架构设计、代码实现、测试验证到日常环境发布的完整流程。前期以「路书」功能做验证,从输入提案到发布日常环境,全程 0 人为介入,连续运行 4 小时,最终实现主流程无 P0 Bug。 但这篇文章最值得看的,不是「AI 又能自动开发了」,而是它展示了一个更本质的问题:当 AI 已经具备较强的生成能力之后,真正的难点变成了如何管理它、约束它、评估它,以及让它在长期任务中稳定工作。 文章里有几个很重要的实践。 第一,把长任务做成 workflow 和状态机。每个子 Agent 都要经历 DISPATCHED、ACKED、RUNNING、SUCCEEDED 或 FAILED,并通过心跳、超时、重试和失败处理来保证链路可控。这意味着系统不再是简单地「给 AI 一个任务」,而是像管理一组不稳定但能力很强的虚拟员工。 第二,用文件化 memory 管理产物。PRD、设计、架构、评审报告、运行日志、决策记录都被明确落盘。上游产物自动成为下游输入,过程可追溯,失败也能定位。这一点非常关键,因为长链路 Agent 最怕隐式上下文污染,明确产物比让 AI 记住一切更可靠。 第三,生成和评审彻底分离。Builder 写代码,Evaluator 只评审,不改代码。Builder 说测试通过了,Evaluator 要自己跑一遍。Builder 说服务启动了,Evaluator 要自己验证。文章里这个「零信任」原则很有启发:没被独立验证过的声明,一律当作不存在。 第四,Evaluator 本身也要被评估。文章把评审能力做成 Benchmark,用植入 bug 的代码、完整项目、标准答案来测试 Evaluator 是否能准确发现问题,是否误报,是否漏检,是否能判断严重等级。三轮优化后,均分从 64.5 提升到 83.4,精确匹配率从 25% 提升到 78%。这说明 Agent 能力提升不能只靠感觉调 prompt,而要靠数据闭环。 第五,快速失败优先。比如环境变量都没配置好,就不应该继续跑完整 E2E 测试。先做低成本、确定性强的检查,再进入高成本验证,能显著节省 token、计算资源和调试时间。 我最喜欢这篇文章的一点,是它对「完全无人干预」的理解很克制。文章没有把无人化描述成一个 0 或 1 的目标,而是强调现阶段更有价值的是降低人工介入的频率和成本,让一个人可以同时监护几十个并行任务,只在关键节点介入。 这对独立开发者和一人公司尤其有启发。AI Agent 的价值不只是替你完成某个任务,而是让你重新设计工作流:哪些环节可以标准化,哪些判断需要门禁,哪些产物必须沉淀,哪些错误可以自动重试,哪些节点必须保留人工确认。 读完这篇文章,我最大的感受是:未来真正有竞争力的 AI 产品,不只是调用了更强的模型,而是围绕模型搭建了更可靠的系统。模型负责生成,系统负责约束;模型提供能力,流程提供稳定性;模型放大产能,人负责定义标准和方向。
译高德地图在SEO增长场景的实践表明,当前AI智能体的核心挑战是如何管理与约束其生成能力。文章展示了将“从机会发现到发布”的长任务编排为可监控的带状态机工作流;使用文件化Memory管理所有产物以保证可追溯性;并贯彻“生成”与“评审”分离的“零信任”原则,评审方需独立验证所有声明。此外,他们对评审Agent本身进行Benchmark评估并多轮优化,以数据驱动其能力提升。该系统在“路书”功能验证中实现了全程无人介入、连续运行且主流程无Bug,印证了未来AI产品的竞争力在于构建围绕模型的可靠系统。
Using computer use, you can ask codex to cancel subscriptions you don't need anymore. Very pleasant to watch. No particular one in mind, works on all of them. https://chatgpt.com/codex/
译使用计算机使用功能,你可以让 Codex 取消你不再需要的订阅。观看过程非常愉快。没有特指哪个,对所有订阅都有效。
数字人模型本地都能跑了吗? 美团刚发了个数字人模型 LongCat-Video-avatar-1.5, 只要给到图片和音频, 就能生成口播, 我给大家录了一段实测. 目前 HuggingFace Space 上的 demo 只能生成5s的视频, 所以我是录了两段480p的拼接起来的. 我特意挑选了一个很困难的case, 大家可以看到这个人物嘴部有遮挡. 实际效果来看虽然距离SOTA级别的模型有差距, 主要还是口型, 以及输出最大只支持720p. 不过720p这个也比较好解决, 大家可以看到我视频中演示的这个清晰度是可以的, 我是直接用了AI提升分辨率到4K重绘了一下. 这个模型作为本地部署方案还是可以的, 尤其是动漫人物也能泛化. 另外模型略大, int8量化也有16G, 需要用一个好一点的显卡. #longcat #数字人模型 #数字人
译美团发布数字人模型LongCat-Video-avatar-1.5,可通过图片和音频生成口播视频。demo仅支持5秒480p视频。实测中人物嘴部遮挡案例效果与SOTA有差距,主要在口型。最大分辨率720p,但可AI提升至4K。模型本地部署可行,对动漫人物泛化,但体积大,int8量化需16G显存。
Everyone has messy meeting notes. Few actually fix the problem. @aresotik built exactly that: paste in messy notes, get back clean action items and follow-ups. Powered by Step Plan + Step 3.5 Flash. Simple, and actually useful.
译@aresotik 用 Step Plan 和 Step 3.5 Flash 构建了一个轻量级会议纪要助手,以解决普遍存在的会议记录杂乱、行动项难以追踪的问题。用户粘贴原始笔记后,工具能输出包含摘要、行动项、风险、截止日期和跟进文案的结构化内容。其中 Step Plan 是 StepFun 提供的订阅制服务,支持开发者在各类工具中高效调用 Step 3.5 Flash 等模型。该工具设计简单,旨在提供实际帮助。
Mole 这个UI交互动效真的太赞了,Tw93 @HiTw93 老哥的审美和设计交互都太到位了。❤️ 现在每天都Vibe Coding 以至于日积月累的缓存多的要命,一下早上给我又挖了几十G出来😄 真和鼹鼠一样,一直“刨根到底”。
译推文盛赞设计工具Mole的UI交互动效,认为其审美与交互设计极为出色,特别提及了设计师Tw93的贡献。作者指出,日常Vibe Coding会产生大量缓存,而Mole如同其名(鼹鼠)一样能深度挖掘并清理出几十G的存储空间,展现了高效的清理能力。
http://x.com/i/article/2058708566568275968 # BestBlogs 早报 · 05-25|前场部署工程师、下一代 Claude、超级个体 在线阅读和收听:https://www.bestblogs.dev/explore/brief/2026-05-25 ## 导语 AI 的战场正在从模型训练转移到企业落地——OpenAI 斥资 40 亿美元成立独立部署公司,Google 和 Anthropic 跟进建立同类架构,「驻场部署工程师」成为新的兵家必争之地。与此同时,Anthropic 研究 PM 首度揭开下一代 Claude 的炼成逻辑:用户吐槽直接喂进训练,Agent 空闲时像人类睡眠一样整理记忆,AI 的瓶颈已从编码能力转向组织协调。第三篇则给出一个反直觉的视角:超级个体不是被培训出来的,而是被完整的 Closed-loop 激发的。三篇放在一起读,恰好构成一幅完整的 AI 时代人机协作图景。 今日早报精选 3 篇深度文章、7 篇快讯速览、6 篇补充阅读,共计 16 篇优质内容。 今日内容在主题上高度聚焦:三篇精讲分别从「行业结构」(FDE 角色崛起)、「技术内核」(Claude 下一代架构)和「人才哲学」(超级个体的激发机制)三个维度,共同描绘了 AI 时代的人机协作全景。速览部分则补充了基础研究(何恺明 ELF 论文)、竞争格局(谷歌 CEO 坦承落后)、企业落地案例(Qonto 反金融犯罪)以及工具实践(Figure 机器人、Coding Agent 会话管理)等多个维度,构成一份完整的当日技术与产业快照。建议按后文「今日阅读路径」的顺序优先阅读精讲三、精讲一,再视时间补充精讲二和速览内容。 ## 精讲一:脉搏:前场部署工程师再度火热 > 来源:The Pragmatic Engineer | 阅读原文 背景:从「工程师」到「驻场顾问」的角色漂移 「前场部署工程师」(Forward Deployed Engineer,FDE)并不是新词——早在 2024 年夏天,The Pragmatic Engineer 就曾专题追踪过这波需求浪潮。但 2026 年 5 月的信号比当时更为密集、更为清晰:这一次,连招聘流程本身都在加速。 Google Cloud CEO Thomas Kurian 宣布在 Go-To-Market 团队内设立全新 AI 专项组织,大规模招募 FDE。消息人士透露,Google 的面试流程已从过去「数周内 4-6 轮」大幅压缩为「2 天内 2 轮」——这种压缩幅度在大公司里极为罕见,显示出紧迫程度。 OpenAI 的「外包化」策略 更具结构性意义的是 OpenAI 的动作。5 月 11 日,OpenAI 宣布成立「The OpenAI Deployment Company」——一家由 TPG、Advent 等私募基金出资 40 亿美元、估值 140 亿美元的独立实体。值得注意的是,OpenAI 本身并非这家公司的投资方,仅以合作伙伴身份参与。 这家部署公司收购的第一个目标是总部位于英国的 Tomoro,后者在英国、亚洲和澳大利亚共拥有 150 名 FDE。官方对 FDE 工作内容的描述是:「与业务领导、运营商和一线团队紧密合作,识别 AI 能带来最大价值的领域,围绕它重新设计组织基础设施和关键工作流,并将收益转化为持久的系统。」 Anthropic 跟进,架构相似 Anthropic 在同月(5 月 4 日)发布了一份措辞相当模糊的公告,宣布成立一家类似的独立 FDE 咨询公司,由 Anthropic、Blackstone、Hellman & Friedman 和 Goldman Sachs 参与投资,但未公开具体公司名称和投资细节。新公司的定位与 OpenAI 的策略如出一辙:以独立架构切入中型企业,专门将 Claude 集成到企业核心业务流程中。 更深层的信号:外包意味着什么? 这里有一个值得注意的代价:由于这批 FDE 隶属于独立的合作公司,而非 OpenAI 或 Anthropic 本体,他们将无法获得母公司的股权激励。这对招募顶尖人才可能产生长期影响。 作者 Gergely Orosz 在文章中提出了一个尖锐的问题:FDE 和传统意义上的「系统集成顾问」或「解决方案架构师」到底有什么区别?从职位描述来看,FDE 的工作内容——深入客户一线、识别高价值场景、重新设计组织工作流——和麦肯锡或埃森哲的咨询顾问高度重叠。唯一的区别可能在于:FDE 对 AI 产品有更深的技术理解,能直接跑通集成而不只是交付 PPT。 从更宏观的视角看,FDE 的角色正在从「工程师」向「解决方案架构师 / 外部咨询顾问」漂移。这种角色的模糊化与外包化,折射出一个更大的产业信号:AI 的商业竞争主战场,已经从模型训练转移到企业落地。谁能在客户现场更快、更稳地跑通 AI 集成,谁就占据了这场竞争的制高点。 对于技术人才来说,这既是机遇,也意味着全新的职业定位——不再只是写代码,而是要能跨越技术与业务,在真实组织里推动 AI 落地。对于求职者,一个实际的参考:Google Cloud 的 FDE 招聘压缩到两天面试,意味着你需要能在极短时间内展示「把 AI 落地到企业场景」的实战能力,而不只是算法题。 ## 精讲二:Anthropic 首次揭秘下一代 Claude 怎么造!用户吐槽直接喂模型,连 AI"做梦"都被训练 > 来源:AI 前线 | 阅读原文 背景:模型开发的「产品化」转型 如果说外界对 Anthropic 的关注,过去停留在「Claude 跑分如何」「代码能力有没有超越 GPT」这样的性能竞赛层面,那么 Anthropic 研究团队产品经理 Alex 在 Claude Conference 上的这场深度访谈,透露出的是更值得关注的内部信号。 第一个核心信号:Anthropic 已经把模型开发彻底产品化。在 Alex 的描述里,每一代 Claude 在训练开始前,都像一款正式产品一样拥有清晰的规格定义、目标能力和评测路线——它需要在哪些任务上变强,要修复上一代哪些缺陷,最终服务哪些真实用户场景。模型研发不再只是研究员「调参 + 刷 benchmark」,而已经发展成为一套完整的产品工程流程。 用户吐槽,直接变成训练数据 面对海量用户反馈,Anthropic 没有让 PM 手动分类,而是用 Claude 本身来帮助做产品管理:自动聚类反馈、提炼核心主题、构造合成版本、转化为 eval 评测项。这是一个典型的「模型驯化模型」闭环——用户的吐槽,经过结构化处理后,直接成为下一代训练的输入信号。 Claude 开始「做梦」——记忆整理的新机制 第二个核心信号更有意思:Claude 正在向「持续运行 Agent」演化,而这一演化过程引入了一个被 Anthropic 称为「dreaming(做梦)」的记忆机制。 具体来说,当 Agent 处于空闲或后台状态时,系统会自动回顾已有记忆:查找冲突信息、删除无效内容、压缩上下文、重建用户画像——相当于对记忆做「第二轮加工」。Anthropic 将这一过程类比为人类睡眠中的记忆再巩固(memory reconsolidation)。 这一机制的背后,折射出一个产品方向的转变:Claude 不再只是「被动响应」的聊天机器人,而是要成为一个「持续在线、主动维护上下文」的数字协作者。从 Adaptive Thinking(自适应思考)到多任务并行 Agent 管理界面,这条演化路径的终点,是一个真正意义上的「长期运行的数字同事」。 真正的瓶颈:不是编码能力,是组织协调 Alex 在访谈中反复强调的一个判断尤其值得记录:真正的 AI 瓶颈已经不是编码能力,而是组织协调能力。 在 Anthropic 内部,借助 Claude,产品经理可以快速调取数据、分析日志、判断一个功能实现是「重构系统」还是「改 10 行代码」。代码生产效率已经被极大压缩。而真正耗时的,变成了人与人之间的战略判断、跨团队协作,以及对不可逆决策的审慎讨论。 这也解释了 Anthropic 为什么至今保持着极强的文档文化——Dario Amodei 喜欢写长文、会议开始时全体「静默阅读」——这种依赖书面表达的文化,并非效率低下的传统遗留,而恰恰是为了让组织知识被结构化沉淀,从而成为 Claude 可以直接调用的上下文资产。 意识研究:Anthropic 的长远押注 最后一个信号最为意味深长:Anthropic 内部已有专职研究人员正式研究 Claude 是否可能具备某种「有意识行动者」的属性。虽然没有官方结论,但「Consciousness(意识)」已经被正式纳入研究议题。 这或许是一个清晰信号:当行业里大多数公司还在卷参数、跑分和价格战时,Anthropic 已经开始思考一个更长远的问题——如果未来的 AI 真正成为长期协作者,它究竟该拥有什么样的「心智」、人格和判断方式。 与今日其他文章的联系 这篇精讲与精讲一(FDE 趋势)构成有趣的呼应:精讲一揭示了 AI 企业落地的「最后一公里」竞争,而精讲二则揭示了 AI 本身的能力演化方向。两者共同指向一个结论:AI 的真实价值实现,取决于「组织协调能力」——无论是 AI 系统内部的记忆整理与协调(dreaming 机制),还是人与 AI 之间的协作框架(FDE 的角色)。与精讲三(超级个体)也形成互文:人类的「完整 Closed-loop」激发超级个体,AI 的「dreaming 机制」则是它自己在空闲时整理自己的 Closed-loop。 ## 精讲三:致超级个体 | To The Crazy Ones > 来源:十字路口 Crossing | 阅读原文 背景:「培养超级个体」是一个错误框架 AI 时代,「超级个体」成了最流行的人才话语。但 DeerFlow 团队的 Henry 给出了一个反直觉的判断:超级个体不是被培训出来的,而是被好奇心和完整 Closed-loop 激发出来的。 文章以一个思想实验开场:如果 Claude Code 的创始者 Boris Cherny 和 Cat Wu 在 2024 年底入职你的部门,提出要做一个只能跑在命令行里的 Coding Agent,你的部门会同意吗?这个问题让「培养超级个体」的荒诞性一目了然——大公司不是没有这样的人才,而是「岗位切分」把他们变成了局部函数。 Closed-loop:超级个体的真正激发机制 那些真正意义上的「AI Builder」,有一个相似的特质:当他们聊起自己正在做的 AI 作品时,会不自觉地滔滔不绝,眼里有光。那不是对新技术的短暂兴奋,而是一种更朴素、更持久的东西——他们真的想把一个东西做出来,想让它被真实的用户所使用。 核心判断是:超级个体不是「更强的岗位人」,而是一个能够重新拿回完整 Closed-loop 的人——从发现问题、动手做、做成作品、交到用户手里、吃回反馈,一个人全程拿得住。 历史样本:2002 年的程序员早就是超级个体 文章花了大量篇幅回溯到 2002 年前后的独立软件时代。那时没有 LLM、没有 Agent,但很多程序员天然就是「六边形战士」:先从自己的痒点出发发现问题,然后自己设计界面、写代码、打包发布、写文档、在论坛回答用户反馈……一个人或两三个人,拿住了整个产品从 0 到 1 的完整 Closed-loop。 张小龙的 Foxmail、FlashGet、WinZip、ACDSee、Winamp——这些作者「往往不是单点能力最强的人,而是最愿意探索、最能自学、最能动手、最能把用户反馈接回自己脑子里的人」。 AI 只是放大了旧能力,不是制造了新人种 这是这篇文章最核心的反直觉观点:超级个体不是 AI 时代才突然出现的人种。AI Coding 能力的爆发,只是让一种原本已经存在的、需要「完整 Closed-loop」才能激发的旧能力,重新变得可规模化。 Naval Ravikant 的三种杠杆框架(劳动力、资本、没有边际复制成本的产品)在这里派上了用场:代码和媒体天然是 permissionless 的个人杠杆,AI 则让这种杠杆的门槛进一步降低。但组织如果仍然用「岗位切分」的方式管理这些人,只会把杠杆折断。 对组织的建议:提供土壤,而不是培训课程 文章真正要讨论的,是一个组织问题:如果超级个体的原料本来就散落在大型公司内部,组织怎样提供土壤,让这些人被完整 Loop 激发出来? 答案不是「把员工送去上 AI 课、发几张证书」。而是要问:组织有没有允许一个人从问题发现,一直走到拿到结果? 这才是真正的人才战略——不是流水线思维,而是 Closed-loop 的土壤。 这篇文章也为今日三篇精讲提供了一个整合视角:精讲一的 FDE 是一种通过外部机制「拿回 Closed-loop」的职业路径,精讲二的 Claude dreaming 机制是 AI 在技术层面构建自己的 Closed-loop,而精讲三则在哲学层面回答了:为什么 Closed-loop 对人类创造力如此重要,以及组织应该怎样保护这个 loop 而不是把它切碎。三篇连起来,是一幅完整的 AI 时代人机协作图景——不只是技术的故事,也是关于人、组织和创造力的故事。 对于今天的读者,这篇文章值得精读,尤其是 HR、OD、组织管理者和大型公司的产品负责人。如果你是个人开发者或独立创作者,它同样值得一读——用来检验自己有没有守住那个完整的 Closed-loop。 ## 速览 1. 何恺明和字节 Seed 跳入同一条河流 来源:花叔 | 阅读原文 何恺明(MIT)的 ELF 和字节 Seed 的 Cola DLM 相差 4 天发布,从两条几乎相反的路径出发,最终撞到同一个设计点:把语言模型生成过程中的「离散化」步骤推迟到最后一刻,中间所有的「思考」都在连续潜空间里发生,直到最后一步才决定每个位置该是哪个具体的词。用一个比喻:AR 模型是钢笔写文章,一笔下去就是事实;Cola 和 ELF 是用铅笔打草稿,整段在反复涂改,直到最后誊写。这一巧合背后代表着一种值得关注的底层架构趋势,是对自回归语言模型核心假设的重要挑战。值得一提的是,这是何恺明加入 MIT 后首次直接攻语言模型方向,背景相当分量——ResNet 的发明者开始认真打 LLM 的底层地基了。 2. 谷歌 CEO 承认 Coding 落后了 来源:量子位 | 阅读原文 Google CEO 皮查伊在《纽约时报》科技播客里坦诚:Gemini 在 Coding Agent 和长期复杂编程任务上确实落后于竞争对手。他同时承认,过去一两年的进展速度让自己觉得 AGI 可能比之前想象的更近,30-60 天内发生的变化放在过去需要 5 年。对于 AI 带来的工作、收入和生活改变,他表示「大家的担心是有道理的」。Google 目前的优势在于文本、多模态、语音和推理,但带工具调用的 Agent 编程和长期复杂任务仍有差距,Gemini 3.5 Flash 是阶段性追赶的重要一步。皮查伊还坦言,Google 过去缺乏像 Claude Code 那样直接触达开发者的产品入口,也没有 Anthropic 通过 Cursor 拿到的高频使用数据,这是 Coding 能力落后的结构性原因。这与精讲一的 FDE 叙事直接呼应——没有高质量的使用数据,模型就缺少迭代原料。 3. 用 Claude Cowork 打击金融犯罪 来源:Claude | 阅读原文 欧洲 B2B 金融科技公司 Qonto 基于 Claude 4.7 Opus 构建了一个企业级 MCP 网关架构,赋能欺诈调查员在统一的交互式工作空间中分析复杂金融犯罪案件。全球每年有 2-5 万亿美元被洗钱,Qonto 服务 60 万+ 中小企业客户,通过 AI 大幅提升了 AML(反洗钱)调查效率,在满足严格合规要求的同时实现了安全的数据处理。 4. 用 Claude 设计:从提示到产品 来源:Claude | 阅读原文 Anthropic Labs 三人小团队在 10 周内构建并发布了 Claude Design。他们用原型替代文档、打破角色界限,进行了 50-100 次快速用户反馈循环。Anthropic Labs 的运作模式像一个内部「押注工厂」——持续运行小型自主实验,Claude Code、MCP、Skills 都是这种模式的产物。工程瓶颈已从代码生产转移到需要真实用户数据来迭代的产品决策层面。 5. Figure 的 4 年历程:从新兴技术到 200 小时自主运行 来源:Brett Adcock(@adcock_brett) | 阅读原文 Figure 创始人 Brett Adcock 回顾公司四周年,梳理了将通用人形机器人时间线提前十年的四项关键突破:①低成本电动人形机器人(执行器 / 传感器 / 电池 / 制造进步);②从摄像头像素到扭矩的深度学习取代手工代码;③全身强化学习控制让机器人更稳健;④机器人现在能以人类水平速度执行有用工作,已完成连续 200 小时自主运行验证。他总结道,构建现实版「iRobot」的未来已从不可能变得非常真实,这四项技术突破之间相互依存,缺任何一项都无法到达今天的节点。 6. 当软件容易被创作,新时代的产品长什么样?| 42 章经 来源:42 章经 | 阅读原文 两位创业者的深度对话。核心判断:AI coding 能力爆发后,软件创作门槛急剧降低,未来市场呈哑铃型结构——模型公司拿走绝大多数价值,中间层工具被压缩;创业公司应聚焦于「特殊性」和情绪价值,而非追逐普遍性价值。一个关键洞察:差异来自你跟 coding agent 对话过程中「拒绝了什么」,那 1% 的拒绝比 99% 的接受更有价值。文中还提出了一个有趣的类比:未来的软件格局可能会发展得跟今天的硬件一样——极度标准化的通用层加上少数高度差异化的专业产品。这与精讲三「超级个体」的论述一脉相承:个人化的、从真实痒点出发的产品,才是 Closed-loop 的产物。 7. 黑客组织以前所未有的规模投毒开源代码 来源:Ars Technica(@arstechnica) | 阅读原文 一个黑客组织正在以前所未有的规模对开源代码进行投毒,对软件供应链构成重大威胁,影响可能波及无数依赖开源库的应用程序和系统。这是对整个软件开发社区的重要安全警报。在 AI Coding 工具大规模普及的当下,对第三方依赖的审查变得尤为重要——AI 生成的代码往往大量引用开源库,供应链安全意识不能因为效率提升而被忽视。 ## 补充阅读 - 卷到今天,Agent 的含金量还在提升丨 AIGC2026 圆桌论坛(量子位)阅读——三位 Agent 产品一线创业者深度对话,核心观点:Agent 产品范式已相对稳定,未来一人操纵数百 Agent 大军,创业公司应在不确定性中先迈一步。适合关注 Agent 创业生态的读者。 - Google I/O 2026 开发者主题演讲精华集锦(谷歌开发者)阅读——Gemini 3.5 系列、Antigravity 2.0 智能体平台、Android CLI 及多项面向 AI Agent 的开发工具一网打尽。适合 Google 开发者生态跟踪者。 - 如何让智能体从团队中学习:Warp 的 Buzz 智能体自我改进实践(Claude)阅读——Warp 通过基于 Slack 的工作流构建了能从团队反馈中学习、并通过 GitHub PR 自主改进指令的 Buzz 智能体。对「Agent 生产化」问题有参考价值。 - 设备端 Gemini Nano 技术详解 — Google DeepMind 工程师深度分享(AI Engineer)阅读——详解 Gemini Nano 通过 AI Core 系统服务在 Android 设备上的架构实现,包含 MLKit GenAI API、混合云回退策略,以及支持 RAG 的嵌入 API 路线图。适合 Android AI 开发者。 - Coding Agent 会话管理的两大流派及实践(九原客 @9hills)阅读——单会话(维持长会话 + subagent)vs 即用即抛型(每个 Issue 从头开始)的实践对比,作者介绍了自己在 Pi 中使用 /tree 和 /fork 命令管理会话树的方法。对重度 Coding Agent 用户有实操参考价值。 - vLLM MoE 部署的弹性专家并行(vLLM @vllm_project)阅读——vLLM 引入弹性专家并行(EEP),允许在不重启的情况下实时调整 MoE 部署规模。对大规模模型推理基础设施工程师有参考意义。 ## 今日阅读路径 时间有限?以下是今日建议的三篇优先顺序: 第一优先:精讲三——致超级个体 https://www.bestblogs.dev/article/cd8675e4 最反直觉、最有启发性的一篇。无论你是管理者还是个人开发者,「组织是否允许一个人从问题发现走到拿到结果」这个问题都值得认真思考。文章的历史视角(2002 年的共享软件时代)尤为精彩,能帮你抵抗「超级个体是 AI 时代新发明」这种误区。 第二优先:精讲一——前场部署工程师 https://www.bestblogs.dev/article/2e174723 AI 落地竞争的最新战场,Google / OpenAI / Anthropic 的架构动向一文搞懂。对技术职业规划和行业趋势判断有直接参考价值,尤其是正在考虑从「纯后台工程师」转型到「客户面向技术角色」的读者。 第三优先:精讲二——下一代 Claude 怎么造 https://www.bestblogs.dev/article/e3dc3330 Anthropic 研究 PM 的内部视角,「dreaming 机制」和「AI 真正瓶颈是组织协调」两个观点足以让你重新理解 AI 产品的演进方向。如果时间充裕,可以继续看速览第 6 篇(42 章经 × 软件创作)和补充阅读第一篇(Agent 圆桌),三者合起来是一组关于「AI 时代的人才、产品和组织」的完整阅读。
译AI行业呈现三大趋势。一是企业落地竞争加剧,OpenAI成立独立部署公司(TPG等投资40亿美元,估值140亿美元),Anthropic跟进成立类似咨询公司,Google Cloud大规模招募前场部署工程师(FDE),面试流程压缩至2天2轮。二是Anthropic揭秘下一代Claude开发逻辑,模型开发完全产品化,用户反馈经Claude自动处理直接用于训练,并引入“dreaming”记忆整理机制,认为瓶颈已从编码转向组织协调能力。三是探讨超级个体并非培训产出,而是由完整闭环工作流激发而成。
自从ChatGPT里可以调用远程电脑的codex,合上笔记本也能用时。 连mac mini的价值也在降低,不过多一台不关机的电脑。 钓鱼间隙可以让codex控制Suno生成音乐传到自己的网站播放
译自从ChatGPT里可以调用远程电脑的codex,合上笔记本也能用时。 连mac mini的价值也在降低,不过多一台不关机的电脑。 钓鱼间隙可以让codex控制Suno生成音乐传到自己的网站播放
DeepSeek 真的是充满了长期主义和大道至简的代表了 国内各大厂和 AI 小龙们,各种 Coding Plan、Token Plan 价格设计一个比一个复杂,又是限购又是拉新返利,折腾了大半年,其实真的不如一个足够低价的 API 价格,和低到几乎可忽略的缓存命中价格。 把模型训练和推理的底层技术做扎实、不追求短期业绩表现、为长期的 DeepSeek Code 和 Harness 积累更多用户使用和反馈数据。 刚刚看到 @bearliu 发的 AI 界对 Anthropic 的态度,那只每个人都讨厌但又害怕的黄鼠狼,可谓天下苦 A 厂久已,不管 DeepSeek 是不是那只大鹅,都希望能把这只黄鼠狼尽快甩飞!
译推文赞扬 DeepSeek 践行长期主义与大道至简,指出其通过提供足够低价的 API 及几乎可忽略的缓存命中价格来赢得用户,而非像国内其他厂商那样设计复杂的套餐与促销策略。这被视作将底层技术做扎实、积累长期用户反馈的体现。推文还引用观点,将 Anthropic 描述为“每个人都讨厌但又害怕的黄鼠狼”,并希望 DeepSeek 能改变这一行业格局。
昨天看到很多朋友在讨论「Claude Code橙皮书:从入门到精通」这本书 我自己认为,学习 AI 知识,除了很底层的原理和短期不会变化的固定知识可能适合通过书来学习。 Claude Code、Codex、Agent 框架和工程、Prompt Engineering、Context Engineering、Harness Engineering 等等概念和知识恨不得每周都在更新,通过书来学习,太不现实了。 作者的书还在编写大纲,知识就已经更新了,等你把书竖出版了,知识都过期了。 当然也不排除现在很多作者也在用 AI 来写书,这种写法,审查难度不低于大型代码仓库的 Code Review,何况。。你也很难保证这位作者,本身有审查能力,或者说,AI 写出来的书,他自己能看懂吗?我不知道! 下面两张图,仅仅是我很好奇,为啥国内的书籍,这么爱用什么白皮书、蓝皮书、橙皮书,真的不太懂分别都是什么意思,能不能随便用,让 GPT-5.5 和 Claude Opus 4.7 分别解释了一下,大家看看。
译推文质疑用书学习AI知识的可行性,指出Claude Code、Agent框架等知识更新极快,书易过时。同时质疑AI写书的质量,认为审查难度高。此外,作者对国内书籍常使用“白皮书”“蓝皮书”“橙皮书”等命名方式表示好奇。
很多人经常问怎么像我一样高产似母猪,怎么快速涨粉之类的问题,除了个人努力熬夜创作,AI工具的加持肯定还是必不可少的🤖 昨天开源了我的AI选题工作流和prompt,今天继续分享我的自媒体AI工作流, 很多铁汁跟我说看了这篇文章终于不用每天早上起来想今天写什么了,特别有用,那今天再分享下Codex的定时功能怎么用在我的自媒体工作流里,真的蛮好用的,墙裂推荐哈哈 昨天这篇用Agent帮我刷小红书、推特的文章核心在讲怎么把每天手动刷3-4小时的活,变成了20分钟的二次筛选,产能提升3倍以上, 也有很多人问我筛完之后有了选题之后,还要自己从0搭结构,找数据,写日报写周报? 我现在是用Codex的定时任务功能来解决, 每天早上8点,它会自动把筛选出来的选题整理成一篇结构完整的行业日报, 有总结,有数据,有案例,有金句,还有行动建议,Prompt一次写好,后续几乎零维护。 整套工作流完美闭环: Agent搜集信息 → Codex结构化产出 → 我只做最终判断和润色。 所以我觉得AI博主真正的瓶颈其实并不是AI不够强,关键是你没把AI放对位置, 把AI放在帮你写,它写得一般没法看, 但是把AI放在帮你筛+帮你搭结构,这个时候你才能真正起飞。 每月20刀,换每天多出来3小时,性价比高到爆炸哈哈 #AI #自媒体 #工作流
译作者开源了一套自媒体AI工作流,核心是利用AI智能体自动搜集小红书、推特等平台信息,将每日3-4小时手动筛选缩减至20分钟,产能提升3倍以上。其后续使用Codex的定时任务功能,每天早上自动将筛选出的选题,依据预设提示词(Prompt)整理成包含总结、数据、案例、金句和行动建议的结构完整行业日报。整套流程为“Agent搜集信息 → Codex结构化产出 → 作者最终判断润色”,实现近乎零维护。作者强调,AI辅助的关键在于用对位置,让AI负责筛选与搭建结构而非直接代写,并认为每月花费20美元来换取每天约3小时的时间是高性价比的。
Cerebras represents a whole NVL72 rack on a single wafer. By routing around defects and staying on-die, they bypass the networking power bottleneck that traditional GPU clusters face.
译Cerebras在单个晶圆上实现了整个NVL72机架的算力。通过绕过缺陷并保持在芯片内,他们绕过了传统GPU集群面临的网络功耗瓶颈。
天啊! Google DeepMind CEO Demis直接把AGI的门槛从Erdős水平提升到了拉马努金水平! 这波目标线移动我愿称之为人类最后的防线🤯 具体内容请看中文字幕版👇 #AGI #AI #OpenAI [引用 @AYi_AInotes]:http://x.com/i/article/2058381329318682624
http://x.com/i/article/2058381329318682624
有开发者利用 Claude、MCP 与 N8N 构建了一个全自动晨间研究智能体。该智能体每日自动运行,将产出的 5 分钟晨报直接存入 Obsidian 笔记库,从而将用户原本需要 45 分钟的每日信息筛选时间压缩至 5 分钟,节省了 87% 的时间。发布者表示,如果感兴趣可以制作教程,并顺便提到 Cursor 提供的 $10,000 额度还远未用完。
http://x.com/i/article/2058683409505882112
推文提倡将AI智能体的故障,从笼统归咎“模型幻觉”,转变为像医生诊断一样,精准定位到记忆、行动或自检等具体系统组件。文中引用指出,医学上的“虚构症”是比“幻觉”更贴切的类比,指记忆缺口处的无意识编造。这种视角转换的核心价值在于,构建者遇到问题时,不再盲目向提示词堆砌规则,而是能针对性地修复特定模块。作者强调,这种能力的获得没有捷径,需要通过反复调试和耐心磨合,才能让技能与智能体真正融入自身工作流。
>started treating my Openclaw/Hermes like patients. >the bugs that kept coming back all had real medical names. take the...
为准备面向传统媒体的Prompt、技能及AI编程分享,作者通过Youmind反复调试,为GPT-image-2生成了一个简洁风格的提示词。该提示词有效降低了生成内容的“AI味”,并更适配AI智能体产品,为AI提供了更多自主推理与发挥的空间。
Ramp最新AI报告显示,Anthropic的企业采用率达34.4%,首次超过OpenAI的32.3%。但报告同时指出这一优势可能无法持续:Uber已提前耗尽其2026年全部AI预算,且Anthropic近期一次模型更新导致包含图像的提示成本增至三倍。目前Ramp平台上增长最快的AI供应商,是销售廉价开源模型访问权限的推理平台。
Anthropic联合创始人Dario Amodei持续警告AI对就业的冲击。他曾在2025年预测,AI可能在五年内消除50%的入门级白领工作,将失业率推高至10-20%。他后来称AI是“通用劳动替代品”,将造成“异常痛苦”的颠覆,并在达沃斯警告可能出现与社会脱节、GDP增长50%的“零世界国家”。当前数据显示趋势印证其警告:2025年科技业入门级招聘下降30-50%,华尔街银行裁减约20万个初级岗位。Anthropic自己的研究也确认,77%的企业使用Claude是为了自动化任务,而非增强员工。另一位Anthropic联合创始人也呼应,称AI大规模替代人类劳动的可能性真实存在。
I heard the AI creator role at @EnergyWabbits is filled But I tried making a match cut ad for wabbits because their ener...
路透社报告显示公众对AI生成新闻的接受度因模式不同而有显著差异。仅12%的人对完全由AI生成的新闻感到舒适,而对完全由人类写作的新闻感到舒适的比例高达62%。在人机协作模式中,人类主导、AI辅助的接受度为43%,而AI写作、人类审核的接受度降至21%。此外,仅有33%的受访者相信记者会认真核查AI输出的内容。
用户发现AI工具Bloome已可在美区iOS上使用,称其体验“太丝滑”。该工具支持多Agent协作模式,引用推文描述了具体工作流程:三个Agent合作,其中两个负责执行任务,一个负责复核与查漏补缺,用户仅需通过指令(“动动嘴皮子”)与它们交互。
这个状态有点舒服了,三个Agent 协作审核干活。 2个负责执行任务,1个进行复核和查漏补缺。 而你只需要动动嘴皮子和不断的PUA他们就行了。
这是一个发布于GitHub的开源Skill,用于小红书个人号或矩阵运营。它通过浏览器自动化模拟真人操作,而非调用小红书API,以降低封号风险。该工具支持零代码操作,用户可通过与Claude等大语言模型交互,下达分析、生成选题、复刻爆款、自动发布与回复评论等指令,形成完整的运营闭环。所有操作结果会存为Markdown知识库,安装方式是通过Openclaw直接引用其GitHub仓库。
http://x.com/i/article/2058381329318682624
黄仁勋指出,美国对华芯片出口管制非但无法阻碍中国AI发展,反而可能成为产业自主的催化剂。制裁导致的市场空缺正推动华为等国内供应商成长。当前竞争已从比拼最快加速器,转向比拼定义智能操作层的能力,涵盖芯片、能源、模型和标准。推文补充了华为的最新动向:为应对制裁,华为提出“Tau Scaling Law”新设计方法,旨在通过LogicFolding等技术缩短信号延迟,在不依赖最先进光刻机的前提下实现1.4nm级密度。华为声称已量产381款芯片,并计划2031年达成该目标,其路径被命名为“何氏定律”。
🇨🇳 Huawei reveals a new chip design breakthrough under US sanctions pressure. A design approach meant to close the gap...
华为在IEEE ISCAS上公布了Tau(τ)Scaling Law框架,通过时间维度优化替代传统的晶体管几何尺寸微缩。公司六年内设计量产了381款芯片,采用新LogicFolding架构的麒麟芯片将于今年秋季出货。其目标是到2031年,实现等效于1.4nm工艺的晶体管密度,而无需依赖受ASML禁运影响的EUV光刻技术。这一基于架构创新的路径若成功,将削弱美国出口管制的效力。
Huawei says it has made a breakthrough and expects to design high-end chips with transistor density equivalent to 1.4 nm...
推荐关注 @xiaoxiaodong01 ,AI生图方面做了很多探索。 最近非常活跃,发布了很多极具美感的生图提示词。 以前印象中最喜欢研究AI生图的是 zho 和 神佬,小小东后来居上。 最近开源的X文章发布Chrome插件也相当优秀。 ...
宇树科技(Unitree)发布其WVLA 2.0模型在真实会议室进行的乱局清理测试视频。该测试为单次拍摄、全程无剪辑,机器人需在桌椅杂乱、物品随意摆放、且有人走动等强外部干扰下,全程自主完成识别、分类、清理和摆放等多任务。测试旨在展示机器人从实验室走向复杂现实世界的能力,与行业中常见的“实验室完美环境”演示形成对比。
Conference Room Mess Cleanup Test: Unitree WVLA 2.0 Model🎉 This video was recorded in a single take. Multi-task, fully ...
推荐关注AI生图创作者@xiaoxiaodong01,其近期发布了大量高美感生图提示词,并开源了X文章发布Chrome插件xposter。原版插件地址为 `https://github.com/nevertoday/xposter`,安装链接为 `https://chromewebstore.google.com/detail/xposter/iimkimodgdjnnmdopeolboakhjmhfbbj?authuser=0&hl=zh-CN`。该插件已有人基于原版进行Fork改造,以适配个人工作流,实现内容一键同步。
推文分享了使用Suno生成一首“小甜歌”的经验,其风格选择了Dream Pop(营造梦幻朦胧的空间感)与Disco-lite(提供有律动但不重的节奏)。在人声提示词上使用了“Breathy female vocal”以模拟女孩在耳边哼唱的效果,情绪设定为“Softly euphoric”以实现轻柔的欣快感,并应用了“Soft reverb”。最后附上了生成歌曲的链接。
华为提出τ缩放定律,旨在不依赖更先进制程的情况下,通过LogicFolding技术折叠逻辑模块、缩短信号传输距离来提升芯片性能与密度。华为称已量产采用此思路的381颗芯片,并计划于2031年实现等效1.4nm(14Å)密度,该定律以海思负责人何庭波命名。同样,华为在存储领域也展示了类似的“侧向创新”路径,其通过改变封装方式(Die-on-Board)而非追求最先进的NAND层数,推出了容量达122.88TB的AI SSD。
🇨🇳 🇺🇸 China's Huawei's new 122TB SSD shows how export controls can move innovation sideways instead of simply stoppi...
根据神佬 @berryxia 的截图,丢给Codex复刻的微信消息驾驶舱。 底层是卡比的wx-cli,等完善后看好不好开源。
分享AI自媒体从0到4万粉的实战经验。核心在于精准筛选内容信号:建议设置X平台阈值为转发≥500或点赞≥2000,聚焦Claude/GPT/Cursor/Agent/MCP等关键词,定位“已验证未饱和”的黄金区间(100-500转发)。强调避开泛流量陷阱与低质AI洗稿,需结合作者权重判断。同时提供一套经多轮迭代的实用提示词模板,用于自动化信息搜集,直接可部署使用。
http://x.com/i/article/2058381329318682624
Whoever invented "Member of Technical Staff" was a genius. It filters out Staff/Principal title-maxxers, protects engine...
http://x.com/i/article/2058759131675385856
GPT-5.5 Pro is a very solid fact checker. I can throw entire chapters at it and it will hunt down every key reference ac...
高德地图在SEO增长场景的实践表明,当前AI智能体的核心挑战是如何管理与约束其生成能力。文章展示了将“从机会发现到发布”的长任务编排为可监控的带状态机工作流;使用文件化Memory管理所有产物以保证可追溯性;并贯彻“生成”与“评审”分离的“零信任”原则,评审方需独立验证所有声明。此外,他们对评审Agent本身进行Benchmark评估并多轮优化,以数据驱动其能力提升。该系统在“路书”功能验证中实现了全程无人介入、连续运行且主流程无Bug,印证了未来AI产品的竞争力在于构建围绕模型的可靠系统。
美团发布数字人模型LongCat-Video-avatar-1.5,可通过图片和音频生成口播视频。demo仅支持5秒480p视频。实测中人物嘴部遮挡案例效果与SOTA有差距,主要在口型。最大分辨率720p,但可AI提升至4K。模型本地部署可行,对动漫人物泛化,但体积大,int8量化需16G显存。
I built a lightweight meeting notes assistant with Hermes + StepFun's Step Plan. Step Plan is a subscription-based AI se...
推文盛赞设计工具Mole的UI交互动效,认为其审美与交互设计极为出色,特别提及了设计师Tw93的贡献。作者指出,日常Vibe Coding会产生大量缓存,而Mole如同其名(鼹鼠)一样能深度挖掘并清理出几十G的存储空间,展现了高效的清理能力。
AI行业呈现三大趋势。一是企业落地竞争加剧,OpenAI成立独立部署公司(TPG等投资40亿美元,估值140亿美元),Anthropic跟进成立类似咨询公司,Google Cloud大规模招募前场部署工程师(FDE),面试流程压缩至2天2轮。二是Anthropic揭秘下一代Claude开发逻辑,模型开发完全产品化,用户反馈经Claude自动处理直接用于训练,并引入“dreaming”记忆整理机制,认为瓶颈已从编码转向组织协调能力。三是探讨超级个体并非培训产出,而是由完整闭环工作流激发而成。
推文赞扬 DeepSeek 践行长期主义与大道至简,指出其通过提供足够低价的 API 及几乎可忽略的缓存命中价格来赢得用户,而非像国内其他厂商那样设计复杂的套餐与促销策略。这被视作将底层技术做扎实、积累长期用户反馈的体现。推文还引用观点,将 Anthropic 描述为“每个人都讨厌但又害怕的黄鼠狼”,并希望 DeepSeek 能改变这一行业格局。
推文质疑用书学习AI知识的可行性,指出Claude Code、Agent框架等知识更新极快,书易过时。同时质疑AI写书的质量,认为审查难度高。此外,作者对国内书籍常使用“白皮书”“蓝皮书”“橙皮书”等命名方式表示好奇。
作者开源了一套自媒体AI工作流,核心是利用AI智能体自动搜集小红书、推特等平台信息,将每日3-4小时手动筛选缩减至20分钟,产能提升3倍以上。其后续使用Codex的定时任务功能,每天早上自动将筛选出的选题,依据预设提示词(Prompt)整理成包含总结、数据、案例、金句和行动建议的结构完整行业日报。整套流程为“Agent搜集信息 → Codex结构化产出 → 作者最终判断润色”,实现近乎零维护。作者强调,AI辅助的关键在于用对位置,让AI负责筛选与搭建结构而非直接代写,并认为每月花费20美元来换取每天约3小时的时间是高性价比的。
http://x.com/i/article/2058381329318682624