AIHOT

全部动态X · 3996 条

全部一手资讯 X 论文

Orange AI@oran_ge · 4天前41

创作的核心往往根植于不可测度的人类情感、不可言说的共鸣，这都是理性分析难以捕捉的人类未来可以和AI竞争的领域，可能恰恰是我们作为人类有缺陷的心灵角落。 -李诞

译创作的核心往往根植于不可测度的人类情感、不可言说的共鸣，这都是理性分析难以捕捉的人类未来可以和AI竞争的领域，可能恰恰是我们作为人类有缺陷的心灵角落。 -李诞

查看原推 ↗

elvis@omarsar0 · 4天前53

The point is that you should start implementing ways to encode instructions/prompts with clear goals inside automations. Nothing new but newer LLMs are being trained to perform for longer duration uninterrupted. Loops are one way to take advantage of that.

译关键在于，你应该开始实施在自动化中编码带有明确目标的指令/提示词的方法。这并不是什么新鲜事，但较新的大语言模型正在被训练以更长时间不间断地执行。循环就是利用这一点的一种方式。

查看原推 ↗

小互@xiaohu · 4天前26

应该是暗示全新的Siri

查看原推 ↗

meng shao@shao__meng · 4天前60

X Article 编辑器敢说最难用，没人反对吧？！不支持 Markdown 格式，也不支持 Markdown 导入自动转换，自己的编辑器又太难用，真心佩服这些还能坚持写 X Article 的朋友们，他们一定花了很多时间来调整各种布局和格式，远多于其他平台。让 Codex 做了一个 Skill，把 Markdown 转为 X Article 展示格式，留着自己用，也分享出来，大家用得上可以 Fork 再微调。 md-to-x-article-skill https://github.com/shaom/md-to-x-article-skill

译邵猛批评 X Article 编辑器难用、不支持 Markdown 格式，并用 Codex 创建了一个 Skill「md-to-x-article-skill」，可将 Markdown 自动转换为 X Article 展示格式。该工具已开源在 GitHub（shaom/md-to-x-article-skill），用户可 Fork 后按需微调。

查看原推 ↗

小互@xiaohu · 4天前79

http://x.com/i/article/2063968924019163136 # 一句话，翻译任何视频：我把用了半年的视频翻译工具开源了有人说，现在 AI 自动翻译字幕的工具一大把，你这个还有啥用？确实有不少工具能在线翻译视频，我自己也用了很多。但总觉得翻得不太准、不太好，有时候还冒出一堆错误。另外我经常在推特、视频号上分享海外视频，干脆就顺手做了这么一套——所以它其实还能帮你把海外视频搬运到国内平台，嘿嘿。这套工具我用了半年，来回调了很多次，现在比较成熟了，整理干净开源给大家。装好以后，你只要对它说一句「把这个链接翻译成中文字幕视频」，剩下的它全自动做完：下载、转写、翻译、润色、烧字幕、出文稿，一条龙到底。转写完全在你自己电脑上跑，不花一分钱 API 费。翻译用的就是你已经装好的 AI，顺手就做了。而且不只英文，日语、韩语、法语这些外语视频，一样能转成中文字幕。还有它本质就是几个脚本加一份说明书，没绑死 Claude Code 一家——小龙虾（OpenClaw）、Gemini、Codex 这些 AI 编程工具也都能用，区别只是各家装技能的方式不同。下面手把手带你装上、跑通第一个视频。 ## 这玩意儿到底能干嘛给它一个视频链接（YouTube、Bilibili、抖音都行），或者一个本地视频文件，它会一条龙做完这五步： > 下载 → 转写 → 翻译 → 润色 → 烧字幕，最后顺带出一份文稿拆开说就是： - 把视频下下来（本地文件就直接用） - 提取音频，用 Whisper 转写成带精确时间戳的原文字幕 - 把原文翻译成中文，再润色成符合中文观看习惯的字幕 - 把字幕烧进画面，输出一个带中文字幕的视频 - 顺便再出一份 Markdown 文稿，方便你存档或者改成文章语言不挑。英语、日语、韩语、法语、西班牙语，只要 Whisper 听得懂的，都能转成中文字幕。它会自己识别原视频是什么语言，再翻成中文。中文视频就只做转写出文稿，不绕翻译这一步。字幕有两种可以选。一种是纯中文，画面干净。另一种是中英双语，中文大、英文小，主次分明，适合想顺便练听力的人。你全程不用记任何命令。想要什么就用大白话说，比如「这个要双语字幕」「不要水印」「用快速模式」，它都听得懂。 > 简单说，它把「下载 + 转写 + 翻译 + 配字幕」这条原本要开四五个软件、来回折腾一两个小时的流水线，压缩成了说一句话。 ## 跟现成的翻译工具有啥不一样市面上字幕工具不少，我自己用下来最在意三件事，这套工具就是冲着这三件事做的。第一，本地、免费、能离线。转写用的是 OpenAI 开源的 Whisper 模型，苹果芯片的 Mac 上还会自动调 GPU 加速。整个转写过程在你电脑里完成，不上传、不收费。翻译复用你已经在用的 AI，不用再单独买一个翻译 API。第二，时间戳是真的准。很多工具的字幕会跑在说话人前面，或者半句话挤进下一条，看着难受。这套工具拿到的是精确到每个词什么时候说出口的时间戳，再按「一句话 + 换气停顿」来切，字幕基本说完正好换条。第三，字幕是给人看的，不是机翻直出。它会自动纠正转写听错的专有名词（Claude 经常被听成 cloud，MCP 被听成 NCP），按语义断句，每行不超过十二个字，技术术语保留英文。双语模式下中文大、英文小，同一条里拉开字号，不是两行一样大堆在一起。这些都是我自己做了上百条视频踩出来的细节，全写进规则里了。 ## 效果长这样拿 a16z 刚发的一条访谈试试。受访的是前 OpenAI 首席技术官 Mira Murati，我让工具配了中英双语字幕。她原话里有个比喻： > It's more like a tandem bike where both people are pedaling. 机翻大概会甩给你「串联自行车」这种读着别扭的词。这套工具翻成的是： > 它更像一辆双人自行车，两个人一起踩着踏板。接地气、不绕口。专有名词也拎得清，Thinking Machines 这种公司名直接留英文，不硬翻。你只要发一句「链接 + 翻译这个视频」，它会先问你要纯中文还是中英双语——我平时主要翻成中文，就默认留了这两个选项，实际上翻成任意语言都行。除了带字幕的视频，它还会同时出一份文稿，原文加中文对照。整段读下来是这样： > 它更像是去造这样一种系统：不会自己闷头狂奔、把整个文明甩在身后，而更像一辆双人自行车，两个人一起踩着踏板。上坡的时候，也许更有劲的那个人踩得更用力，但两个人的手都在车把上。不挑语言是这套工具最实在的地方。同一段访谈，中文、日语、韩语、阿拉伯语、法语都能翻成双语字幕——各国译文在上、英文原文统一压一行在下，主次分明，连从右往左写的阿拉伯语也排得整整齐齐：十几分钟的视频没问题一个半小时以上的长视频也能轻松应对 ## 它其实是三个技能打开仓库你会看到三个文件夹，各管一段活，可以单独用，也可以串起来用： - xiaohu-video-md：总指挥。负责下载、转写、调翻译、烧字幕、出文稿 - xiaohu-subtitle-polish：专门管字幕翻译润色。纠错、翻译、断句、对时间轴、做双语 - xiaohu-video-download：纯下载工具。下视频、下音频、下整个播放列表，也能给本地视频烧字幕翻译一个视频的时候，是 xiaohu-video-md 在总调度，翻译那一步它自己会去叫 xiaohu-subtitle-polish。你不用管这些，知道有这么三块就行。 ## 手把手安装这套工具目前是给 Mac 调的，苹果芯片的机器跑得最顺。装法有两种，挑一种就行：嫌麻烦，就把下面那段话整段丢给 AI，让它替你全装完；想搞清楚每一步在干嘛、或者怕中途出岔子，就照着后面的手动三步敲。 ## 偷懒版：把这段话丢给 AI 打开你的 AI 编程工具，Claude Code、Codex、小龙虾（OpenClaw）都行，把下面这段原样复制进去发给它。它会自己判断你是什么系统、装好依赖、拉仓库、跑安装脚本，一条龙搞定，中间该问你的会停下来问： > 帮我安装这个视频翻译工具：https://github.com/xiaohuailabs/xiaohu-video-translate 按下面的顺序来： 1. 先看我的系统：Mac 还是 Windows；Mac 的话是不是苹果芯片（M 系列） 2. 装依赖：yt-dlp、ffmpeg、whisper-cpp（Mac 用 brew install，Windows 走 WSL 或 winget）。转写引擎——苹果芯片装 mlx-whisper，其它机器一律装 faster-whisper 3. git clone 这个仓库，进目录跑 bash install.sh，把三个技能装进我的技能目录 4. 装完找到 xiaohu-video-md 技能里的 config.json（Claude Code 在 ~/.claude/skills/ 下），问我成品想存在哪个文件夹，帮我把 output_dir 改成完整路径 5. 最后检查依赖都装齐了没，告诉我能不能开始用每一步做完简单说一句你干了啥；依赖装失败就停下来问我，别硬往下跑。它替你跑的其实就是下面这三步，只是你不用自己敲。想自己动手、或者中途卡住想排查，就照着手动版来。 ## 第一步：装几个基础工具先确认你装了 Homebrew（Mac 上最常用的软件包管理器，没装的去 brew.sh 按提示装一下）。然后一行命令把三个工具装上： > brew install yt-dlp ffmpeg whisper-cpp > 这三个分别是：yt-dlp 负责下视频，ffmpeg 负责音视频处理和烧字幕，whisper-cpp 是「只下载」子技能在本地转写时用的备用命令，主翻译流程不靠它，真正干转写的是下面这步要装的引擎。再装一个转写引擎。苹果芯片的 Mac 用这个，会走 GPU 加速，最快：（命令里 --break-system-packages 看着吓人，其实只是绕过新版系统的一个安装限制，不动你系统本身，放心敲。） > pip3 install --break-system-packages mlx-whisper 如果不是苹果芯片，就换成通用版本： > pip3 install --break-system-packages faster-whisper ## 第二步：把技能装进 Claude 把仓库拉下来，跑一下自带的安装脚本： > git clone https://github.com/xiaohuailabs/xiaohu-video-translate.git cd xiaohu-video-translate bash install.sh 这个脚本会把三个技能复制到 Claude 的技能目录，自动生成配置文件，还会帮你检查依赖装齐没有。脚本跑到最后会逐项打印 [OK] 或 [缺]，看到 yt-dlp、ffmpeg、转写引擎都是 [OK] 就说明装齐了，哪个显示 [缺] 就按提示补那一个。这里路径以 Claude Code 为例（技能在 ~/.claude/skills/）；你要是用 Codex、小龙虾，把这个目录换成你那家工具的技能目录就行，其余都一样。 ## 第三步：告诉它把成品放哪打开 ~/.claude/skills/xiaohu-video-md/config.json 这个文件，把里面的 output_dir 改成你想存放成品的文件夹路径（要写完整路径，比如 /Users/你的用户名/Documents/视频翻译）。中间的临时文件会进 tmp/，最终的文稿进 data/，烧好的视频默认放在下载文件夹里。 > 转写模型不用手动下。第一次跑的时候，mlx-whisper 会自己从网上把模型拉下来（一点五个 G 左右），下一次就直接用了。装完，重启一下你的 AI 工具，就能用了。 ## Windows 用户看这里上面是 Mac 的装法。Windows 也能跑，但有几处不一样，别照搬。最省事的办法是用 WSL，也就是 Windows 自带的 Linux 子系统。装好以后把下面这几样装上，脚本就能原样跑： > sudo apt install ffmpeg pip3 install yt-dlp faster-whisper 如果不想用 WSL，想直接在 Windows 上装，记住三点： - 转写引擎用 faster-whisper，别装那个苹果芯片专用的版本。脚本检测不到苹果引擎，会自动用它兜底 - 安装脚本得用 Git Bash 跑，或者干脆手动把三个技能文件夹复制到工具的技能目录，再把每个配置模板复制成正式配置 - 字幕字体要换。默认用的是 Mac 的苹方，Windows 上没有这个字体，中文会显示成方块。把命令里的 PingFang SC 换成系统自带的微软雅黑就行直接在 Windows 上装依赖的话，命令是这样： > pip install yt-dlp faster-whisper winget install Gyan.FFmpeg > 字体这条 Linux 上也一样，苹方是苹果独有的，得换成系统里的中文字体。想让非苹果系统也能自动选对字体、开箱即用，我正在做适配，可以去仓库提 issue 催我。 ## 怎么用装好以后就一句话的事。下面这些话你都可以直接说：你说的话它做的事把这个链接翻译成中文字幕视频 + 链接全流程，下载到出成品翻译这个视频，要中英双语字幕 + 链接同上，字幕换成中英双语把这个视频转成文字 + 链接只出 Markdown 文稿，不烧字幕给我本地这个视频加中文字幕 + 文件路径本地文件直接处理下载这个视频 + 链接只下载，不翻译用快速模式转写换更快但精度略低的模型翻译时不要水印关掉水印 ## 几个坑先跟你说在前面都是我自己踩过的，提前知道能少走弯路。 YouTube 有时候下不动，报一串 403 之类的错。这是 YouTube 近一年风控变严了。脚本会自动从你浏览器里读 cookies 重试，一般能过。还不行就挂个代理。烧出来的中文字幕是一个个方块。这是 Mac 字体索引的老问题，脚本默认已经绕开了，正常装完不会遇到。只有你手动改过字体设置、或换了系统里没有的字体才会冒出来，真碰上就把字体换回 PingFang SC（苹方）。第一次用抖音，要先登录一次。跑一下 python3 ~/.claude/skills/xiaohu-video-md/scripts/douyin_login.py，弹出来的浏览器里扫码登录，登录状态只存在你自己电脑上，不会上传到任何地方。开源仓库里我也把我自己的登录信息全删干净了，你拿到的是空的。 ## 拿去用，随便改仓库地址在这： > github.com/xiaohuailabs/xiaohu-video-translate 代码是 MIT 协议，水印、字幕样式、默认字号这些你都可以照自己喜欢改。唯一提醒一句：别把你自己的配置文件和抖音登录信息传到公开仓库上去，仓库里已经默认帮你挡掉了。这套工具是我日常真在用的，不是写来演示的玩具。觉得好用，点个 star，有问题提 issue，我会接着维护。下期我会开源自己的文章 IP 配图技能——用个人 IP 形象给文章生成配图，本文里那些插画就是这么来的。

译小互（@xiaohu）开源视频翻译工具（xiaohu-video-translate），只需说一句“把链接翻译成中文字幕视频”即可全自动完成下载、Whisper本地转写、AI翻译润色、烧字幕、出文稿。转写本地运行，不花API费。支持YouTube、Bilibili、抖音等链接及本地文件，英语、日语、韩语、法语、西班牙语等均可转成中文字幕。字幕精确到词级时间戳，按语义断句，每行不超过12字，双语模式下中文大英文小。提供纯中文与中英双语模式。工具由三个子技能组成，可单独或串联使用，适配Claude Code、Codex、OpenClaw等AI编程工具。已开源，附安装指南。

查看原推 ↗

AYi@AYi_AInotes · 4天前24

剪映的翻译很烂，最近尝试vibe了一个本地视频剪辑应用，本来主要是做视频翻译和字幕的，今天试了下根据文档生成口播视频的功能，跑了一版吉卜力动漫风格的，还不错，再迭代一下，增加动画效果啥的，以后可以拿去做微信视频号了～以下是文档内容，大家可以对照感受下～别侥幸，不要撞在监管的枪口上。 1，周末消息特别多，鱼龙混杂。今天本来想写一个图文版本，但这个标题，估计一定会被404。言简意赅，把观点说清楚就行。 2，周五晚美股暴跌，很多媒体把锅给美联储加息。这个理由是完全错误的：1）美债收益率上行，但还未突破5月19日高点。2）美元指数虽然上行，但远未到3月高点。美元流动性在收紧，但幅度很有限。 3，美股这次暴跌的路径清晰。周四晚上，博通暴跌，市场低开高走。周五开盘之后，低开。在一系列不利消息之下，低开低走。这波暴跌的主要原因是SOXX暴跌。而SOXX暴跌，在博通单日跌没了一个阿里的时候，就已经是前奏。 4，SOXX（NYSE半导体指数ETF），本身对美联储加息不敏感。真正敏感的是创新药这些高度依赖，传统资本开支模式的企业。ai本轮的资本开支来自于一级市场以及谷歌等大厂自身良好的现金流。 5，真正问题，市场对于博通200%的增长都不满意。博通200%增长证明了ai的产业趋势，但单日暴跌，证明了市场的预期太高。你一开始的预期是清华北大不可，最后考个中山大学，当然是不符合预期的。 6，也不是说SOXX真的结束了。SOXX这波拔地而起，上涨快速而迅猛。很多投资者获益颇丰，他们的筹码非常稳固，不会因为下跌10%+就恐慌。我们测算了一下，SOXX再下跌10%，这些筹码才会大面积松动。 7，相对SOXX来说，我们问题更严重。周五市场的下跌，是在没有定价SOXX暴跌的情况下。我们市场因为集中度过高，之前已经通过两根大阴线来调节，周五又下跌4%。 8，除此之外，周末有一个应该广泛关注的消息，但讨论度明显不够。村长针对公募基金的发言：公募基金要坚决遏制赌押赛道、风格漂移、高位发行等顽疾。如果市场顺风顺水，其实都还好。但问题在于，趋势已经不好了。 9，公募基金本质上都是国企。对于他们来说，监管宽松的时候，冲赛道搞风格漂移，那是OK的。一旦监管严格了，那么，他们首先想到的必然是保住饭碗。风格漂移，赚钱了都还好说。但如果亏钱了，那饭碗可能都没了。 10，明天，会有一大波资金出于各种目的来进行避险。有多少资金回流老登，不确定。很多买小登的资金，即使小登不好了，也只会选择空仓。老登多少资金回流，取决于多少资金漂移了。24年夏天的时候，很多科技类公募主题基金，重仓股都是四大行。风格漂移在市场极端的情况下，一定会存在的，并不针对科技。只能说，不要赌周一，不要侥幸，尤其是高位上了杠杆的朋友们。

译剪映翻译效果不佳，作者尝试自建了一个本地视频剪辑应用，主要功能为视频翻译和字幕。近日测试了根据文档自动生成口播视频的功能，并输出了一段吉卜力动漫风格的视频。作者表示后续将迭代增加动画效果，可用于微信视频号内容创作。

查看原推 ↗

Chubby♨️@kimmonismus · 4天前56

A walking contradiction: On the one hand, Daniela from Anthropic says that AI has hardly replaced any jobs so far, on the other hand, co-founder Olah warns the Pope about the disruptive effect of AI on the labor market and society.

译一个行走的矛盾体：一方面，来自Anthropic的Daniela表示，AI迄今为止几乎没有取代任何工作岗位；另一方面，联合创始人Olah却向教皇警告AI对劳动力市场和社会的破坏性影响。

查看原推 ↗

小互@xiaohu · 4天前45

这个说的的挺对的我最近的一个和很强烈的感受也是人机协作才是未来之前我一直追求完全的自动化导致了不停的和AI扯皮或者总觉得对系统、技能不满意一直在修改它... 结果是你越想优化它它就崩溃，往相反的方向走了我现在删除了所有规则，尝试在关键节点进行人工介入来和AI一起完成，效果会更好而且人的精神也好了，不再经常骂AI是傻逼了...

译小互分享个人经验：此前追求完全自动化，导致不断与AI扯皮、对技能和系统频繁修改，效果反而更差。现在删除所有规则，只在关键节点人工介入，与AI共同完成任务，不仅效果更好，人也轻松许多，不再频繁抱怨AI。

查看原推 ↗

歸藏(guizang.ai)@op7418 · 5天前67

转一下笑林老师关于设计工程师定义，想找类似工作的可以看看

译在字节工作8年的动效设计师笑林（@xiaolinbythesea）分享了设计工程师的五种画像：1) AI Design Engineer——将AI能力转化为可交互产品；2) Product UI Craft Engineer——从Figma写出高质量React原型；3) Design Systems Engineer——建立设计系统与代码基础设施；4) Creative Technologist——负责Canvas/WebGL动效与生成式视觉；5) AI Design Workflow Architect——搭建AI工具协作流程。他所在的豆包手机团队也在招聘侧重Android的设计工程师。

查看原推 ↗

郭明錤｜Ming-Chi Kuo@mingchikuo · 5天前65

WWDC26 不影響 Apple 2H26 股價正向趨勢，但將揭露多頭敘事的續航力 ‒‒ 1. Apple 目前的多頭核心敘事，是一個近乎直覺、沒什麼人反駁的市場共識：「即使 Apple 在 AI 進度上暫時落後，最終仍能後來居上」。 2. 根據最新的供應鏈調查，我認為 Apple 的業績將會好到今年底，而這會進一步強化多頭核心敘事成為：「Apple 沒有 AI 都這麼好，有了 AI 還得了！」 3. 因此，無論 Apple 在 WWDC26 上講什麼，只要這個多頭核心敘事沒有被破壞，Apple 2H26 的股價正向趨勢就不易改變。 4. 上述多頭核心敘事並非沒有破綻，但我認為至少有機會維持到 2026 年底。至於能維持多久，就是這次 WWDC26 真正值得觀察的地方。 5. 這次 WWDC26 的重點，不在於發表會結束後的短線股價反應，而是：同樣使用 Gemini，Apple 能否做出比 Google 更好的 AI 應用、agentic workflow、裝置端與雲端混合體驗。 6. 如果答案是肯定的，將有利於延長 Apple 的多頭核心敘事；如果答案是否定的，意味著「Gemini 決定了 Apple AI 體驗的上限」，則股價雖未必會轉空，但「Apple 終究會後來居上」的多頭核心敘事，將開始被更多人重新檢視。

译郭明錤指出，Apple 當前多頭核心敘事是「AI 雖落後但最終後來居上」。供應鏈調查顯示其業績將好到今年底，進一步強化此敘事。WWDC26 上無論發布什麼，只要該敘事不被破壞，Apple 2H26 股價正向趨勢就不易改變。真正觀察點在於：Apple 能否用 Gemini 做出比 Google 更好的 AI 應用、AI 智能體工作流及設備端+雲端混合體驗。答案肯定則利好敘事延續；否則「Gemini 決定 Apple AI 上限」的質疑將削弱「後來居上」共識。

查看原推 ↗

郭明錤｜Ming-Chi Kuo@mingchikuo · 5天前60

WWDC26 won't change Apple's positive 2H26 share-price trend, but it will test the staying power of the bull narrative ‒‒ 1. Apple's core bull narrative right now is an almost intuitive market consensus that few people push back on: "Even if Apple is temporarily behind on AI, it will ultimately catch up and come out ahead." 2. Based on my latest supply-chain checks, I believe Apple's business momentum will remain strong through year-end, which should further reinforce the narrative into something like: "If Apple is doing this well without AI, just imagine once it has AI." 3. So regardless of what Apple says at WWDC26, as long as this core bull narrative stays intact, Apple's positive 2H26 share-price trend is unlikely to change. 4. That core bull narrative has its weak spots, but I think it has a good chance of holding at least through end-2026. How much longer it can last is what makes WWDC26 genuinely worth watching. 5. The key takeaway from WWDC26 will not be the short-term share-price reaction after the event. It will be whether Apple, using the same Gemini, can deliver better AI applications, agentic workflows, and on-device & cloud hybrid experiences than Google. 6. If the answer is yes, it would help extend Apple's core bull narrative. If the answer is no, it would suggest that Gemini sets the ceiling for Apple's AI experience. The stock may not necessarily turn bearish, but the "Apple will ultimately come out ahead" narrative would start to face growing scrutiny.

译郭明錤指出，苹果核心看涨叙事是“AI暂时落后但最终会迎头赶上”。供应链显示业务势头年底前强劲，强化“无AI已不错，有AI更想象”叙事。故无论WWDC26内容，只要叙事不变，苹果2026下半年股价趋势积极。WWDC26真正看点在于苹果能否用同款Gemini做出比谷歌更好的AI应用、智能体工作流及端云混合体验。若能，叙事延续；若不能，Gemini设定AI上限，“苹果最终领先”将受质疑。

查看原推 ↗

Chubby♨️@kimmonismus · 5天前43

Interestingly, scientists seem to be increasingly divided into two opposing camps: AI skeptics and AI optimists. 150 mathematicians warn governments not to “believe the hype.” At the same time, Field Medalists like Terrence Tao are impressed by the capabilities of programs like GPT-5.5 Pro, which solve numerous problems. Among my acquaintances who aren't active in the AI community, there's still a lot of skepticism. For them, AI is simply a chatbot. I think a lot more education is needed.

译有趣的是，科学家似乎越来越分为两个对立阵营：AI怀疑论者和AI乐观论者。 150位数学家警告政府不要“相信炒作”。与此同时，像陶哲轩这样的菲尔兹奖得主则对像GPT-5.5 Pro这样能解决无数问题的程序印象深刻。在我的非AI圈熟人当中，仍然有很多怀疑。对他们来说，AI只不过是一个聊天机器人。我认为还需要更多的教育。

查看原推 ↗

AYi@AYi_AInotes · 5天前52

这是我今年看过最震撼的一组图了，同一个人，同一件白T恤，同一个场景。左边短发严肃，他会签走你所有版税，右边长发大胡子，你会把一辈子的事业交给他， Rick Rubin用两张图，把品牌这件事讲透了，也讲透了为什么90%的AI博主，永远建立不了信任。品牌不是你说你是什么，他是别人看到你的一瞬间，脑子里自动生成的那句话，这就是为什么很多人内容做得不差，就是建立不了信任，他们把全部时间花在说什么上，从来没想过看起来像什么，但如果你的内核已经有了，形象还没跟上，那就是在主动打折，我觉得这个判断对AI内容创作者尤其重要，现在的AI内容池子里，大部分人看起来一模一样，同样的风格、同样的头像质感、同样的又一个AI工具分享者的默认信号，你花几个小时写一篇深度文章，别人划过去的时候先看到你的头像，我们都可以去看一眼你现在的头像、封面、配图风格，问自己一个问题：在别人读一个字之前，这些信号让他脑子里的第一句话是什么，如果那句话跟你写的东西是反的，那说明你的视觉在拆你内容的台。

译推文引用Rick Rubin的两张对比图（同一个人、同件白T恤，短发严肃与长发大胡子），说明品牌不是你说什么，而是别人看到你时自动生成的那句话。AI内容创作者花时间在内容上，但视觉形象（头像、封面、风格）未跟上，导致信任打折。当前AI内容池中大部分人看起来一模一样，视觉信号在拆内容的台。建议创作者检查自己的头像和配图，确保在别人读一个字之前，视觉信号传递的第一句话与内容一致。

查看原推 ↗

🚨 AI News | TestingCatalog@testingcatalog · 5天前56

Thanks to Ideogram for sending this ❤️ Ideogram 4.0 was one of the biggest releases last week! Especially for the open source community. Tested it 👀

译感谢 Ideogram 发送了这个 ❤️ Ideogram 4.0 是上周最大的发布之一！尤其对开源社区而言。测试了一下 👀

查看原推 ↗

数字生命卡兹克@Khazix0918 · 5天前67

最近几天，微信Agent曝光的消息越来越多了。我简单汇总一下： 6月2日，据外媒，腾讯正在测试一款嵌入微信的AI Agent，用户在微信主界面向右滑动即可唤出Agent对话窗口，通过自然语言下达指令后，Agent可自动调用微信生态内数百万个小程序完成任务，演示场景包括根据口味和价格要求找到一家咖啡馆并完成点单。 6月4日，据媒体消息，微信正在与华为、荣耀、小米、OPPO、vivo等手机厂商合作推出A2A（Agent-to-Agent）助手能力，可通过手机语音助理发起微信的音视频通话，或向好友发送消息。 6月8日，微信官方发布《关于开发者接入微信AI生态的指引》，面向小程序开发者们，开始提供接入微信AI生态的能力，未来，可以让微信的AI，对你的小程序能直接调用。今天这条指引，我觉得最有意思的细节是它提供的自动接入模式。只要你授权，打开按钮，微信就可以选择用他们的方式（可能是GUI Agent）来帮助开发者进行全自动改造，原因是小程序数量数以百万计、由不同开发者维护、界面逻辑千差万别，要求所有人配合改造不现实。而且这事好像也只有微信能干了，因为小程序的代码本身就跑在微信的沙箱里，微信天然有读取和分析的能力。这跟之前所有厂做Agent生态的方法都不一样，微信还是微信，生态太恐怖了。而且小程序的用完即走的理念，也天然的适合Agent调用的。海量的小程序，在一瞬间，直接成为了微信Agent背后最庞大的跟现实世界交互的桥梁。 2017年1月9号小程序的种子，没想到，开花发芽在了更庞大的Agent时代。这些消息组合起来，基本上你就可以拼凑出，一个属于微信Agent的图景了。微信，要成为AI时代真正的那个操作系统。外部连接硬件，把自己变成一个巨大的Agent，供硬件厂商调用。内部连接恐怖的微信生态和数百万小程序，成为渠道分发的王。曾经我聊过现在AI产品的商业模式，目前只有两种，一种还卖注意力，就是ChatGPT广告的路子，一种是卖生产力，就是Claude Code的路子。但是在我的理解里，还有第三种。 Agentic Commerce，代理式交易。就是AI直接替你完成一笔交易，帮你订机票、帮你买东西等等，然后AI从这笔交易里抽一个佣金。要知道，光电商一项，全球一年的GMV大概就是7万亿美金，更别提旅游市场、金融市场等等。而现在，好像，微信Agent的生态，好像天然摸到了Agentic Commerce的雏形。这个局，一旦成了。那就真的是，比当年微信本身。还要大的事。

译近日微信Agent消息密集：6月2日外媒称腾讯正测试嵌入微信的AI Agent，用户右滑唤出窗口，可通过自然语言调用数百万小程序完成点单等任务；6月4日微信与华为等手机厂商合作推出A2A能力，可通过语音助手发起音视频通话；6月8日发布开发者指引，提供自动接入模式，因小程序运行在微信沙箱内，微信可直接读取与分析。这标志着微信Agent正连接硬件生态与内部小程序，触及Agentic Commerce雏形。

查看原推 ↗

Chubby♨️@kimmonismus · 5天前17

Best pelican-riding SVG I’ve seen so far. Claude Mythos is a beast - an absolute powerhouse. The hype grows by the day.

译这是我见过最好的骑鹈鹕SVG。Claude Mythos 是个猛兽——绝对的强者。热度的与日俱增。

查看原推 ↗

Chubby♨️@kimmonismus · 5天前55

Interestingly, banks are the sector where AI will first cause significant job losses. Banks are openly preparing for AI-driven job cuts, with executives at JPMorgan, Citigroup, Goldman Sachs, and Standard Chartered acknowledging that roles will be eliminated as the technology takes hold. Junior analyst classes are being cut by as much as two-thirds, leaving students struggling to break into finance, even as banks still source most of their AI talent from those same entry-level cohorts. Meanwhile, banks are rolling out targeted AI use cases like Citigroup's wealth-management avatar and Revolut's in-app assistant, though some doubt that all the announced cuts are truly AI-driven rather than cover for prior overhiring.

译银行业正公开为AI驱动的裁员做准备。摩根大通、花旗、高盛、渣打银行高管承认，随着AI技术普及，许多岗位将被淘汰。初级分析师班级规模削减幅度高达三分之二，导致学生难以进入金融行业，尽管银行仍主要从这些初级群体中招募AI人才。与此同时，银行也在推出针对性AI应用，如花旗的财富管理化身和Revolut的APP内助手。不过，有人质疑并非所有宣布的裁员都真正由AI驱动，可能只是掩盖之前的过度招聘。

查看原推 ↗

meng shao@shao__meng · 5天前78

最近看了不少 Design Skill、Taste Skill、Anti-AI-slop design skill 等等，我自己也开源了一个 Brand to DESIGN.md Skill (https://github.com/shaom/brand-to-design-md-skill) 目的都是学习借鉴优秀的设计、积累设计品味，让 Agent 去学习沉淀到 DESIGN.md 再复刻生成新的网站。但是这种复刻看多了，就又从 Anti-AI-slop 而生成了新的「AI Slop」，还是缺少设计精髓，皮毛相仿而已。

译邵猛关注 Design Skill、Taste Skill、Anti-AI-slop design skill，并开源 Brand to DESIGN.md Skill（GitHub: shaom/brand-to-design-md-skill），让 Agent 学习设计品味后复刻网站。但他指出，这种复刻看多了反而从 Anti-AI-slop 衍生新“AI Slop”，缺少设计精髓，仅皮毛相仿。

查看原推 ↗

歸藏(guizang.ai)@op7418 · 5天前53

藏师傅的社交媒体卡片 Skill，即将迎来一个非常重磅的升级。可以帮大家解决小红书 Live Photo 的制作问题，同时会帮你制作动态的带文字排版的 Live Photo 这样你可以在发布一些必须的动态内容的时候，依然以图文的形式发布，而不至于做非常重的视频。

译藏师傅的社交媒体卡片 Skill 即将迎来重大升级，新增对小红书 Live Photo 的支持。该功能可帮助用户制作带文字排版的动态 Live Photo，使发布动态内容时仍能以图文形式呈现，无需制作完整视频。具体细节尚未公布，但用户可期待更便捷的社交媒体内容创作体验。

查看原推 ↗

歸藏(guizang.ai)@op7418 · 5天前55

试了一下，公众号图文卡片也是支持 Live Photo 的。只不过要从 iPhone 上上传，这下爽了呀！

译藏师傅的社交媒体卡片 Skill 即将重磅升级，可制作小红书动态带文字排版的 Live Photo，方便以图文形式发布动态内容。随后实测发现公众号图文卡片同样支持 Live Photo，但需通过 iPhone 上传。

查看原推 ↗

Deedy@deedydas · 5天前70

This is the best scene in Hell Grind, an entirely AI-made movie, the flashback. Watch it and read this analysis on where we are with AI movies today: time, cost, quality. Overall: Phenomenal technical demo by Higgsfield. Mediocre movie. Good graphics, hints of emotion, but superhero movie level quality in certain scenes at best. Too many cuts. That said, 660x fewer man hours, 50x faster and 36x cheaper than the median US film. Time: The 95 min film took 15 people 14 days. The median US theatrical production takes ~200 people ~2yrs. That’s a 660x improvement in man-hours and 50x in calendar time. Economics: It took $500k, 80% of which was compute. The final footage was cut from ~100hrs of footage generated from text to video / image to video models like Bytedance’s Seedance: a 64:1 “curation” ratio. The median US movie takes ~$18M, with even indie films costing $1-5M. Thats 36x cheaper than median. Quality: Average watch *at best*. Way too many cuts between shots, several characters change accents and have “AI” synthetic voices and characters feel like it’s AI too. Movement, editing and blocking feel artificial too. On the plus side, we’ve more or less solved character consistency, camera angles and realism. The reason the movie wasn’t amazing was more about poor directorial choices than innately unusable video models. Hard to put a number on it but maybe we’re at ~90% on quality that is technically achievable. If Scorsese made an AI movie, I reckon it would be quite good. I know the visceral reaction to anything AI is real and well-studied. But I think it’s folly to fight the inevitability of AI film. It’s too cheap and quick to ignore and almost there on quality. Creators with distribution *will* make AI films and shows and just put them on YouTube. This is the worst quality, slowest and most expensive it will ever be. In the end, good content beats “real” content.

译95分钟AI电影《Hell Grind》由15人14天完成，成本50万美元（80%为算力）。相比中位数美国电影（约200人2年、1800万美元），实现660倍人时、50倍时间、36倍成本改善。影片从约100小时AI生成素材（使用字节跳动Seedance等模型）中按64:1比率剪辑。质量方面，角色一致性、摄像机角度和写实感基本解决，但剪辑过多、角色口音多变、AI合成声音明显，动作和编排生硬——整体平庸，主因是导演选择而非模型限制。作者认为这是AI电影最差、最慢、最贵的时刻，未来创作者将直接投放YouTube。

查看原推 ↗

AYi@AYi_AInotes · 5天前30

卧槽，挖到宝了兄弟们，全网最好的大模型驾驭工程学习网站，完全免费，一分钱都不用花，但是90%的AI工程师估计连这个词都没听过，这个必须收藏学习，冲！链接入口老规矩评论区自取！

译推荐一个完全免费的大模型驾驭工程学习网站，号称全网最好，但90%的AI工程师可能都没听说过。链接位于评论区，建议收藏学习。

查看原推 ↗

数字生命卡兹克@Khazix0918 · 5天前64

http://x.com/i/article/2063827681960235009 # 今年高考，我让12个顶级AI一起考了语文和数学，结果有点意外。一年一度的高考季又到了。从上上周开始，就有很多朋友来问我，今年高考还测不测大模型考试了。测，肯定测。但是肯定要跟去年要有一些区别对吧，去年我只测了部分的数学题，今年要是还这么玩，那就太无聊了。所以，我想了想，今年不如整个大一点的活，让所有的顶级AI一起，来全面的考一下语文和数学，这两个，全都考。在所有AI都在发力代码和Agent能力的情况下，究竟谁的语文能力最高，我还是非常好奇的。这次的参赛模型呢，基本市面上主流的大模型我也都拉来了，基本都是大家的旗舰模型。国外基本就是大家熟悉的御三家，Claude Opus 4.8、GPT-5.5、Gemini 3.1 Pro。国内这边，我也尽量选了各家现在最能打的。千问3.7 max、文心Ernie 5.1、星火Spark X2、智谱GLM5.1、Kimi k2.6、MiniMax M3、DeepSeek V4 Pro、小米MiMo v2.5 Pro、混元3这些都有。让这些大模型，一起做了这两套卷子。而我肯定没有对语文和数学高考题目阅卷的能力，所以这次，我想了想，找身边的朋友们化了下缘，终于，也邀请到了4位有过类似阅卷经历的高中老师们，来跟我们一起整这个活。因为语文会稍微主观一点点，并且我们也不像真的高考一样有一些打分细则，所以我们邀请了3位语文老师来共同阅卷，让他们充分发挥，最后取平均分，这样会公平一点，所以最终是3位语文老师和1位数学老师。但是真的非常非常感谢几位老师，陪我们一直干到了凌晨，每个人几乎都认真批改了十二份的卷子。。。真的，无以为报。。。而卷子的挑选上，虽然也都是选用的全国一卷，这次会稍微有点特殊。因为语文这次比较可惜，等到晚上8点也没有等到完整版的卷子，所以只能最终使用中国考试官方发布的部分试题和参考答案上进行测试，满分大概是100分，最终分数会基于比例，再换算至150分。数学则是完整的真题试卷，就比较简单了。然后呢，为了保证这次AI高考的公平性，我们还是下了不少功夫做平衡的，限制了不少规则： 1. 使用API调用各个模型，都开thinking，不限制最长的token数，所有的工具调用都强行禁止，像什么代码推理、网页搜索什么的都关掉了。 2. 除了讯飞星火、百度，其他10家统一走OpenRouter调用，这样可以保证最公平公正。 3. 模型的输入，语文和数学都采取了通过LaTeX格式纯文本输入的方式。数学本来我们打算是分成多模态和纯文本赛道的，但是真题一出来之后，发现只有一道题，也就是立体几何那道题带图形。但题干其实就完全包含了这个图形的所有信息，没有必要，所以就改成了全部都通过LaTeX格式输入。虽然PDF转LaTeX格式这一步是AI做的，但是让它转了之后，我也同样写了一个LaTeX编译器的脚本，它会在左边放上原本的题目，右边是LaTeX数据编译后的最终题目，方便我和老师们进行核对，在准确性上，我们还是花了一些力气的。然后我们也开发了一个自己的考试脚本，我们只需要把题目丢进去，脚本就会自动调 API，自动让模型作答，自动把客观题判掉，主观题再送到我搭的在线阅卷平台里，让真人老师盲评。考试的Prompt按照下面的设置给模型。客观题只是单纯限制它的格式输出，方便我的脚本对客观题进行打分，不做任何的引导。主观题就直接把裸题给模型丢过去让他作答。以及在数学的填空题上面，也是让它根据数值打分，不是根据格式打分。因为填空题容易出现，在分数或者说有根号的情况下，会有不同的写法，同一个数值会有不同的写法。所以这次在脚本中也是有格外注意这一点。反正作答上我们尽量确保要公平、公平再公平，客观、客观再客观。最后，模型输出的所有的结果，我们又开发了一个阅卷网站，供我们的4位老师们进行阅卷和评分。老师使用自己的名字，登进去之后，看到的每份卷子上面只有一个代号。卷ABCD巴拉巴拉。这样的话，老师并不知道这道卷子是哪一个模型做的答，也会避免一些前置的刻板印象带来一些阅卷上的影响。老师可以随意选择一套卷子开始阅卷，然后里面的打分界面是这样的。直接在里面逐题批改。还可以写上自己的评语。真的，老师们特别辛苦，因为语文的卷子迟迟不出最终版，所以我们最后只能用部分版来考试，几位老师都生生的阅卷到晚上11点以后了。向老师们致敬。最后，在经历了将近12个小时的奋战之后，我们的12位大模型的考试分数，终于出炉了。他们，是这样的。这里我提前叠个甲，这个分数和排名，只是我们基于自己的体系做题出来并且由老师们主观评选出来的，而且只跟语文和数学做题有关，跟大家现在讨论的代码和Agnet能力无关，且可能会展示部分的人类偏好，排名与分数仅供娱乐参考，不代表任何指向。这里面有几个让我挺意外的地方。先看总分，第一名MiMo v2.5 Pro，256.3分。第二名Kimi k2.6，256.29分。差了0.01分。我把语文的评分单独拎出来看了下，这里注意一下，因为语文真题目前全部的还没出来，所以现在用的是部分的题集合成的101分版本，最后折算成150分制的，所以下面你看到的总分其实都是101分制的。要知道我们测评的语文卷子只有一道客观选择题，其他全是主观题，再加上有作文的存在，换算到实际评分上，可能就是某位语文老师在某道主观题上多给了1分的区别。往下看从第三名到第九名，Claude Opus 4.8，一直到GLM 5.1和Gemini 3.1 Pro并列的252.78，7个模型之间的差距仅仅在2分。可以说，至少在这两套高考卷子上的表现，前面这9个顶级的AI大模型模型几乎真的都拉不开差距了，分差极小。看完了总分，再来看看单科的成绩。你会发现，我们的语文状元在3位老师盲测中，由GLM5.1和Gemini 3.1 Pro共同摘夺桂冠，但是在数学上又有点偏科，而且几乎都是兄弟肩并肩，我的脑子里已经出现了中学班上某一个同学的样子了。。。反过来的例子也有，DeepSeek V4 Pro，和MiMo、ERNIE 5.1三家并列数学最高分，但语文又奇低。。。坦率的讲，这其实不太符合我对DeepSeek强世界知识的印象。我把语文的评分单独拎出来看了下，这里注意一下，因为语文真题目前全部的还没出来，所以现在用的是部分的题集合成的101分版本，最后折算成150分制的，所以下面你看到的总分其实都是101分制的发现DeepSeek的作文，属于拉完了。最后一位老师手比较松，虽然打出的分数是49分，但是在他过去的打分中，其实也不算高了。他们的评语其实也都非常的有意思。所以他们一改完卷，我也去认真看了看他们所有的评语。其实三位老师从给分上看，是能看出来他们有各自的偏好，但是在他们的评语有一个共同点。他们很在意高考作文的可评分结构。评语里会高频出现文体不清，文章结构不够清晰，观点不够清晰明确，论证不充分，时代关联不足等等评语。比如这一篇所有模型中得分最高的，由GLM 5.1写的作文，就有两位老师都提出了文章结构不够清晰的毛病。作文原文我也放在这里了，大家可以在评论区评一评。语文大概就是这样，我们再看看数学的得分明细。你会发现几乎所有的模型，其实没啥大的分差。我也从数学老师那里得到了非常积极的反馈，刚改完前面几个大题，他就在很兴奋的跟我说，发现正确率挺高的，基本都是满分。不过唯一一道让大家全军覆没的，就是填空题的最后一题。懂的人可以来说一说这是个什么难度，反正我不太懂= = 还有一个有意思的就是，我在让Opus 4.8跑数学最后一道大题的时候，他莫名其妙的卡死了很多很多轮。。。不太有意思的就是，我忘记它一直在重试，导致我OpenRouter上为数不多的余额全给耗光了。。。不过最后好歹还是搞出来了。以上，大概就是这次AI高考的结果，跟我最开始预期的，还真的是有点区别。我又做了一下各家的位置图，大家可以看看。真的是情理之中，又是预料之外。还挺好玩的。忽然又想起，2023年，我第一次拿高考题去测AI。当时是让ChatGPT去写高考作文。那会儿GPT-4还是最能打的，国产模型甚至都还没有几个。 2024年，国产也开始卷起来了，但还是有很多哭笑不得的翻车。去年2025那次测完，有几个模型的数学水平已经够上一本线了。今年是2026。四年了。也算是见证了那好多好多个模型的浮沉。我们自己也在变，23年的时候，只会写个作文，去年测试，还是人工复制粘贴到十几个大模型的官网里面去测试，不断的roll。今年，写批量脚本，写LaTeX转译，请高考阅卷老师们助阵，又为他们徒手开发了阅卷网站。我当然也可以随手测一下整个活，但是想了想，这几年，在这个选题上，我觉得还是要尽可能的保证客观和公平。因为，这是高考。这两个字，在中国，承载的东西太多也太厚重了。做阅卷网站的时候，我一直在纠结用什么主意象，最后选了凤凰花。六月的凤凰花开得正盛，每年都准时赶在这个节点上，送走一届又一届的人。最后。我想用最近一段对我非常有感触的话来结尾，它来自《燕云十六声》最近更新的青州地图的最后的任务，当一众学子即将毕业之时，文津馆文元林险生对大家说： “你们，自天南地北负笈而来，今日散去，又是去往天南地北，此后山长水远，很多人将不复相见了。此去，必有风霜凛冽之时，愿诸君，乾坤既大，草木尤青，本心择路，笃志前行。各位，一路顺风。

译今年高考，12个国内外旗舰大模型（Claude Opus 4.8、GPT-5.5、Gemini 3.1 Pro、千问3.7 max、文心Ernie 5.1、星火Spark X2、智谱GLM5.1、Kimi k2.6、MiniMax M3、DeepSeek V4 Pro、小米MiMo v2.5 Pro、混元3）参加语文和数学全国一卷测试。采用API调用、禁止工具、LaTeX纯文本输入，4位高中老师盲评阅卷。总分第一：MiMo v2.5 Pro（256.3分），第二Kimi k2.6（256.29分），仅差0.01分。语文最高：GLM5.1和Gemini 3.1 Pro并列；数学最高：DeepSeek V4 Pro、MiMo、ERNIE 5.1并列。前九名模型总分差距仅2分，数学主观题正确率高，唯填空题最后一题全军覆没。作文评分看重结构清晰度与时代关联。

查看原推 ↗

Alibaba Cloud@alibaba_cloud · 5天前34

Drowning in admin work? 📩 In Alibaba Cloud Claw Talks EP5, Brian Turcotte (Kilo Code) shows how OpenClaw-powered personal AI agents offload emails, update your CRM, and reduce context switching。 🎥 Premieres June 9, 2026 at 5 PM (UTC+8) 👉 https://youtu.be/d3QV28XCq2Y

译被行政工作淹没了？📩 在阿里云 Claw Talks 第 5 期中，Brian Turcotte（Kilo Code）展示了由 OpenClaw 驱动的个人 AI 智能体如何帮你处理邮件、更新 CRM、减少上下文切换。 🎥 首播时间：2026 年 6 月 9 日下午 5 点（UTC+8） 👉 https://youtu.be/d3QV28XCq2Y

查看原推 ↗

ginobefun@hongming731 · 5天前14

看着很不错

译看着很不错 [引用 @AdrianPunk115]：http://x.com/i/article/2063125924263141376

查看原推 ↗

Rohan Paul@rohanpaul_ai · 5天前68

American AI startups are routing far more app traffic to Chinese LLMs. Through OpenRouter, weekly token consumption was mostly driven by U.S. models through much of 2025. But from early 2026, Chinese models suddenly became the main growth engine. AI model market is becoming less about brand loyalty and more about raw utility.

译Rohan Paul 引用 OpenRouter 数据指出，2025 年大部分周 token 消耗由美国模型驱动，但从 2026 年初开始，中国大语言模型突然成为主要增长引擎。引用推文称这是美国 AI 初创公司今年以来的显著转向。AI 模型市场正从品牌忠诚转向原始效用。

查看原推 ↗

Logan Kilpatrick@OfficialLoganK · 5天前18

bullish on Gemini

译看好 Gemini

查看原推 ↗

Ethan Mollick@emollick · 5天前32

A year ago the closest thing we had to an AI agent was o3.

译一年前，我们最接近AI智能体的是o3。

查看原推 ↗

Berryxia.AI@berryxia · 5天前21

首先特别感谢Panda以及各位伙伴的认可。我从去年4月中旬开始运营X平台，至今已经一年多了。其次，做这件事完全源于长久以来的热爱，因为喜欢，所以从来不会觉得疲惫。我也没有刻意定下目标、强求结果，顺其自然走下去，时间自然会给出答案。兄弟们，感谢大家的支持，我们继续干！

译Berry Xia发文感谢@PandaTalk8及伙伴，称去年4月中旬起运营X平台已超一年，出于热爱不疲，未设目标顺其自然。引述@PandaTalk8：X上对一个人印象可预期，是人设力量源于长期兴趣。@berryxia被列为AI出图分享者，与@dotey（Prompt工程）、@dongxi（AI论文算法解读）等同列。

查看原推 ↗

meng shao@shao__meng · 5天前73

让 Claude Opus 长时自主运行的 5 条核心实战建议来自 Claude Code 作者 Boris Cherny，咱们尽量体现独立于模型的建议，让它放到 Codex + GPT-5.5 等也能适用。 1. 启用 Auto Mode（自动权限模式）避免 Claude 频繁请求人工批准，让流程真正连续自主运行。 2. 采用 Dynamic Workflows（动态工作流）让 Claude 自主编排数百至数千个子 Agent，协同完成复杂任务。这是实现大规模长时任务的核心机制。 3. 使用 /goal 或 /loop 指令明确提示 Claude “持续推进直到任务完成为止”，防止中途停滞或过早收尾。 4. 优先使用云端 Claude Code 可随时关闭笔记本/电脑（推荐桌面或移动 App），真正实现无人值守长时间运行。 5. 确保端到端自我验证能力 · Web 项目：利用 Chrome 浏览器扩展中的 Claude MCP。 · 移动端：iOS/Android 模拟器 MCP。 · 后端服务：启动完整 Web Server 或服务进行验证。强调“self-verify its work end to end”，尤其结合动态工作流进行 E2E 测试、边缘案例和 UI 检查。提炼到独立于 Claude Opus 和 Claude Code： 1. 自动权限很重要，不然频繁找我确认，就不自动了 2. Goal 或 Loop 很强，不过要分任务，更适合高难度探索性、目标明确的任务，因为 token 消耗真的很高 3. 让本地电脑的关机、休眠等不成为障碍，不管是云端 Agent，还是保证本机能持续运行，都行 4. 端到端自我验证，最最重要，如果不能验证，token 消耗很可能变成无用功！！

译Boris Cherny 给出五条让 Claude Opus 自主运行数小时/天的建议：1. 开启 Auto Mode 减少审批；2. 用 Dynamic Workflows 编排数百至数千子 Agent；3. 使用 /goal 或 /loop 指令持续推进；4. 优先用云端 Claude Code，可关闭笔记本；5. 确保端到端自验证能力。邵猛补充：自动权限是前提；/goal、/loop 适合高难度任务但 token 消耗高；需解决本地关机/休眠；端到端验证最重要，否则 token 可能白费。

查看原推 ↗

François Chollet@fchollet · 5天前21

I wrote my first neural networks in pure C, then in Matlab, then in NumPy, before eventually upgrading to Theano. Since then I have seen and tried pretty much every NN framework ever developed. Some are bad, some are good. The good ones understand API design principles.

译我最初用纯C写神经网络，然后在Matlab里写，接着在NumPy里写，最后升级到Theano。从那以后，我见过并尝试过几乎所有开发出来的NN框架。有些很烂，有些很好。好的框架都理解API设计原则。

查看原推 ↗

SemiAnalysis@SemiAnalysis_ · 5天前40

Our Vera SOCAMM note is causing a bit of a stir. As always some folks are jumping to the wrong conclusions. Those saying this is fake news clearly didn't visit the Hynix booth at Computex.

译我们的 Vera SOCAMM 笔记引起了一些骚动。像往常一样，有些人得出了错误的结论。那些说这是假新闻的人显然没有在 Computex 参观 Hynix 的展台。

查看原推 ↗

宝玉@dotey · 5天前44

长时间运行 Agent，Agent 能自行验证才是关键，否则可能只是浪费 Token

译宝玉指出，Agent 能否自我验证是长时间运行的关键，否则可能浪费 Token。@bcherny 的基准测试显示 Claude Opus 最适合长时间运行，并给出 5 条自主运行技巧：1. 使用自动权限模式；2. 部署动态工作流让 Claude 协调数百/数千个 Agent；3. 用 /goal 或 /loop 指令持续推进；4. 在云端运行 Claude Code 以便关闭笔记本；5. 确保端到端自我验证——通过 Chrome 浏览器扩展验证网页、iOS/Android 模拟器 MCP 验证移动端、启动完整 Web 服务验证后端。

查看原推 ↗

jason@jxnlco · 5天前15

What are some features in cowork that you wish exited in codex? And vice versa?

译cowork 有哪些你希望 codex 也有的功能？反之亦然？

查看原推 ↗

Boris Cherny@bcherny · 5天前57

Seeing a number of benchmarks showing Opus is the best model for long-running work. Five tips for running Opus autonomously for hours/days: 1. Use auto mode for permissions, so Claude doesn’t ask for approval 2. Use dynamic workflows, to have Claude orchestrate hundreds/thousands of agents to get a task done 3. Use /goal or /loop, to nudge Claude to keep going until it’s done 4. Use Claude Code in the cloud, so you can close your laptop (easiest way is the desktop or mobile app) 5. Make sure Claude has a way to self-verify its work end to end: Claude in Chrome browser extension for web, iOS/Android sim MCP for mobile, a way to start the full web server or service for backend work

译多项基准显示 Claude Opus 是长时间运行工作的最佳模型。SWE-Marathon 基准评估编码智能体在 10 亿 token 预算下自主完成长期软件任务（如重写 JAX 代码为 PyTorch、用 Rust 构建 C 编译器）。Opus 在此类任务上领先。Boris Cherny 给出 5 个技巧：使用自动权限模式避免审批；用动态工作流协调数百/数千个智能体；用 /goal 或 /loop 推动持续执行；在云端使用 Claude Code（桌面/移动端）以便关闭笔记本；确保 Claude 能端到端自验证——Chrome 扩展验证网页、iOS/Android 模拟 MCP、启动完整后端服务。

查看原推 ↗

jason@jxnlco · 5天前47

i refer to these people 'the car guys of ai' they are just working on their car all the time

译我将这些人称为“AI的汽车爱好者”，他们只是一直在修理他们的车。

查看原推 ↗

Greg Brockman@gdb · 5天前20

interesting

译有趣

查看原推 ↗

meng shao@shao__meng · 5天前23

这篇公众号真的太典型的中国自媒体风格了，咋咋呼呼，各种定论，论据基本靠嘴。。。大厂抢青少年？这难道不是培训机构的生意而已？最小年龄低至 6 岁，学 Agent、Coding？连幼儿园的孩子也不放过了？抢人和裁员的这段，看到「虾」这个字，就完全没欲望读了，一定对 AI 一无所知的编辑写的。我可以拍脑袋说，靠 AI 裁员，只是企业经营无方，给自己找的一个体面的借口罢了。。林凡？脉脉 CEO？去年 AI 人才需求增长 10 倍？今年又增长了 8.7 倍？哪来的数据啊？是脉脉里的职位？那玩意真的有人在用？会不会是把原来的职位，改了个名字，加个 AI 的关键词？

译邵猛发文批评某公众号文章，称其是典型中国自媒体风格——咋咋呼呼、定论多、论据靠嘴。文章提到“大厂抢青少年”（最小6岁学Agent、Coding），邵猛认为这只是培训机构的生意。文章还声称“靠AI裁员”，邵猛斥之为企业借口。邵猛特别质疑脉脉CEO林凡的数据：去年AI人才需求增长10倍、今年再增长8.7倍，怀疑这些数字来自脉脉内部职位，且可能只是旧职位改名加“AI”关键词，并非真实需求。

查看原推 ↗

meng shao@shao__meng · 5天前59

不写 Prompt，写 Loops -- Boris Cherny (Claude Code) 道理大家都懂，伴随 Claude Opus 4.8 和 GPT-5.5 这种高智能、高推理和编程能力的模型出现，模型能自主决策和解决的问题复杂度越来越高，已经不需要我们一问一答的手把手写 Prompt 可是，不管是 Loops 还是 Codex Goals，都有一个不得不面对的问题，Token！Token！还是 Token！因为他们消耗 Token 真的太快了，可能一个 Goals 就干没了我 5 小时的用量，我们还远没有到 Token 自由的阶段，特别在企业里还要严格审查 Token 消耗的 ROI，所以在企业中大家还是会把前置的 Spec、AGENTS.md 等尽量写明约束，让 AI 尽量做确定性可控的部分。

译Anthropic Claude Code 负责人 Boris Cherny 表示，他不再手动写提示词，而是编写 Loops 让 AI 自主决策和解决问题。伴随 Claude Opus 4.8 和 GPT-5.5 等高智能模型出现，手把手写 Prompt 的模式将被取代。但 Loops 方案消耗 Token 过快，一个 Goals 可能耗尽 5 小时用量，企业仍需严格审查 Token 消耗的 ROI，因此实践中会通过前置的 Spec、AGENTS.md 等约束让 AI 做确定性可控的部分。Boris 预测这一转变将在今年剩余时间持续。

查看原推 ↗

meng shao@shao__meng · 5天前44

你现在在用哪个 Coding Agent？ Warp 团队 @BHolmesDev 发出的调查得到了 2095 个投票，其中 Codex App 占到 51.1%、Warp CLI 占到 30.9%、Claude App 7.4% 没错，Claude App 只有 7.4%，因为投票中没有包含 Claude Code 😄

译你现在在用哪个 Coding Agent？ Warp团队 @BHolmesDev 进行的调查得到了 2095 个投票，其中 Codex App 占到 51.1%、Warp CLI 占到 30.9%、Claude App 7.4% 没错，Claude App 只有 7.4%，因为投票中没有包含 Claude Code 😄

查看原推 ↗

6月8日

22:19

Orange AI@oran_ge

41

创作的核心往往根植于不可测度的人类情感、不可言说的共鸣，这都是理性分析难以捕捉的人类未来可以和AI竞争的领域，可能恰恰是我们作为人类有缺陷的心灵角落。 -李诞

大佬观点现象/趋势

22:14

elvis@omarsar0

53

关键在于，你应该开始实施在自动化中编码带有明确目标的指令/提示词的方法。这并不是什么新鲜事，但较新的大语言模型正在被训练以更长时间不间断地执行。循环就是利用这一点的一种方式。

Peter Steinberger 🦞: Here's your monthly reminder that you shouldn't be prompting coding agents anymore. You should be designing loops that p...

智能体大佬观点编码

22:06

小互@xiaohu

26

应该是暗示全新的Siri

大佬观点语音

21:40

meng shao@shao__meng

60

邵猛开源 Markdown 转 X Article 格式 Skill

邵猛批评 X Article 编辑器难用、不支持 Markdown 格式，并用 Codex 创建了一个 Skill「md-to-x-article-skill」，可将 Markdown 自动转换为 X Article 展示格式。该工具已开源在 GitHub（shaom/md-to-x-article-skill），用户可 Fork 后按需微调。

GitHub开源/仓库

21:36

小互@xiaohu

精选79

小互开源视频翻译工具：一句话自动下载、转写、翻译、烧字幕

小互（@xiaohu）开源视频翻译工具（xiaohu-video-translate），只需说一句“把链接翻译成中文字幕视频”即可全自动完成下载、Whisper本地转写、AI翻译润色、烧字幕、出文稿。转写本地运行，不花API费。支持YouTube、Bilibili、抖音等链接及本地文件，英语、日语、韩语、法语、西班牙语等均可转成中文字幕。字幕精确到词级时间戳，按语义断句，每行不超过12字，双语模式下中文大英文小。提供纯中文与中英双语模式。工具由三个子技能组成，可单独或串联使用，适配Claude Code、Codex、OpenClaw等AI编程工具。已开源，附安装指南。

GitHub开源/仓库视频语音

推荐理由：小互把自己用了半年的视频翻译工具开源了，本地Whisper转写加AI润色，下载、翻译、烧字幕一句话搞定，做海外视频搬运或想省时间的，装一下就能省掉大半天手工。

21:27

AYi@AYi_AInotes

24

用户自建本地视频剪辑工具生成吉卜力风格口播视频

剪映翻译效果不佳，作者尝试自建了一个本地视频剪辑应用，主要功能为视频翻译和字幕。近日测试了根据文档自动生成口播视频的功能，并输出了一段吉卜力动漫风格的视频。作者表示后续将迭代增加动画效果，可用于微信视频号内容创作。

教程/实践编码视频

21:11

Chubby♨️@kimmonismus

56

一个行走的矛盾体：一方面，来自Anthropic的Daniela表示，AI迄今为止几乎没有取代任何工作岗位；另一方面，联合创始人Olah却向教皇警告AI对劳动力市场和社会的破坏性影响。

Anthropic大佬观点现象/趋势

20:36

小互@xiaohu

45

人机协作优于完全自动化：关键节点人工介入

小互分享个人经验：此前追求完全自动化，导致不断与AI扯皮、对技能和系统频繁修改，效果反而更差。现在删除所有规则，只在关键节点人工介入，与AI共同完成任务，不仅效果更好，人也轻松许多，不再频繁抱怨AI。

智能体大佬观点

20:14

歸藏(guizang.ai)@op7418

67

在字节工作8年的动效设计师笑林（@xiaolinbythesea）分享了设计工程师的五种画像：1） AI Design Engineer--将AI能力转化为可交互产品；2） Product UI Craft Engineer--从Figma写出高质量React原型；3） Design Systems Engineer--建立设计系统与代码基础设施；4） Creative Technologist--负责Canvas/WebGL动效与生成式视觉；5） AI Design Workflow Architect--搭建AI工具协作流程。他所在的豆包手机团队也在招聘侧重Android的设计工程师。

笑林: Cursor 招聘设计工程师了,非常令人心动,但我还犹豫着不能行动; 我在字节工作了8年,一直游走在动效设计师和设计工程师之间。最近我的团队(豆包手机团队)也在招聘设计工程师,但是我们需要的方向更多要有一些对 Android 平台的了解,和...

智能体现象/趋势

20:14

郭明錤｜Ming-Chi Kuo@mingchikuo

65

WWDC26 不影響 Apple 2H26 股價正向趨勢，但將揭露多頭敘事續航力

郭明錤指出，Apple 當前多頭核心敘事是「AI 雖落後但最終後來居上」。供應鏈調查顯示其業績將好到今年底，進一步強化此敘事。WWDC26 上無論發布什麼，只要該敘事不被破壞，Apple 2H26 股價正向趨勢就不易改變。真正觀察點在於：Apple 能否用 Gemini 做出比 Google 更好的 AI 應用、AI 智能體工作流及設備端+雲端混合體驗。答案肯定則利好敘事延續；否則「Gemini 決定 Apple AI 上限」的質疑將削弱「後來居上」共識。

智能体大佬观点端侧

20:14

郭明錤｜Ming-Chi Kuo@mingchikuo

60

郭明錤：WWDC26不影响苹果2026下半年股价积极趋势，但考验看涨叙事持久力

郭明錤指出，苹果核心看涨叙事是“AI暂时落后但最终会迎头赶上”。供应链显示业务势头年底前强劲，强化“无AI已不错，有AI更想象”叙事。故无论WWDC26内容，只要叙事不变，苹果2026下半年股价趋势积极。WWDC26真正看点在于苹果能否用同款Gemini做出比谷歌更好的AI应用、智能体工作流及端云混合体验。若能，叙事延续；若不能，Gemini设定AI上限，“苹果最终领先”将受质疑。

智能体Google大佬观点推理

19:41

Chubby♨️@kimmonismus

43

有趣的是，科学家似乎越来越分为两个对立阵营：AI怀疑论者和AI乐观论者。 150位数学家警告政府不要"相信炒作"。与此同时，像陶哲轩这样的菲尔兹奖得主则对像GPT-5.5 Pro这样能解决无数问题的程序印象深刻。在我的非AI圈熟人当中，仍然有很多怀疑。对他们来说，AI只不过是一个聊天机器人。我认为还需要更多的教育。

OpenAI现象/趋势

19:27

AYi@AYi_AInotes

52

AI创作者的品牌信任来自视觉信号

推文引用Rick Rubin的两张对比图（同一个人、同件白T恤，短发严肃与长发大胡子），说明品牌不是你说什么，而是别人看到你时自动生成的那句话。AI内容创作者花时间在内容上，但视觉形象（头像、封面、风格）未跟上，导致信任打折。当前AI内容池中大部分人看起来一模一样，视觉信号在拆内容的台。建议创作者检查自己的头像和配图，确保在别人读一个字之前，视觉信号传递的第一句话与内容一致。

dany: a reminder that branding matters.

现象/趋势

18:44

🚨 AI News | TestingCatalog@testingcatalog

56

感谢 Ideogram 发送了这个 ❤️ Ideogram 4.0 是上周最大的发布之一！尤其对开源社区而言。测试了一下 👀

Ideogram: Today we published a technical blog post about Ideogram 4.0 - our goal is to enable more innovation and creativity. It's...

图像生成开源生态模型发布

18:15

数字生命卡兹克@Khazix0918

67

微信Agent消息频传：内测右滑唤出、联手手机厂商、发布开发者指引

近日微信Agent消息密集：6月2日外媒称腾讯正测试嵌入微信的AI Agent，用户右滑唤出窗口，可通过自然语言调用数百万小程序完成点单等任务；6月4日微信与华为等手机厂商合作推出A2A能力，可通过语音助手发起音视频通话；6月8日发布开发者指引，提供自动接入模式，因小程序运行在微信沙箱内，微信可直接读取与分析。这标志着微信Agent正连接硬件生态与内部小程序，触及Agentic Commerce雏形。

智能体现象/趋势

17:40

Chubby♨️@kimmonismus

17

这是我见过最好的骑鹈鹕SVG。Claude Mythos 是个猛兽--绝对的强者。热度的与日俱增。

Chetaslua: 🧜♂️ Made by Mythos Preview > Xbox svg > Pelican riding bike All these 4 are created by my boii @MarsForTech , go follow...

Anthropic其他

16:40

Chubby♨️@kimmonismus

55

AI将率先在银行业引发大规模失业

银行业正公开为AI驱动的裁员做准备。摩根大通、花旗、高盛、渣打银行高管承认，随着AI技术普及，许多岗位将被淘汰。初级分析师班级规模削减幅度高达三分之二，导致学生难以进入金融行业，尽管银行仍主要从这些初级群体中招募AI人才。与此同时，银行也在推出针对性AI应用，如花旗的财富管理化身和Revolut的APP内助手。不过，有人质疑并非所有宣布的裁员都真正由AI驱动，可能只是掩盖之前的过度招聘。

大佬观点现象/趋势

16:38

meng shao@shao__meng

精选78

邵猛开源 Brand to DESIGN.md 技能，提醒复刻易生新"AI Slop"

邵猛关注 Design Skill、Taste Skill、Anti-AI-slop design skill，并开源 Brand to DESIGN.md Skill（GitHub: shaom/brand-to-design-md-skill），让 Agent 学习设计品味后复刻网站。但他指出，这种复刻看多了反而从 Anti-AI-slop 衍生新“AI Slop”，缺少设计精髓，仅皮毛相仿。

智能体GitHub开源/仓库

推荐理由：邵猛这个 skill 把品牌手册一键转成 Agent 可用的 DESIGN.md，虽然 AI 复刻设计仍缺灵魂，但至少能让 Agent 立刻有规范可循，做设计的可以直接套用。

16:13

歸藏(guizang.ai)@op7418

53

藏师傅社交媒体卡片Skill重磅升级

藏师傅的社交媒体卡片 Skill 即将迎来重大升级，新增对小红书 Live Photo 的支持。该功能可帮助用户制作带文字排版的动态 Live Photo，使发布动态内容时仍能以图文形式呈现，无需制作完整视频。具体细节尚未公布，但用户可期待更便捷的社交媒体内容创作体验。

歸藏(guizang.ai): http://x.com/i/article/2059811469081141248

图像生成教程/实践

16:13

歸藏(guizang.ai)@op7418

55

藏师傅的社交媒体卡片 Skill 即将重磅升级，可制作小红书动态带文字排版的 Live Photo，方便以图文形式发布动态内容。随后实测发现公众号图文卡片同样支持 Live Photo，但需通过 iPhone 上传。

歸藏(guizang.ai): 藏师傅的社交媒体卡片 Skill,即将迎来一个非常重磅的升级。可以帮大家解决小红书 Live Photo 的制作问题,同时会帮你制作动态的带文字排版的 Live Photo 这样你可以在发布一些必须的动态内容的时候,依然以图文的形式发布,...

图像生成教程/实践

13:34

Deedy@deedydas

70

AI电影《Hell Grind》制作分析：50万美元成本、14天完成，但质量平庸

95分钟AI电影《Hell Grind》由15人14天完成，成本50万美元（80%为算力）。相比中位数美国电影（约200人2年、1800万美元），实现660倍人时、50倍时间、36倍成本改善。影片从约100小时AI生成素材（使用字节跳动Seedance等模型）中按64:1比率剪辑。质量方面，角色一致性、摄像机角度和写实感基本解决，但剪辑过多、角色口音多变、AI合成声音明显，动作和编排生硬——整体平庸，主因是导演选择而非模型限制。作者认为这是AI电影最差、最慢、最贵的时刻，未来创作者将直接投放YouTube。

图像生成大佬观点视频

13:27

AYi@AYi_AInotes

30

推荐一个完全免费的大模型驾驭工程学习网站，号称全网最好，但90%的AI工程师可能都没听说过。链接位于评论区，建议收藏学习。

AYi: http://x.com/i/article/2063237792746831872

教程/实践

12:44

数字生命卡兹克@Khazix0918

64

12个旗舰大模型参加高考语文数学测试，MiMo v2.5 Pro总分第一

今年高考，12个国内外旗舰大模型（Claude Opus 4.8、GPT-5.5、Gemini 3.1 Pro、千问3.7 max、文心Ernie 5.1、星火Spark X2、智谱GLM5.1、Kimi k2.6、MiniMax M3、DeepSeek V4 Pro、小米MiMo v2.5 Pro、混元3）参加语文和数学全国一卷测试。采用API调用、禁止工具、LaTeX纯文本输入，4位高中老师盲评阅卷。总分第一：MiMo v2.5 Pro（256.3分），第二Kimi k2.6（256.29分），仅差0.01分。语文最高：GLM5.1和Gemini 3.1 Pro并列；数学最高：DeepSeek V4 Pro、MiMo、ERNIE 5.1并列。前九名模型总分差距仅2分，数学主观题正确率高，唯填空题最后一题全军覆没。作文评分看重结构清晰度与时代关联。

AnthropicDeepSeekOpenAI现象/趋势

12:35

Alibaba Cloud@alibaba_cloud

34

被行政工作淹没了？📩 在阿里云 Claw Talks 第 5 期中，Brian Turcotte（Kilo Code）展示了由 OpenClaw 驱动的个人 AI 智能体如何帮你处理邮件、更新 CRM、减少上下文切换。 🎥 首播时间：2026 年 6 月 9 日下午 5 点（UTC+8） 👉 https：//youtu.be/d3QV28XCq2Y

智能体MCP/工具教程/实践

12:11

ginobefun@hongming731

14

看着很不错【引用 @AdrianPunk115】：http：//x.com/i/article/2063125924263141376

Adrian Punk: http://x.com/i/article/2063125924263141376

其他

12:08

Rohan Paul@rohanpaul_ai

68

Rohan Paul 引用 OpenRouter 数据指出，2025 年大部分周 token 消耗由美国模型驱动，但从 2026 年初开始，中国大语言模型突然成为主要增长引擎。引用推文称这是美国 AI 初创公司今年以来的显著转向。AI 模型市场正从品牌忠诚转向原始效用。

nxthompson: This is a pretty striking shift toward Chinese models by American AI startups since the start of the year. https://subst...

开源生态现象/趋势

11:24

Logan Kilpatrick@OfficialLoganK

18

Google大佬观点

11:06

Ethan Mollick@emollick

32

一年前，我们最接近AI智能体的是o3。

智能体大佬观点

11:00

Berryxia.AI@berryxia

21

Berry Xia：致谢Panda与伙伴，分享X平台运营感悟

Berry Xia发文感谢@PandaTalk8及伙伴，称去年4月中旬起运营X平台已超一年，出于热爱不疲，未设目标顺其自然。引述@PandaTalk8：X上对一个人印象可预期，是人设力量源于长期兴趣。@berryxia被列为AI出图分享者，与@dotey（Prompt工程）、@dongxi（AI论文算法解读）等同列。

Mr Panda: 在X 上你对一个人印象和期待都是可预期的。我认为这就是人设的力量, 这个人设并不是人为立出来的, 而是你对某一样的事物长期兴趣在哪里, 然后在会体现在的你的每一条推文。比如 @dotey Prompt 工程的分享, @dongxi 马东...

其他

10:38

meng shao@shao__meng

73

让 Claude Opus 长时自主运行的五条实战建议

Boris Cherny 给出五条让 Claude Opus 自主运行数小时/天的建议：1. 开启 Auto Mode 减少审批；2. 用 Dynamic Workflows 编排数百至数千子 Agent；3. 使用 /goal 或 /loop 指令持续推进；4. 优先用云端 Claude Code，可关闭笔记本；5. 确保端到端自验证能力。邵猛补充：自动权限是前提；/goal、/loop 适合高难度任务但 token 消耗高；需解决本地关机/休眠；端到端验证最重要，否则 token 可能白费。

Boris Cherny: Seeing a number of benchmarks showing Opus is the best model for long-running work. Five tips for running Opus autonomou...

智能体AnthropicMCP/工具教程/实践

10:37

François Chollet@fchollet

21

我最初用纯C写神经网络，然后在Matlab里写，接着在NumPy里写，最后升级到Theano。从那以后，我见过并尝试过几乎所有开发出来的NN框架。有些很烂，有些很好。好的框架都理解API设计原则。

Google大佬观点

10:11

SemiAnalysis@SemiAnalysis_

40

我们的 Vera SOCAMM 笔记引起了一些骚动。像往常一样，有些人得出了错误的结论。那些说这是假新闻的人显然没有在 Computex 参观 Hynix 的展台。

行业动态

10:04

宝玉@dotey

44

宝玉指出，Agent 能否自我验证是长时间运行的关键，否则可能浪费 Token。@bcherny 的基准测试显示 Claude Opus 最适合长时间运行，并给出 5 条自主运行技巧：1. 使用自动权限模式；2. 部署动态工作流让 Claude 协调数百/数千个 Agent；3. 用 /goal 或 /loop 指令持续推进；4. 在云端运行 Claude Code 以便关闭笔记本；5. 确保端到端自我验证--通过 Chrome 浏览器扩展验证网页、iOS/Android 模拟器 MCP 验证移动端、启动完整 Web 服务验证后端。

Boris Cherny: Seeing a number of benchmarks showing Opus is the best model for long-running work. Five tips for running Opus autonomou...

智能体AnthropicMCP/工具大佬观点

09:49

jason@jxnlco

15

cowork 有哪些你希望 codex 也有的功能？反之亦然？

OpenAI其他编码

09:46

Boris Cherny@bcherny

57

Claude Opus 长时间运行工作最佳模型及自主运行技巧

多项基准显示 Claude Opus 是长时间运行工作的最佳模型。SWE-Marathon 基准评估编码智能体在 10 亿 token 预算下自主完成长期软件任务（如重写 JAX 代码为 PyTorch、用 Rust 构建 C 编译器）。Opus 在此类任务上领先。Boris Cherny 给出 5 个技巧：使用自动权限模式避免审批；用动态工作流协调数百/数千个智能体；用 /goal 或 /loop 推动持续执行；在云端使用 Claude Code（桌面/移动端）以便关闭笔记本；确保 Claude 能端到端自验证——Chrome 扩展验证网页、iOS/Android 模拟 MCP、启动完整后端服务。

Rishi Desai: Can coding agents stay coherent over a 1 billion token budget? Can they build Slack from scratch? Rewrite a JAX codebase...

智能体AnthropicMCP/工具教程/实践

09:19

jason@jxnlco

47

我将这些人称为"AI的汽车爱好者"，他们只是一直在修理他们的车。

Karri Saarinen: The thing about people talking about building with AI is that they always talk about how they're building, what tools th...

大佬观点现象/趋势

09:16

Greg Brockman@gdb

20

Ben Holmes: How do you use coding agents right now?

OpenAI大佬观点

09:07

meng shao@shao__meng

23

邵猛批评公众号文章：AI人才数据夸大无据

邵猛发文批评某公众号文章，称其是典型中国自媒体风格——咋咋呼呼、定论多、论据靠嘴。文章提到“大厂抢青少年”（最小6岁学Agent、Coding），邵猛认为这只是培训机构的生意。文章还声称“靠AI裁员”，邵猛斥之为企业借口。邵猛特别质疑脉脉CEO林凡的数据：去年AI人才需求增长10倍、今年再增长8.7倍，怀疑这些数字来自脉脉内部职位，且可能只是旧职位改名加“AI”关键词，并非真实需求。

大佬观点现象/趋势

09:07

meng shao@shao__meng

59

不写 Prompt，写 Loops - Boris Cherny 谈 AI 编程范式转变

Anthropic Claude Code 负责人 Boris Cherny 表示，他不再手动写提示词，而是编写 Loops 让 AI 自主决策和解决问题。伴随 Claude Opus 4.8 和 GPT-5.5 等高智能模型出现，手把手写 Prompt 的模式将被取代。但 Loops 方案消耗 Token 过快，一个 Goals 可能耗尽 5 小时用量，企业仍需严格审查 Token 消耗的 ROI，因此实践中会通过前置的 Spec、AGENTS.md 等约束让 AI 做确定性可控的部分。Boris 预测这一转变将在今年剩余时间持续。

Rohan Paul: "I don't prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write ...

智能体Anthropic大佬观点编码

09:07

meng shao@shao__meng

44

你现在在用哪个 Coding Agent？ Warp团队 @BHolmesDev 进行的调查得到了 2095 个投票，其中 Codex App 占到 51.1%、Warp CLI 占到 30.9%、Claude App 7.4% 没错，Claude App 只有 7.4%，因为投票中没有包含 Claude Code 😄

Ben Holmes: How do you use coding agents right now?

智能体现象/趋势编码