基准测试显示,Cursor Composer 2.5在编程任务中展现出卓越的成本与效率优势。其单任务成本仅为Claude Opus 4.7的1/3至1/18,更是GPT-5.5的1/5至1/32。这一低成本源于其极高的token使用效率:完成全部测试仅消耗1.6M token,远低于同类模型的5.7M。效率方面,其平均任务完成时间约9分钟,比行业平均水平快约1.3倍,其快速版本更可将时间缩短至约7分钟。
Cursor Composer 2.5's is 3–18x cheaper than Opus 4.7 in Claude Code (medium reasoning), and 5–32x cheaper than GPT-5.5 in Codex (medium) based on API pricing This low Cost per Task isn't just driven by relatively low token pricing, it's also driven by low relatively low token usage compared to other leading models. @cursor_ai Composer 2.5 only used 1.6M token to complete our Coding Agent Index benchmarks, while other models used up to 5.7M. This lower token usage also contributes to a low Time per Task. Across the Coding Agent Index configurations shown, average Time per Task was ~12 minutes. Composer 2.5 completed tasks in ~9 minutes on average, making it ~1.3x faster than average, while Composer 2.5 Fast completed tasks in ~7 minutes, making it ~1.8x faster than the average across agents. Link to full benchmark results below
译基准测试显示,Cursor Composer 2.5在编程任务中展现出卓越的成本与效率优势。其单任务成本仅为Claude Opus 4.7的1/3至1/18,更是GPT-5.5的1/5至1/32。这一低成本源于其极高的token使用效率:完成全部测试仅消耗1.6M token,远低于同类模型的5.7M。效率方面,其平均任务完成时间约9分钟,比行业平均水平快约1.3倍,其快速版本更可将时间缩短至约7分钟。
"Sometimes people outside AI say things like 'it can't be that bad, there must be experts on top of it.'" "As 'an expert', I would like to be clear we are *not* on top of it." "We are on track for human extinction/permanent disempowerment, possibly within the next few years."
译推文作者以专家身份明确指出,外界普遍认为AI发展在专家掌控之中的看法是错误的。核心观点是,AI领域专家实际上并未控制当前局面,且认为人类正朝着灭绝或永久失权的道路上发展,并可能在几年内发生。
好思路🫡
译一种轻量化的Codex远程服务器配置方案。无需安装完整版应用,仅需在远程服务器上安装并运行CLI版Codex。执行`codex remote-control`命令后,手机端ChatGPT应用内的Codex功能即可发现并连接该服务器,远程体验与完整版无异。两种配置在应用内通过不同图标(“终端”与“电脑”)进行区分。
"But Cars Don't Actually Run," Says Increasingly Nervous Horse For the 7th Time This Year
译这篇推文通过一匹马反复否定汽车能力的幽默比喻,讽刺了人类面对AI等新技术时重复出现的恐惧心理。引用部分列举了多种将人类思维简单还原或否定的论调(如“只是模仿/数学/本能”)。核心观点是,当前对AI的担忧延续了历史模式,且这些用来贬低AI的“简化论”论据,同样可以荒谬地应用于否定人类自身的思维复杂性。
Damn!喜大普奔啊铁汁们, V4-Pro 的 75% 折扣, 今天宣布永久化了!! 感觉DeepSeek 这次不单纯是降价,更像是在打定价权。 输出价格 $0.87/M tokens,对比一下主流模型普遍在 15 区间。 这不是便宜一点,简直是直接击穿了整个行业的定价体系。 再看他们的路径:限时折扣 → 延长一个月 → 今天直接取消期限。 三连击,每一步都是精心设计的传播节点,最后一击直接告诉所有人: 以后高性能模型就该这个价。 但真正值得琢磨的还不是价格数字,是这个词——永久。 一句话概括,就是短期促销是战术,永久降价是战略。 这意味着AI 模型的商业模式正在从卖服务转向卖基础设施,类似水电煤的逻辑——低单价、高用量、规模经济。 我猜DeepSeek 要的不是这几个月的收入,要的是海量真实使用数据、开发者生态、和定价话语权。 也就是先规模、后利润, 当年字节和拼多多怎么走的路, 现在 AI 模型公司就怎么走。 以前高性能模型是奢侈品, 现在有人把它打成了日用品。 下一次别人发定价页的时候,都得先看一眼 DeepSeek 的数字🤣
译DeepSeek将其高性能模型V4-Pro的限时75%折扣宣布为永久性调整,输出价格降至0.87美元/百万tokens,远低于行业主流定价区间。此举不仅是促销,更被视为争夺定价权的战略行动,标志着AI模型的商业模式正从服务转向类似水电煤的基础设施逻辑。DeepSeek通过“永久”降价,意图以低单价换取海量使用数据、开发者生态及行业定价话语权,追求规模优先的路径。
Cartesia’s Sonic-3.5 takes the #1 spot on the Artificial Analysis Speech Arena Leaderboard, surpassing Inworld Realtime TTS 1.5 Max and Google’s Gemini 3.1 Flash TTS Sonic-3.5 is the latest TTS model from @cartesia . It supports 42 languages, including 9 Indian languages, with 500+ voices available out of the box. The model has been highly preferred among voters in the TTS Arena, with its demonstrated naturalness and accurate transcript following. Key takeaways: ➤ Quality: Sonic-3.5 has an Elo score of 1,218 (+16/-16) based on 1,144 arena appearances, placing it ahead of Inworld Realtime TTS 1.5 Max at 1,194 and Gemini 3.1 Flash TTS at 1,209 ➤ Pricing: Sonic-3.5 is priced at $39/1M characters, a premium compared to Gemini 3.1 Flash TTS at $18.3/1M characters, and Inworld Realtime TTS 1.5 Max at $35/1M characters ➤ Speed: 105.5 characters per second, compared to 205 characters per second for Inworld Realtime TTS 1.5 Max and 26.3 characters per second for Gemini 3.1 Flash TTS See more details and listen to samples below 🧵
译Cartesia公司最新发布的语音合成模型Sonic-3.5在Artificial Analysis Speech Arena排行榜上位居第一,超越了Inworld Realtime TTS 1.5 Max和Google Gemini 3.1 Flash TTS等竞品。该模型支持42种语言(包括9种印度语言),提供超过500种声音选择。评测数据显示,Sonic-3.5以1,218的Elo分数领先,表现出自然的语音效果和准确的文本跟随能力。其定价为每百万字符39美元,高于竞品;生成速度为每秒105.5字符,介于其他两者之间。
Great BoM Analysis from our friends at Morgan Stanley A couple things to point out: 1. The memory value indicated here is referring to the LPDDR5x SOCAMM and the NVMe SSD. It does not include the HBM value, which is included in the GPU item. 2. The memory value indicated here does not equal revenue to the memory vendors, given that Nvidia charges margin on top of the cost they purchased the memory at. 3. PCB content increase stems from the cableless design, which drives significant PCB area increase and material upgrades 4. The total BoM price indicated here is the OEM channel price. Hyperscaler and Neoclouds will have lower BoM compared to this. Our institutional clients have had these insights since February 2026 from our VR NVL72 BoM Report https://semianalysis.com/vr-nvl72-model/. We also analyze the networking connector and backplane content along side many other contents. Also we discussed the changes in the supplier landscape from GB to VR NVL72. Contact sales@semianalysis.com if you are interested.
译本文解读了摩根士丹利关于英伟达VR200服务器物料清单的分析。报告特别指出,所列“记忆”成本仅指LPDDR5x SOCAMM与NVMe SSD,不含包含在GPU内的HBM成本;该成本也非存储厂商的最终收入,因英伟达加收了利润。BoM成本上升主要源于无缆设计导致PCB面积与材料升级。需注意此价格为OEM渠道价,超大规模用户成本更低。SemiAnalysis称其机构客户自2026年2月起已通过报告获此洞察,并涵盖更多组件与供应商分析。
"Many of you don’t know, at one point Masayoshi Son (SoftBank CEO) was the largest shareholder of NVIDIA.” ~ Jensen Huang SoftBank’s Nvidia stake peaked at 4.9%, which is 0% now, and would be ≈$259B today if Masayoshi held on to it.
译"你们很多人不知道,软银CEO孙正义曾经是英伟达最大的股东。" ~ 黄仁勋 软银持有的英伟达股份峰值为4.9%,现在已清零,如果孙正义当时持有至今,价值将约为2590亿美元。
The best way to learn AI is to build with agents. To help with that, we've launched hands-on labs and a new series on Agentic Engineering. First topic: Agent Skills. Next in the pipeline: planning, context engineering, multi-agent systems, long-running agents,.. Go build!
译学习AI的最佳方式是通过构建智能体来实践。 为此,我们推出了实践实验室和关于智能体工程的新系列。 首个主题:智能体技能。 后续计划:规划、上下文工程、多智能体系统、长期运行智能体等。 开始构建吧!
I think people don't realize why Gemini Omni is different than other video AIs. It is fully multimodal, so it can edit video natively, too I took the famous "train " movie from 1896 & made it a bullet train, LEGO, added a time traveler, a centipede, muppets... (see reflections?)
译我认为人们没有意识到Gemini Omni与其他视频AI的不同之处。它是完全多模态的,因此也能原生编辑视频。 我拿了1896年著名的“火车”电影,把它变成了高铁、乐高,加入了时间旅行者、蜈蚣、布偶……(看到倒影了吗?)
Kakuna: skills with checklists that only know how to harden your codebase /plan with it then let it /goal for a day, it comes back with same functionality but all the boring stuff done for you + an audit of its own work. focus on subagent parallelism and encodes strong opinions on how AI engineers should design apps for human and agent access/devops/product mgmt. instead of dark factory, go "mullet factory" - party in front (ship unique lovable features), dark in the back (timeless production principles). basically its the antientropy/antislop part of symphony broken out as its own thing not gonna go psychosis further than this but extend as you will. link below
译Kakuna是一款AI代理工具,旨在将早期快速原型自动转化为可维护的生产级代码库。它通过内置的检查清单和“计划-目标”工作流,模拟人类开发与运维流程,在保持功能不变的前提下,自动执行代码审查、测试补充、重构等“无聊”工作,并强调子代理并行以提升效率。该工具是为“人类与代理协作”而设计的范例,其核心是“反熵增”与“反代码腐化”。例如,一次约16小时的运行能生成上百次提交,将一个脆弱的MVP转变为一个结构清晰、可长期构建的稳定项目。
Big fan of teaching more people the basics of using Claude Code in an accessible way. So much of the world has not yet used agents. There's a lot of opportunity to level the playing field and expand access.
译推文介绍了一个名为“zero2claude”的免费课程,旨在帮助完全没有编程或终端使用经验的用户系统学习并掌握Claude Code。课程内容从零基础逐步深入至高级应用,目前已吸引超过1.7万名学生,并提供7种语言版本。值得注意的是,整个教学平台完全由一人借助Claude Code独立构建和运营,其出色的性能表现(如高访问量与极低错误率)验证了Claude Code开发生产级产品的能力。推广者强调,扩大AI应用的关键在于赋能用户提升技能,而非简化工具本身,因此该课程不设任何付费门槛,完全免费向社区开放。
Sundar Pichai: - At the frontier labs competition is fierce - Only few labs are really at the frontier & then there is a big gap. - If recursive self-improvement emerges, we need more seriousness & it then becomes a societal issue, not one company’s call
译Sundar Pichai: - 在前沿实验室,竞争非常激烈 - 真正处于前沿的实验室很少,之后存在巨大差距 - 如果递归自我改进出现,我们需要更严肃对待,这将成为社会问题,而非一家公司能决定
Let that sink in for a moment. DeepSeek v4 pro 75% discount. Permanent! In: $0.43 Out: $0.87 If you read the DeepSeek v4 tech paper you know that this model is insanely good when it comes to efficiency. Only 27% compute and only 10% cache compares to v3.2. SemiAnalysis wrote a great article. DeepSeek is now all about cost / token efficiency.
译让我们稍作思考。 DeepSeek v4 pro 降价75%。永久有效! 输入:$0.43 输出:$0.87 如果你读过 DeepSeek v4 的技术论文,就会知道这个模型在效率方面表现惊人。 相比 v3.2,它仅需 27% 的算力和 10% 的缓存。SemiAnalysis 写了一篇很好的文章。 DeepSeek 现在专注于成本/token 效率。
GIVE ME MYTHOS GIVE ME MYTHOS GIVE ME MYTHOS GIVE ME MYTHOS GIVE ME MYTHOS I’m tired of babysitting these dumb LLMs.......
译给我MYTHOS 给我MYTHOS 给我MYTHOS 给我MYTHOS 给我MYTHOS 我厌倦了照顾这些愚蠢的大语言模型.......
Damn,Claude这条广告,给所有AI创业者浇了一盆冷水🤯 这个帖子表面在夸客户 ,但Genspark 的 CTO 说的这句话有点扎心,我反复看了几遍, Genspark 的 CTO Kay Zhu 说:“With every other model, we had to predefine every step. Anthropic’s model changed everything about how we build.” 意思是别的模型让他们把每一步都写死,Claude 改变了他们构建产品的思维方式。 再看视频镜头 ,全在拍人,拍团队讨论,拍办公室,不是代码,不是产品截图。 叙事重心从模型多强偷偷换成了谁在用。 我感觉Anthropic 在干一件很聪明的事, 不再卖模型了,它开始卖伙伴关系。 “能让顶级团队走得更远”这个定位,比“最强模型”稀缺一百倍。 也就是说,以前卷参数,现在卷执行层。 现在模型商品化已经是行业共识,但真正看懂的人都在悄悄做一件事 ,把护城河从“我们有更强的模型”转到“我们有能把模型用深 10 倍的团队”。 所以这条帖子我觉得本质上不是在炫耀客户,而是在筛选生态位,Anthropic 在创始人圈层制造的不是客户名单,是稀缺感和荣誉感。 模型人人可得,但能把 Claude 用出护城河的,只有真正顶级的团队。 毕竟在这个任何人都能build的时代, 真正的差异化因素只有团队。 以前你有一个更好的模型,你就能赢, 现在模型已经变成了水电煤, 任何人花几块钱就能买到最好的, 你再也不能拿模型说事了。 以后拼的是什么, 拼的是品味, 是优先级排序,用户洞察, 和快速迭代的速度, 以及团队之间的信任。 这些东西, 没有任何API能卖给你, 没有任何大模型能帮你生成。 模型是原材料, 团队才是把原材料变成有灵魂产品的炼金师, 这才是AI创业真正的游戏规则。 而且我觉得Anthropic 现在的护城河,也根本不是模型。 #AI创业 #Claude #大模型
译Anthropic最新Claude广告巧妙转移叙事焦点,通过Genspark CTO的评价,强调AI竞争已从“模型参数比拼”转向“团队执行能力”。文章指出,在模型日益商品化的当下,真正的护城河在于能将技术深度转化为优质产品的团队,其品味、洞察与迭代速度构成核心差异化。Anthropic借此塑造开发者生态中的稀缺感与荣誉感,标志着行业游戏规则已从“拥有更强模型”变为“锻造顶尖团队”。
Today we're open-sourcing Bumblebee, a read-only scanner for macOS and Linux. It checks developer machines for risky packages, extensions, and AI tool configs. Connected to Computer, it can trigger deeper scans whenever a new supply-chain risk emerges. https://github.com/perplexityai/bumblebee
译今天我们开源了Bumblebee,一个适用于macOS和Linux的只读扫描器。 它检查开发者机器上的高风险软件包、扩展和AI工具配置。 连接到Computer后,每当出现新的供应链风险时,它可以触发更深入的扫描。 https://github.com/perplexityai/bumblebee
Agentic workloads are quietly rewriting inference economics. We pulled data from 432k real coding agent requests at SemiAnalysis and the median one isn't 32k, isn't 64k, but 96k input tokens. For context, that's more than the entire text of The Great Gatsby being shoved into the model before you've even typed your question. (1/3)🧵
译智能体工作负载正在悄然重塑推理经济学。我们从SemiAnalysis的43.2万个真实编码智能体请求中提取数据,发现中位数并非3.2万或6.4万,而是9.6万输入token。作为参考,这意味着在你输入问题之前,模型已处理了超过《了不起的盖茨比》全文长度的文本。(1/3)🧵
Demis Hassabis on the limit in today’s AI: language can describe the world, but it cannot contain it - and why "World Models" are his "longest standing passion". Language models absorbed far more structure about reality from text than many researchers expected, because human language quietly carries physics, psychology, culture, tools, plans, and cause-and-effect. But text is still a compressed residue of experience, not experience itself. A sentence can say a cup falls from a table, yet it does not fully encode weight, grip, balance, friction, timing, sound, surprise, or the tiny motor corrections a body makes before it even notices them. The world is not only made of facts that can be named; it is made of constraints that have to be lived through, touched, predicted, violated, and repaired. That is why world models matter. They aim to learn the hidden grammar of physical reality: how objects persist, how forces unfold, how space changes when an agent moves, and how action creates feedback. Language models can often reason about the world because people have written so much about it. World models try to learn what the world is like before it becomes words. The difference is exactly what matters because intelligence is not just answering well; it is knowing what would happen next if you moved, reached, pushed, smelled, slipped, or failed. A mind trained only on descriptions may become brilliant at explanation. A mind trained on experience may become better at consequence. --- Full video from "Google DeepMind" and "Hannah Fry" YT channel (link in comment)
译Demis Hassabis指出当前AI的局限在于语言能描述世界,但无法“包含”世界。尽管语言模型从文本中学到了比预期更多的现实结构,但文本终究是经验的压缩残留。真正的智能不仅在于回答问题,更在于理解行动的后果。世界模型旨在学习物理现实的隐藏语法,例如物体持续性、力的作用和空间变化。这种学习试图在信息被语言化之前捕捉世界的本质,从而让AI不仅能解释,更能预测行动带来的直接影响。
Great BoM Analysis from our friends at Morgan Stanley A couple things to point out: 1. The memory value indicated here is referring to the LPDDR5x SOCAMM and the NVMe SSD. It does not include the HBM value, which is included in the GPU item. 2. The memory value indicated here is referring to the LPDDR5x SOCAMM and the NVMe SSD. It does not include the HBM value, which is included in the GPU item.ory at. 3. PCB content increase stems from the cableless design, which drives significant PCB area increase and material upgrades 4. The total BoM price indicated here is the OEM channel price. Hyperscaler and Neoclouds will have lower BoM compared to this. Our institutional clients have had these insights since February 2026 from our VR NVL72 BoM Report https://semianalysis.com/vr-nvl72-model/. We also analyze the networking connector and backplane content along side many other contents. Also we discussed the changes in the supplier landscape from GB to VR NVL72. Contact sales@semianalysis.com if you are interested.
译摩根士丹利发布了对NVIDIA VR200的物料清单分析。报告指出,其内存成本特指LPDDR5x SOCAMM与NVMe SSD,而GPU成本中已单独包含HBM。因采用无缆设计,PCB面积与材料成本有所上升。报告列示的总成本为OEM渠道价格,大型云服务商的采购成本将更低。该机构客户自2026年2月起已获得此分析,报告同时研究了网络连接器、背板等组件的变化及供应商格局演变。
还他么嘴硬是吧,今天还评论过我这篇文章,你这人品我是见识了,大老爷们你大方承认我也不追究啥,还在这让AI背锅???
译帖主批评他人使用“创作skill”AI工具自动生成内容,导致文章素材与结构高度相似,却不愿承认问题,反而将责任推给AI工具,凸显了内容创作中工具使用与责任归属的争议。帖主认为对方应回避自身错误,而非以技术为借口。
@iBigQiang 大幅抄袭最后还嘴硬耍赖让AI背锅,我特么真是忍不了,就这人品????
译@iBigQiang 大幅抄袭最后还嘴硬耍赖让AI背锅,我特么真是忍不了,就这人品???? [引用 @AYi_AInotes]:http://x.com/i/article/2057668634579714048
Kay Zhu is the co-founder and CTO of @genspark_ai, the all-in-one AI workspace built on Claude. In a market moving this fast, where anyone can build, he thinks the team is what makes the difference:
译Kay Zhu是@genspark_ai的联合创始人兼首席技术官,这是一个基于Claude构建的一体化AI工作空间。 他认为,在一个发展如此迅速、任何人都能参与构建的市场中,团队才是决定成败的关键。
I can only reiterate what I said yesterday: as long as there is no uniform definition of AGI, it's pointless to talk about when AGI is achieved. Especially when everyone has their own definition.
译我只能重申昨天说过的话:只要对AGI没有统一定义,讨论AGI何时实现就毫无意义。尤其是当每个人都有自己的定义时。
在AJ安利下,歸藏买了安克 AI 录音豆。 在歸藏安利下,我也买了。 初步体验,这是目前个人最喜欢、最实用的 AI 硬件产品。 就是绳子带着不舒服,打算淘宝换个。
译在AJ安利下,歸藏买了安克 AI 录音豆。 在歸藏安利下,我也买了。 初步体验,这是目前个人最喜欢、最实用的 AI 硬件产品。 就是绳子带着不舒服,打算淘宝换个。
From storyboard to cinematic short: A Corgi’s day alone brought to life with Pixverse using GPT Image 2 × Seedance 2.0 RT + Follow + Reply = Workflow
译从分镜到电影感短片: 一只柯基独处的一天,由Pixverse使用GPT Image 2 × Seedance 2.0实现 转发 + 关注 + 回复 = 工作流
8 套压箱底神级提示词之纳瓦尔分身 Prompt 读懂纳瓦尔需要十年, 我用 1 条提示词把它封装成了财富与清醒操作系统, 提示词见下方文章, 结尾还有个宝藏彩蛋!
译该推文介绍一条精心设计的AI提示词,将纳瓦尔关于财富与智慧的思想封装成一个易用的“操作系统”。通过此提示词,用户可快速与AI交互,获得类似与纳瓦尔对话的见解和决策框架,直接应用于实践。文末设有“宝藏彩蛋”作为吸引点。
The title of "open-source champion" for any country is earned by working with the community rather than mandated by raising money
译任何国家的“开源冠军”头衔,都是通过与社区合作赢得的,而非靠融资强加。
最近针对 Codex 优化了一下 发送 X 文章的 Skill,如果安装了Codex 的 Chrome 插件,可以用 @chrome 使用 Chrome 发 X 文章,体验不错
译通过针对Codex优化发推技能并结合Chrome插件,用户现在可以在浏览器内更顺畅地完成X文章的发布。这一改进解决了此前手动处理文本与图片时遇到的Markdown兼容性等问题,显著提升了内容发布的效率与体验。
今天下午体验了一把 AI vs 传统专业工具的真实对比! 今天下午帮一位做打印设备的朋友调输入图像参数,他在做美甲甲片打印,我跟两位专业设计师配合工作,做效果展示。 我们从那种美甲成品批量展示的图里,找到我们要的图案,做图像超分、增强/饱和度等、甲片蒙层,再做打印。 两位专业设计师用的专业工具是 PhotoShop,他们非常熟练各种快捷键操作,处理一张图片大概 1-2 分钟。 我开着 ChatGPT,用 ChatGPT Image 2,一次性把超分分辨率、增强和饱和度的要求等、不同手指的甲片图片输入,让 ChatGPT 在后续操作中按照执行要求,和它对图片的理解来输出图像,处理一张图片大概 5-8 秒。 最终我们输出的效果是很接近的,本来拉开差距的地方在饱和度和对比度等设置这一步,不过专业设计师根据专业判断反复调整后,发现跟 ChatGPT 自己判断的结果很接近。
译在为美甲甲片打印处理图像时,作者对比了AI工具ChatGPT的Image 2与传统专业工具PhotoShop的性能。专业设计师使用PhotoShop处理单张图像需1-2分钟,而ChatGPT Image 2仅用5-8秒即可完成超分、增强等操作,速度优势显著。最终输出效果接近,尤其在饱和度和对比度等关键参数上,AI的自主判断与专业设计师反复调整的结果高度一致,凸显了AI在图像处理中的高效与潜力。
Dario Amodei on people falling in relationship with AI. It's already happening and that AI can be an “angel on the shoulder,” but it can also be dangerous.
译Dario Amodei谈人们与AI建立情感关系。 这已成现实,AI可以成为“肩上的天使”,但也可能带来危险。
不会写提示词?懒得打太多字? 写了个Chrome插件,把我和姚老师 @yaojingang 过去一年多写的提示词都放进去了。 你只需要一键复制粘贴,或简写自动补全就能在任意网站和AI平台用。 你也能添加日常快捷语,支持导出JSON备份、共享。 另外收录苍何(canghe)整理的几百套 GPT-Image-2 提示词,自带效果预览。 最后,整理收录了全网500套常用提示词,从开发、设计、营销,全都有,随时搜索复制使用。 Chrome插件下载: https://chromewebstore.google.com/detail/%E4%B9%94%E6%9C%A8%E5%BF%AB%E6%8D%B7%E6%8F%90%E7%A4%BA%E8%AF%8D/ndfmbdiaclladmoeifbhlkacllmfhjej
译该插件整合了作者与姚老师长期积累的提示词库,支持一键复制或简写自动补全,可在任意网站与AI平台快速调用。同时收录了苍何整理的数百套GPT-Image-2提示词(含效果预览),并汇集全网500套覆盖开发、设计、营销等场景的常用提示词,提供搜索、导出JSON备份及共享功能。
今天孩子语文老师布置了一份特别的作业: 要求跟 AI 提问,写一篇作文。 我觉得很有创意,可以锻炼提问能力、AI辅助创作能力。 准备了 Claude Sonnet 4.6、ChatGPT 5.5、Gemini 3.5 Flash,到时候看孩子喜欢哪个。
译一位家长分享,孩子的语文老师布置了一项创新作业:要求学生通过向AI提问来完成作文。家长认为,这种形式能有效锻炼学生的提问技巧与AI辅助创作能力。为此,他提前准备了Claude Sonnet 4.6、ChatGPT 5.5、Gemini 3.5 Flash等主流AI模型,供孩子届时根据喜好选择使用。
June will be huge. -Gemini 3.5 pro (confirmed) -GPT-5.6 (rumored but pretty confident for a release) Still waiting for annoucements Claude Sonnet 4.8 (Claude-Code-/Source-Map-Leak)
译六月将是巨大的一个月。 - Gemini 3.5 pro(已确认) - GPT-5.6(传闻中,但发布可能性很高) 仍在等待官方公告 Claude Sonnet 4.8(Claude-Code-/Source-Map-Leak)
Damn,这个必须卧槽一下了,Karpathy 的 CLAUDE.md 只有 65 行, 居然能把 AI 编程准确率从 65% 拉到 94%, 以22 万星标登顶 GitHub 趋势榜,而且绝大多数开发者还没读过, 里面没有一行奇技淫巧,4 条规则全是同一个方向: → 先想清楚再写代码 陈述假设,不确定就问,杜绝猜测 → 从最简方案入手 只写能解决问题的最少代码,不加任何多余抽象 → 像手术一样精准修改 不碰与需求无关的代码,每行改动都对应明确要求 → 以目标驱动执行 写第一行代码前,把模糊指令转化为可验证的成功标准 65 行,4 条规则,每一条都在对抗开发者“先写再说”的本能, 本质上是把慢下来这件事变成硬规则, 趁别人还没保存,赶紧先存好 👇
译Karpathy发布的CLAUDE.md文件以其简洁高效的AI编程指导原则引爆GitHub,获得超22万星标并登顶趋势榜。该文件仅含65行、4条核心规则,却能将AI编程的准确率从65%显著提升至94%。其核心在于强制开发者“慢下来”,将深度思考、追求简洁、精准修改和目标驱动等原则变为硬性编码准则,旨在对抗开发者习惯性“先写再说”的本能。目前大多数开发者尚未深入研读这一备受关注的效率指南。
Marc Andreessen describing AI. "We've turned sand into thought. And it's possibly the most revolutionary technology in the history of the species" Sand → silicon → chip → data center → power → AI → thought
译Marc Andreessen 描述 AI:“我们已将沙子转化为思想。这可能是人类历史上最具革命性的技术。” 沙子 → 硅 → 芯片 → 数据中心 → 电力 → AI → 思想
http://x.com/i/article/2057775296712196096 # 开源一个 Skill,让 AI 接管你屏幕边那张便签纸 上个月我做了 M5 Paper Buddy,把一块墨水屏接到 Claude Code 上,监控 AI 在干什么、需要审批什么。 当时挺兴奋的,物理按键审批操作那个仪式感很好。 但用了几周之后我发现,它放在桌上的时间,远比我看它的时间长。 AI 跑得稳的时候根本不需要监控,需要审批的时候我大概率人就在电脑前。它解决的是一个边缘问题。 ## 真正的场景藏在屏幕边框上 后来我注意到一个很普遍的现象:很多人会在屏幕边框上贴便签纸,甚至有很多这种便签纸在卖。 写着今天要做什么、几点开会、某个项目的下一步动作。 便签纸的存在不是因为它好用,而是因为人需要"抬头就能看见"的提醒,不想为了看一眼日历切窗口、解锁手机。 但便签能记的东西非常有限,写完就静止了。 日程变了,便签不会变。任务做完,便签还在那。它是一个被时间冻住的物件。 而现在,我们手边有了 AI。它有 Memory,有 Agent,能读我的日历、看我的 GitHub、跟我对话。 如果让 AI 来决定屏幕边框上应该贴什么、什么时候撕掉、什么时候换新的,那就是另一个东西了。 这就是 AI Desk Card Skill 想做的事。 形态上是一块 4.7 寸的墨水屏,带磁吸(类似 MagSafe),可以直接贴在显示器旁边。 背后是一个 Skill —— 装到 Claude Code 或者 Codex 这类 AI Agent 里,AI 接管所有事: 决定推什么、什么时候推、息屏时显示什么。 Github:https://github.com/op7418/ai-desk-card 下面我把它实际怎么用、能解决什么问题讲清楚。 ## 案例一:日程和待办自己会更新 我把 top-left 槽位设成日历,middle 槽位设成 todo。 早上坐到电脑前,屏上已经是当天的完整安排:上午的会、下午健身、晚上要交的稿子。 这些数据来自飞书日历,AI Agent 通过飞书 CLI 直接读取。 下午跟一个朋友约了周四的咖啡。 我跟 AI 说"周四下午加一个咖啡,3 点",AI 一边把日程写进飞书日历,一边把屏上的卡片刷新了一下。 新的日程出现在 todo 槽位里。 更舒服的是反向同步。我做完 AIGC Weekly 的初稿,跟 AI 说"周刊写完了",屏上对应的那一行就被划掉了。 便签纸做不到这件事。便签纸只能记录某个瞬间的快照,而日程的本质是一个不断变化的状态流。 当显示设备和你的 Memory 联通之后他会直接展示你和你的上下文当下的状态。 ## 案例二:息屏的时候,它是你的名片 这是我做完之后最喜欢的一个功能。 墨水屏有个物理特性:断电之后画面会保留。 我专门为这个特性加了一个 Quiet Hours 模式 —— 到了晚上 11 点,或者你长按"睡眠"按钮,屏幕会自动切换到一张电子名片,然后进入深度休眠。 名片上是你的头像、介绍、二维码。整张屏黑白分明,墨水屏特有的纸质感。 这块屏从那一刻起就完全不耗电了,但画面一直在。 它带磁吸,从显示器边上摘下来揣进包里,重量很轻。 下次跟新朋友吃饭,从包里掏出来递过去:黑白名片 + 二维码,加完好友放回口袋。 整个过程没有插电、没有开机、没有打开 App 翻二维码的尴尬。 而早上你坐到桌前,它又会被 AI 唤醒,自动切回工作模式 —— 日程、todo、PR 队列回来了。 墨水屏的限制(不发光、刷新慢、断电保留)在大多数场景下都是缺点,但当你不去硬刚这些限制,反而顺着它去设计场景,会发现它有些屏幕做不到的事。 ## 案例三:GitHub 的动态我不再错过了 我维护 CodePilot 这种开源项目,最大的负担是看不见 — 不打开 GitHub 就不知道有没有新 PR、新 Issue。 但每隔十分钟打开一次 GitHub 是非常糟糕的工作节奏,注意力会被切碎。 现在 AI Desk Card 的 bottom 槽位常驻一个 pr-queue widget。 CodePilot 仓库有新 PR、有人在 Issue 里 at 我、CI 挂了,AI 都会把它推上去。 数字小不打扰,但抬头扫一眼就知道有没有要处理的事。等我手头这段写完,再统一去看。 更进一步的玩法是,AI 知道我在做什么。 我现在专注写 AIGC Weekly 的时候,它会自动把 PR 队列降级,只在出现 critical 标签的 Issue 时才推上来。 等我切到 CodePilot 的开发,PR 队列又会回到主位。 屏幕上显示什么,本质上是一个调度问题,不是一个配置问题。 传统 dashboard 让你配 widget,配完一周内还行,之后就变成一面没人看的墙。 AI 主动决策是因为它知道你正在做什么、它能换。 ## 案例四:天气、休息、所有那些"该有但你想不起来配"的东西 最让我自己意外的一类 widget 是 break-reminder。 我经常一坐就是三四个小时不动。 这个 widget 会在一段时间没有按键活动之后,在某个槽位上轻轻推一句"该起来走走了"。 墨水屏不发光,不会弹窗、不会响、不会震动,但你抬头看到一行字,自然会停一下。 它和番茄钟最大的区别是:没有强制性。它只是存在,不打扰你。 如果你正在跑代码、写文章的状态里,那一行字会被你忽略; 如果你已经累了、状态浮的时候,看到那行字会真的去倒杯水。 天气也是一样。 我不会专门去查今天会不会下雨,但顶部 widget 静静显示"下午有雨"几个字之后,下楼前我会把雨伞拿上。 这种"低优先级但有用"的信息,过去只能靠你自己记得去查,现在它们待在视野边缘,需要的时候被你扫到。 ## 它是怎么装上的:AI 全程引导 整个安装流程没有 App,没有蓝牙配对页面,没有手机扫码。你跟 AI 说: > "帮我把 ai-desk-card 装上:https://github.com/op7418/ai-desk-card" 接下来发生的事: 1. AI 检测你电脑上有没有 PlatformIO,没装就自动装 1. 检测你有没有插 USB,没插就提示你插 1. 自动编译固件、烧录到 M5Paper,1 分钟左右 1. 问你 Wi-Fi 密码,写进设备 1. 问你"想看哪些卡片、多久刷一次" 1. 推第一个 widget 上去 整个过程你只回答 Wi-Fi 密码和"想看什么"两个问题。 之后设置定时任务也是一句话:"让卡片每 30 分钟刷新天气和未读邮件,工作日 8 点到 22 点。" AI 自己去写 cron、自己去注册 loop、自己去调度。 定时任务跑的时候,AI 会读取你的 Memory 来决定推什么内容。 比如我让它每天早上 9 点更新一次,它会去看我 Memory 里最近活跃的项目(CodePilot、AIGC Weekly等),按重要度安排槽位。 这里没有"App 工程师做的设置页面",因为 AI 就是设置页面。 你过去要点十下才能调好的设置,现在一句话就行。 ## 一个跟传统硬件相反的设计:组件预置,AI 只填数据 讲到这里需要单独说一下实现思路,这是 AI Desk Card 跟传统 IoT 设备最大的不同。 通常做一个智能硬件,组件是写死在固件里的: 时钟样式、天气图标、字体大小,都是固件工程师在出厂前定好的。要加新功能,要发新固件 / OTA / 重新认证一遍。这是为什么 99% 的智能硬件买回来三个月就跟刚拆封时长得一样。 AI Desk Card 走的是反方向:16 种 widget 模板预置在服务端,AI Agent 只负责往里面塞 JSON 数据。 举个例子,pr-queue 这个 widget 的视觉布局(一个标题区、4 行 PR 信息、每行带状态图标)是渲染端写好的。 AI 不需要画图、不需要排版、不需要选字号。它只要往 daemon 发一个这样的请求: 服务端用 Python + Pillow 把这个 JSON 渲染成一张 540×280 的像素图,推到墨水屏上。 这个思路其实来自我们在 CodePilot 桌面端做的生成式 UI。 那边走的是相反的极端:模型实时生成 HTML/SVG,渲染成可交互的 widget。 两个方向看起来截然相反,但精神是一致的 —— UI 由 AI 决策,不由用户配置。 为什么墨水屏要反着来?因为约束不一样。 浏览器能跑任意代码、有强大的字体引擎、可以加载 CDN,所以让 AI 生成 UI 本身没问题。 墨水屏渲染受限,全屏 GC16 刷新要 2 秒、中文字体一套就要几兆、像素精度不能算错,AI 直接生成 UI 太重了。 所以反过来:UI 提前准备好,AI 只决定填什么、放哪个槽位、什么时候换。 这个组件库还在不断扩。硬件本身基本不变,能力却在持续生长。 ## 写在最后:AI Agent 把硬件从内置功能里解放了出来 聊点更大的事。 传统硬件公司的护城河是 "我设备里能做什么"。 CPU、传感器、操作系统、内置 App,决定了它的能力上限。一旦造好出厂,能力就基本封顶。 AI Desk Card 这种思路下,硬件的能力来源被换掉了。 它本身只是一块墨水屏 + ESP32,能做什么取决于 AI Agent 能拿到什么信息。 日历来自飞书 CLI、PR 来自 GitHub CLI、天气来自任意 API、Memory 来自你的 Obsidian 仓库 —— 这些信息源全都在 Agent 那边,不在硬件里。 当 AI Agent 成为信息中枢之后,硬件可以做得很薄、很专用。 它不需要内置一百个功能,只需要做好一件事 —— 在 AI 决定推送的时候,把内容显示出来。 这件事的成本也降到了很低的水平。M5Paper V1.1 大概 600 块,未来类似的开源开发板会更便宜,三四百块就能买到。墨水屏、彩色墨水屏、TFT 小屏、甚至 Kindle、墨水屏阅读器,理论上都可以适配同一套 Skill。 后面我还想做几件事: - 适配 M5Paper S3 和 Inkplate / Waveshare 等其他墨水屏开发板 - 尝试给老 Kindle 写一个适配层,把闲置的阅读器变成桌面副屏 - 跟 Home Assistant 联动,把智能家居状态推到桌面卡上 —— 客厅温度、门锁状态、扫地机器人位置 - 探索彩色墨水屏的可能性,开放更多 widget 类型 每多支持一种硬件,就多一种 AI 触达物理世界的方式。这些设备不需要变聪明,它们只是 AI Agent 的物理出口。 真正在变聪明的是你桌上那个 AI,而它聪明的速度,比硬件迭代快得多。 GitHub:https://github.com/op7418/ai-desk-card 如果你觉得这次的内容对你有帮助,可以帮我点个赞或者转发给需要的朋友。
译AI Desk Card 是一款 4.7 寸磁吸墨水屏,结合 AI Agent(如 Claude Code),通过预置模板与数据填充,动态显示日历、待办、GitHub PR 队列、天气等内容。它解决了传统便签纸的静态限制,实现内容自适应和场景切换(如夜间变为电子名片)。核心理念是将硬件从固定功能中解放,使显示能力由 AI 可获取的信息动态定义,从而提升效率并减少手动配置。
哈哈,太好玩了!藏师傅做了个 AI 屏幕便签纸 Skill。 让 AI 根据你当前的状态和记忆,在墨水屏上显示内容,支持十几种常见组件。 之后你不再切 calendar、不再翻 GitHub tab——AI 主动把它觉得你该看的事推到墨水屏上。 16 种 widget 自由组合,2-1-1 布局拆 4 个槽位。瞥一眼就够。
译藏师傅开发了一款AI屏幕便签纸Skill,该工具能基于用户当前状态与记忆,主动在墨水屏上推送重要信息。它支持十余种常见组件进行自由组合与布局,旨在替代频繁切换日历、GitHub等多标签页的操作,让用户只需瞥一眼就能获取AI认为当下最相关的内容。
哈哈,新设备来了,这玩意有麦克风和扬声器,那可玩性可就强多了! 最近疯狂在 M5 Stack 家消费,他家出个新的就断货
译一款集成麦克风与扬声器的新设备发布,大幅提升了可玩性与应用潜力。作者近期持续购入M5 Stack产品,但该公司新品常迅速售罄。结合引用信息,该设备可能支持语音交互、音频处理等功能,为开发者提供了更丰富的创作空间。
Google was not far from launching its own ChatGPT-like product back in 2022. Sundar Pichai talks about how Google had already built a almost equvalent product around LaMDA, but its raw behavior was too toxic for Google standards, and unreliable to ship broadly. Pichai: "I think as a company, you had this search quality bias, and so, you know, we had a higher bar, for what we thought was an acceptable product quality to go out." The LaMDA model of Google was not simply a case of brilliant research sitting on a shelf, because Google had already started turning the model into a product and even exposed a constrained version through AI Test Kitchen. Pichai is also saying hindsight makes the miss look cleaner than it felt at the time, because even OpenAI’s move was not instantly obvious as the winning form factor. --- From @collision podast with @sundarpichai (full video link in comment)
译谷歌CEO桑达尔·皮查伊透露,公司在2022年已基于LaMDA模型开发出接近ChatGPT的产品,但因输出内容存在毒性且不符合内部质量标准而未能广泛发布。皮查伊指出,公司存在“搜索质量偏见”,对产品的可靠性和安全性设有更高门槛。LaMDA模型并非仅停留在研究阶段,谷歌曾通过AI Test Kitchen进行有限测试。他补充道,从后视镜看,OpenAI的成功在当时并非显而易见,这使得谷歌的决策过程更为复杂。
基准测试显示,Cursor Composer 2.5在编程任务中展现出卓越的成本与效率优势。其单任务成本仅为Claude Opus 4.7的1/3至1/18,更是GPT-5.5的1/5至1/32。这一低成本源于其极高的token使用效率:完成全部测试仅消耗1.6M token,远低于同类模型的5.7M。效率方面,其平均任务完成时间约9分钟,比行业平均水平快约1.3倍,其快速版本更可将时间缩短至约7分钟。
Sometimes people outside the field say things like "The AI situation can't be that bad, there must be experts who are on...
其实远程服务器上并不需要安装一个完整版的 Codex app,只需要安装 CLI 版的 Codex,并运行: codex remote-control 这样手机上 ChatGPT 应用里的 Codex 就会显示出一个有「终端」图标的服务器名...
humans don't actually think, they just imitate others humans don't actually think, they're just math humans don't actual...
DeepSeek将其高性能模型V4-Pro的限时75%折扣宣布为永久性调整,输出价格降至0.87美元/百万tokens,远低于行业主流定价区间。此举不仅是促销,更被视为争夺定价权的战略行动,标志着AI模型的商业模式正从服务转向类似水电煤的基础设施逻辑。DeepSeek通过“永久”降价,意图以低单价换取海量使用数据、开发者生态及行业定价话语权,追求规模优先的路径。
We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀
Cartesia公司最新发布的语音合成模型Sonic-3.5在Artificial Analysis Speech Arena排行榜上位居第一,超越了Inworld Realtime TTS 1.5 Max和Google Gemini 3.1 Flash TTS等竞品。该模型支持42种语言(包括9种印度语言),提供超过500种声音选择。评测数据显示,Sonic-3.5以1,218的Elo分数领先,表现出自然的语音效果和准确的文本跟随能力。其定价为每百万字符39美元,高于竞品;生成速度为每秒105.5字符,介于其他两者之间。
本文解读了摩根士丹利关于英伟达VR200服务器物料清单的分析。报告特别指出,所列“记忆”成本仅指LPDDR5x SOCAMM与NVMe SSD,不含包含在GPU内的HBM成本;该成本也非存储厂商的最终收入,因英伟达加收了利润。BoM成本上升主要源于无缆设计导致PCB面积与材料升级。需注意此价格为OEM渠道价,超大规模用户成本更低。SemiAnalysis称其机构客户自2026年2月起已通过报告获此洞察,并涵盖更多组件与供应商分析。
Sheesh. $NVDA VR200 Bom Analysis from MS.
Nvidia CEO Jensen Huang: "There's a belief that the world's GDP is limited at $100 tn. What's likely to happen is AI is ...
Kakuna是一款AI代理工具,旨在将早期快速原型自动转化为可维护的生产级代码库。它通过内置的检查清单和“计划-目标”工作流,模拟人类开发与运维流程,在保持功能不变的前提下,自动执行代码审查、测试补充、重构等“无聊”工作,并强调子代理并行以提升效率。该工具是为“人类与代理协作”而设计的范例,其核心是“反熵增”与“反代码腐化”。例如,一次约16小时的运行能生成上百次提交,将一个脆弱的MVP转变为一个结构清晰、可长期构建的稳定项目。
working on a "take this vibecoded slop app and make it a production-ready, e2e tested, maintainable, parallelizable agen...
I built "zero2claude", a free course that takes people from zero terminal experience to shipping with Claude Code. The c...
We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀
Anthropic最新Claude广告巧妙转移叙事焦点,通过Genspark CTO的评价,强调AI竞争已从“模型参数比拼”转向“团队执行能力”。文章指出,在模型日益商品化的当下,真正的护城河在于能将技术深度转化为优质产品的团队,其品味、洞察与迭代速度构成核心差异化。Anthropic借此塑造开发者生态中的稀缺感与荣誉感,标志着行业游戏规则已从“拥有更强模型”变为“锻造顶尖团队”。
Kay Zhu is the co-founder and CTO of @genspark_ai, the all-in-one AI workspace built on Claude. In a market moving this ...
Demis Hassabis指出当前AI的局限在于语言能描述世界,但无法“包含”世界。尽管语言模型从文本中学到了比预期更多的现实结构,但文本终究是经验的压缩残留。真正的智能不仅在于回答问题,更在于理解行动的后果。世界模型旨在学习物理现实的隐藏语法,例如物体持续性、力的作用和空间变化。这种学习试图在信息被语言化之前捕捉世界的本质,从而让AI不仅能解释,更能预测行动带来的直接影响。
摩根士丹利发布了对NVIDIA VR200的物料清单分析。报告指出,其内存成本特指LPDDR5x SOCAMM与NVMe SSD,而GPU成本中已单独包含HBM。因采用无缆设计,PCB面积与材料成本有所上升。报告列示的总成本为OEM渠道价格,大型云服务商的采购成本将更低。该机构客户自2026年2月起已获得此分析,报告同时研究了网络连接器、背板等组件的变化及供应商格局演变。
Sheesh. $NVDA VR200 Bom Analysis from MS.
@AYi_AInotes ayi大哥好,我可以说这个是创作skill的锅吗😂它自动去搜罗的素材和创作,还真没看到你发过同类文章,下次一定注意
http://x.com/i/article/2057668634579714048
NEW: Marc Andreessen declares AGI was achieved three months ago.
http://x.com/i/article/2057300084354670592
为了发X的文章,我经历很痛苦的一段时间~ 之前:手动编写,粘贴,图一张张传,且经常遇到markdown不支持的问题~ 现在:用宝玉老师 @dotey 的baoyu-skill 的baoyu-post-to-x一键发布,目前已经省事多了 小小...
在为美甲甲片打印处理图像时,作者对比了AI工具ChatGPT的Image 2与传统专业工具PhotoShop的性能。专业设计师使用PhotoShop处理单张图像需1-2分钟,而ChatGPT Image 2仅用5-8秒即可完成超分、增强等操作,速度优势显著。最终输出效果接近,尤其在饱和度和对比度等关键参数上,AI的自主判断与专业设计师反复调整的结果高度一致,凸显了AI在图像处理中的高效与潜力。
该插件整合了作者与姚老师长期积累的提示词库,支持一键复制或简写自动补全,可在任意网站与AI平台快速调用。同时收录了苍何整理的数百套GPT-Image-2提示词(含效果预览),并汇集全网500套覆盖开发、设计、营销等场景的常用提示词,提供搜索、导出JSON备份及共享功能。
一位家长分享,孩子的语文老师布置了一项创新作业:要求学生通过向AI提问来完成作文。家长认为,这种形式能有效锻炼学生的提问技巧与AI辅助创作能力。为此,他提前准备了Claude Sonnet 4.6、ChatGPT 5.5、Gemini 3.5 Flash等主流AI模型,供孩子届时根据喜好选择使用。
Karpathy发布的CLAUDE.md文件以其简洁高效的AI编程指导原则引爆GitHub,获得超22万星标并登顶趋势榜。该文件仅含65行、4条核心规则,却能将AI编程的准确率从65%显著提升至94%。其核心在于强制开发者“慢下来”,将深度思考、追求简洁、精准修改和目标驱动等原则变为硬性编码准则,旨在对抗开发者习惯性“先写再说”的本能。目前大多数开发者尚未深入研读这一备受关注的效率指南。
karpathy's CLAUDE.md hit #1 on github trending. 220,000 stars. most devs still haven't read it. it's 65 lines. it took A...
AI Desk Card 是一款 4.7 寸磁吸墨水屏,结合 AI Agent(如 Claude Code),通过预置模板与数据填充,动态显示日历、待办、GitHub PR 队列、天气等内容。它解决了传统便签纸的静态限制,实现内容自适应和场景切换(如夜间变为电子名片)。核心理念是将硬件从固定功能中解放,使显示能力由 AI 可获取的信息动态定义,从而提升效率并减少手动配置。
藏师傅开发了一款AI屏幕便签纸Skill,该工具能基于用户当前状态与记忆,主动在墨水屏上推送重要信息。它支持十余种常见组件进行自由组合与布局,旨在替代频繁切换日历、GitHub等多标签页的操作,让用户只需瞥一眼就能获取AI认为当下最相关的内容。
http://x.com/i/article/2057775296712196096
http://x.com/i/article/2057775296712196096
谷歌CEO桑达尔·皮查伊透露,公司在2022年已基于LaMDA模型开发出接近ChatGPT的产品,但因输出内容存在毒性且不符合内部质量标准而未能广泛发布。皮查伊指出,公司存在“搜索质量偏见”,对产品的可靠性和安全性设有更高门槛。LaMDA模型并非仅停留在研究阶段,谷歌曾通过AI Test Kitchen进行有限测试。他补充道,从后视镜看,OpenAI的成功在当时并非显而易见,这使得谷歌的决策过程更为复杂。