AI行业关注焦点从token最大化与快速迭代转向成本管控。业内普遍呼吁建立护栏机制,以应对推理和生成过程中不断飙升的token费用。这一趋势正在推动模型部署策略、API定价体系以及企业级AI应用的经济性评估发生根本性转变。
AI行业关注焦点从token最大化与快速迭代转向成本管控。业内普遍呼吁建立护栏机制,以应对推理和生成过程中不断飙升的token费用。这一趋势正在推动模型部署策略、API定价体系以及企业级AI应用的经济性评估发生根本性转变。
这是一则AI提示词,让AI扮演极度严格的老师,通过逐阶段教学、持续维护MD检查清单来确保用户真正理解。AI先让用户复述当前理解,再填补漏洞,并用开放式或选择题(随机选项顺序,提交前不公布答案)测试。教学必须覆盖问题本身、解决方案、宏观背景三个层面,并不断深挖“为什么”。仅当用户通过清单上所有项目的验证,会话才算结束。提示词强调对理解程度的主动验证,而非一次性灌输。
Hudson River Trading 的 AI 负责人 Iain Dunning 在 Odd Lots 播客中,与主持人 Joe Weisenthal 和 Tracy Alloway 讨论了该公司如何部署 AI,以及员工实际在模型 token 上的花费情况。
AI 初创公司 Quilty 宣称其工具仅通过阅读剧本就能准确预测电影的市场表现。然而,实际测试结果引发质疑:在拥有全球数据的情况下,Quilty 预测后来票房惨败的《Christy》会优于最终成为奥斯卡获奖大片的《Sinners》。Quilty 创始人认为这类工具能“民主化”电影行业,为新兴创作者提供辅助,但权威性有待验证。
BlackRock全球固定收益首席投资官Rick Rieder就5月美国就业报告发表评论,称报告在多个方面“令人瞩目”。他指出,AI基础设施相关的非住宅建设项目拉动了建筑业强劲增长,对整体就业数据贡献显著。
美国将AI视为维持全球主导地位的战略技术,不会同意暂停开发。中国开源模型据估计仅落后4-6个月,暂停将给中国赶超机会,因此暂停呼吁更多是公关姿态。关于RSI(递归自我改进),OpenAI和Anthropic都在讨论,且均计划2026年IPO。Mythos模型与RSI文章出现时机看似可疑,但Anthropic提供的数据支持其论点,且Dario Amodei早在2024年就开始讨论RSI,早于IPO计划,因此RSI并非空谈。
I've read the comment several times now that this is IPO talk. And it's a fair comment. Yes, both OpenAI and Anthropic a...
fofrAI 使用 Gemini 3.5 Flash 和 Antigravity CLI 实验 AI 智能体的自主性和速度。结果:20 分钟内在 Linux CPU 上安装并运行原版 Stable Diffusion 1.5,完成推理生成图像;基于 Lora 和 SD 论文,用 10 张图片从零实现 Lora 微调器(约 1 小时 30 分,主要为 CPU 训练);通过 modal 约 20 分钟找到 GPU、获取 Ideogram v4 权重并运行推理。该推文展示了当前长周期智能体任务的基线案例。
Where's the baseline for impressive long horizon agent tasks today? What are you seeing this week that makes you go "woa...
Greg Eisenberg 通过六轮 Prompt,用 Codex Sites 做出自动更新的创业想法看板。关键步骤:1)调用 sites 插件,指令“save for review, do not deploy”阻止自动部署;2)选 Cloudflare D1 实现持久化;3)设安全动作,限定 Agent 只能通过预设路径改数据;4)编写 Startup Ideas Admin 技能,使操作手册化;5)存档为 V1 并验证版本回滚;6)新对话加载技能,跨线程写入并成功上线,证明跨会话可重复运营。
http://x.com/i/article/2062661069458620416
通过微调,让大型语言模型(LLM)生成具有1995年风格的文档。项目来自 passo.uno,于 2026 年 6 月 5 日在 Hacker News 上获得 103 点热度。
本周BestBlogs梳理20篇内容,聚焦Agent时代的三层爆发:模型层OpenAI升级ChatGPT“梦境”记忆架构、MiniMax M3开源(1M上下文+稀疏注意力)、Gemma 4 12B端侧Agent工作流;产品层Kimi Work Beta面向知识工作者、微软开源SkillOpt(3300 star,含文本学习率与拒绝编辑缓冲区)、扣子3.0升级为AI团队;工程层Anthropic发布Claude Code动态工作流(子代理编排)及其内部AI原生工程实践。
OpenSquilla通过Meta Skill将多个Skill按YAML定义步骤、顺序和依赖,在Runtime层预先校验,防止无效调用。在PinchBench 1.2.1上,三模型混用的OpenSquilla与Claude Opus 4.7版OpenClaw得分几乎相同,但Token少一半,成本不到1/9。将Superpowers下14个Skill组合为Meta Skill后,输入Token压缩至67%。支持多模型,用本地小模型分类任务,模型切换仅在新Session生效;子Agent压缩上下文,400K窗口内可保持记忆。同一会话执行8个框架调研报告,仅花费7美分,Token和成本精确到小数点后四位。
Kim回应外界对Anthropic与OpenAI近期RSI言论仅为2026年IPO炒作的质疑。引用Anthropic数据:即使模型能力冻结,智能体扩散也将使100人公司完成1000人工作;实际发展已超过内部指数假设。模型自主任务时长加速翻倍——2024年3月Claude Opus 3完成4分钟任务,一年后Sonnet 3.7达1.5小时,再一年后Opus 4.6达12小时,翻倍周期从7个月缩短至4个月。若趋势持续,今年内可处理数天级任务。OpenAI同样认可该方向。
I believe the majority still doesn't understand the momentous threshold humanity is facing. Anthropic itself states quit...
Ladybird 浏览器项目宣布不再接受公开 pull request。维护者 Andreas Kling 指出,过去提交大量补丁意味着付出实质性努力,可作为善意的合理代理,但这一假设已不再成立。代码是手工输入还是由 AI 生成已无关紧要,关键是谁对进入浏览器的代码负责。Ladybird 正成为面向真实用户的浏览器,引入变更的人必须是决定该变更属于项目并承担后果的人。
投资者意识到人工智能热潮终将结束,问题在于何时。彭博MLIV最新伦敦活动上,Skylar Montgomery Koning分享了关键观点。
Meta 高管 Wang 表示,AI 智能体将重新定义人与技术的关系,行业需要建立信任,才能让人们充分利用 AI。
Vibe Coding将自然语言转化为可运行的软件。文章对比了2026年15款Vibe Coding工具的价格、功能与适用场景,帮助开发者选择最适合的应用构建方式。
一篇实践指南,介绍如何在 Google Colab 中运行 Microsoft Fara,使用模拟的 OpenAI 兼容端点测试浏览器智能体循环。
博主@AYi_AInotes研究X平台算法后,称已掌握底层收益算法逻辑,正计划构建X创作者收益预测平台。为打磨预测模型,博主公开征集用户近两周的创作数据,承诺完成后将开源该平台,供创作者分析自身收益数据。
http://x.com/i/article/2060717603987791878
@MatthewBerman @saranormous @NoPriorsPod @latentspacepod @satyanadella @Microsoft here! https://www.latent.space/p/satya...
Meta 首席 AI 官 Alexandr Wang 在 2026 年旧金山举行的 Bloomberg Tech 大会上,与 Bloomberg 的 Kurt Wagner 展开对话,围绕模型开发、基础设施投资和 AI 竞争态势进行了讨论。
Broadcom 总裁兼 CEO Hock Tan 在旧金山举行的 Bloomberg Tech 2026 会议上,与 Bloomberg 的 Tom Giles 讨论了半导体需求、AI 扩展以及收入展望。
加州参议员 Scott Wiener 在旧金山举行的 Bloomberg Tech 2026 上与 Brad Stone 讨论 AI 监管、透明度及公共政策框架。
文章以一个直白的问题开头:你愿意将多少钱交给 Claude?这预示着 AI 聊天机器人正试图闯入金融顾问的领域,替代传统人类顾问的工作。
在旧金山举行的 Bloomberg Tech 2026 大会上,Haun Ventures 创始人兼 CEO Katie Haun 与 Bloomberg 的 Emily Chang 对话,分享其风投机构在 AI 智能体领域的前沿投资策略,认为智能体是当前新兴技术中最具潜力的方向之一。
传统财富管理顾问在金融服务行业中最易受AI颠覆冲击。彭博社Isabelle Lee指出,聊天机器人和智能体的崛起正迫使这一领域重新审视其服务模式。
苹果将在周一 WWDC 2026 上发布新款 AI、Siri 与 iOS 27,试图实现人工智能领域的翻身。
高盛资产配置研究主管Christian Mueller-Glissmann接受彭博电视采访时表示,随着人工智能交易热潮降温,市场出现一定程度的整合“可能并非坏事”。他认为,当前市场情绪变化是健康调整的一部分。
Berry Xia 分享用 AI 团队 30 分钟搞定公众号爆款文章的 7 步流程:搜热点、查爆款数据做 6 维度分析、找反共识角度、数据驱动出标题、写正文、配图、一句话排版。作者只负责定方向和决策。
http://x.com/i/article/2062724390589186048
Hudson River Trading(HRT)AI主管Iain Dunning时隔七个月再次接受播客访谈,讨论这家大型做市商部署AI的进展。话题涉及内存价格、计算瓶颈、HRT员工实际在token上的花费、公司可能自研芯片的原因,以及AI引发的谵妄现象。
施罗德固定收益部门主管Remi Olu-Pitan与Schonfeld宏观股票主管Colin Lancaster在Bloomberg节目中探讨AI大规模投资与颠覆背景下的市场前景。两人此前在伦敦MLIV Money & Macro活动上发言。
We're launching Search profiles, a new way for publishers and creators to shape their presence on Search. Search profile...
歸藏指出,部分用户在使用 GitHub 时过于关注发言、原生等细节,却忽略版权协议。其 PPT Skills 要求必须署名且开源,如需闭源可联系作者获取商业授权。他同时提醒,抄袭点子、代码甚至项目名称的行为不可取。在引用推文中,歸藏表示 PPT Skills 将继续更新,得益于近期赞助,将推出第三套惊艳的主题,并将小红书图文卡片的经验融入新版。
说一下 guizang PPT Skills 还会继续更新啊。 得益于最近的几个赞助,可以找时间去更新第三套主题了,依旧非常惊艳。 同时,在小红书那个图文卡片部分积累的好经验,也会用到 PPT Skills 的新版里面。
腾讯混元(Tencent Hunyuan)与中国人民大学高瓴人工智能学院合作,开源PlanningBench——一个可扩展、可验证的LLM规划能力评估与训练框架。该框架包含30+真实世界规划任务,支持自动验证和训练。PlanningBench旨在推动LLM从“说”到“做”的规划能力发展。资源已发布于arXiv、GitHub及HuggingFace。
孙正义6月1日在巴黎接受CNBC专访时预测,Physical AI(物理AI)和机器人是下一个万亿美元机会,AI革命规模将是互联网泡沫时代的50倍。他近期已投资75亿欧元在法国建设AI数据中心。Physical AI定义为“AI大脑+物理身体”,能看见、思考、动手并与真实世界交互,应用包括工厂机械臂、仓库人形机器人和未来家庭助手。孙正义认为Tesla、Figure、宇树、智元等将成为下一阶段主角。
看了新晋亚洲首富孙正义 这个最新访谈睡不着了, 6 月 1 号他在巴黎接受CNBC 专访时透漏了很多未来的财富密码, 明确表示下一个万亿美元机会,是 Physical AI 和机器人。 以及这一波 AI 革命的规模, 大概率是互联网泡沫时代...
英伟达CEO黄仁勋6月5日抵达韩国金浦机场后对记者表示,机器人将成为韩国下一个重要产业,并计划与现代、LG、SK、三星和Naver等企业合作推进机器人与AI领域。他认为韩国为Physical AI提供充足空间,半导体制造将越来越依赖机器人和AI。英伟达或将其计算平台、AI软件和机器人系统引入三星、SK等芯片生产流程。