数学家陶哲轩阐述了 AI 如何通过首次实现分工来重塑数学研究。目前,研究者需亲力亲为完成从问题建模到结果验证的全过程。陶哲轩预见“工业数学”的出现:由大型 AI 辅助团队取代孤军奋战的天才,而人类在提供“灵感性猜想”方面仍不可或缺。
法国创业者Arnaud Bertrand通过分析X在GitHub公开的最新算法代码,揭示创作者触达率暴跌的核心原因。其一是2026年4月上线的自动翻译功能,使同一话题下的内容竞争者数量级激增。其二是新版算法采用两阶段排序:先基于话题语义从数十亿帖子中筛选约1,500条候选帖,再由Grok模型依据15个预测行为打分,其中粉丝量与账号历史权重被大幅削弱。5月15日更新进一步引入一次性曝光过滤、作者多样性评分等机制。结论是算法结构性偏爱带媒体、情绪化、强话题性的内容,每条内容需独立竞争,话题选择比账号积累更重要。
推文感叹Tesla FSD在中国路测中的会车能力表现惊艳,堪称“遥遥领先”。引用推文进一步探讨了AI工具的使用本质,提出工具分为替人思考的“Agent型”和与人共思的“实习生型”(以Cursor为代表),后者是使用者“以术入道”、磨炼判断力的过程。其关键瓶颈是必须在场,而作者通过免费工具UU远程(4K 144帧、原生终端支持)在手机上远程操控运行Cursor的Mac,解决了此限制。
今天,把一件关于 AI 很底层的事,彻底想透了。 使用 AI 的最佳方式是以道御术,但前提是你得先以术入道。 就像黄仁勋说的--真正会用 AI 的人,都是极高认知的提问者,带着自己的认知去提问,让 AI 帮你叩开未知的边界,而不是让它替你思...
小米 MiMo-V2.5 系列 API 完成永久降价,最高降幅达 99%。其技术基础是公开的推理系统全链路优化方案:针对 Hybrid SWA + MoE + 多模态的复合架构,系统性重构了 KVCache 管理、分级缓存、前缀缓存与调度策略。核心优化包括将 KVCache 存储压缩至约 1/7,线上前缀缓存命中率平均达 93%,TTFT P90 降低 30%,Prefill 性能提升约 40%,Decode 阶段前 128 token 加速比达 2.3×。多模态视频处理端到端延时从 156 秒降至 23 秒。该方案宣称是业内首篇全面覆盖此类复合架构的大规模工程落地方案,模型能力无缩减。
一项对6000名高管的调查显示,尽管投入巨大,超过80%的公司尚未从AI中获得生产力提升。仅1/3的领导者使用AI,且平均每周使用时间仅约90分钟。不过,多数受访者预期AI未来三年内将提升生产力。与此同时,Goldman Sachs预测AI智能体的Token使用量到2030年将增长24倍,因其任务循环消耗的Token可能远高于普通对话。智能体生产力与Token消耗之间的平衡,正成为企业新的成本考验,微软近期收紧了对Claude Code的访问即是一例。
Goldman Sachs: "Token use by AI agents is expected to multiply 24 times by 2030" AI agents are now creating the first se...
💡Recent insight: gaslighting @claudeai seems to improve code quality >90% of the time. "You overengineered this, there ...
When we go from GPT-5.0 -> GPT-5.1 -> ... -> GPT-5.5, the number incrementing goes with improvements in capabilities and...
一个名为“guizang-social-card-skill”的社交媒体卡片技能,在GitHub本周新建项目Star排名中冲到了第一名。作者通过群友发现自己的项目登顶,并亲自确认了这一成绩。
http://x.com/i/article/2059811469081141248
小米发布 MiMo-V2.5 系列模型(含 MiMo-V2.5、MiMo-V2.5-Pro),采用 Hybrid Sliding Window Attention(Hybrid SWA)架构,KVCache 存储与计算量均降至 Full Attention 的约 1/7。以 MiMo-V2.5-Pro 为例,70 层中仅 10 层为 Full Attention,60 层为 SWA(窗口大小 128)。团队围绕 KVCache 系统重构(双池管理、按层异步拉取、SWA-aware 前缀缓存树)及分布式缓存 GCache 等环节优化,使存储效率提升约 7×,显著降低长上下文推理成本。
高盛预测,到 2030 年,由 AI 智能体驱动的模型 token 月度消耗量将激增至 120 quadrillion,较当前增长约 24 倍。核心原因是智能体在完成单次用户请求时,需要进行多轮工具调用、结果检查与修正,导致其 token 消耗量可能达到普通问答的 10 倍甚至 50 倍以上。这一趋势引发了成本担忧,Uber 和 Microsoft 等公司已开始重新评估昂贵的智能体使用方案。报告同时指出,推理成本正以每年 60%-70% 的速度下降,智能体带来的生产力提升与潜在的 token 浪费正成为新的博弈焦点。
Salesforce宣布已将整个开发组织迁移至Anthropic的Claude Code,并取消了token限制。其2026年4月报告显示,每位开发者的pull request数量增加了79%,生产事故减少了5%。这些数字未经独立验证。此次迁移突显了编码领域对智能体化转型的巨大分歧:这究竟是真正的革命,还是前所未有的技术债务积累?
推文通过《黑袍纠察队》AI视频案例,点明AI意义在于呈现“希望发生的”剧情。核心讨论了AI工具的两条发展路径:以Claude Code为代表的“AI智能体型”(自主运行)与以Cursor为代表的“实习生型”(需人类监督判断)。作者认为后者是“以术入道”培养判断力的过程,但受限于必须人在场。为此推荐使用免费的UU远程配合Cursor,实现手机远程控制电脑,消除物理距离限制,从而随时随地磨练使用者自身,成为优秀的提问者。
今天,把一件关于 AI 很底层的事,彻底想透了。 使用 AI 的最佳方式是以道御术,但前提是你得先以术入道。 就像黄仁勋说的--真正会用 AI 的人,都是极高认知的提问者,带着自己的认知去提问,让 AI 帮你叩开未知的边界,而不是让它替你思...
X平台近期算法更新导致众多用户(包括大V)帖子触达量显著下降。核心原因在于平台推出自动翻译功能,使内容竞争从单一语言圈扩大至全球范围,竞争池倍增。同时,粉丝数的流量分配作用被大幅削弱,每条帖子都需通过预测互动率单独争取读者。算法分两步工作:先从全平台约1500个候选帖中检索,再由基于Grok的模型通过预测约15种用户互动行为(如喜欢、回复、停留、屏蔽等)的概率来排序打分。最关键的逻辑是,算法打分完全基于预测的互动可能性,不考量内容质量、作者专业性或资历。因此,长文流量下滑是多重机制叠加的结果。
So I spent some time studying the new Twitter/X algorithm today since the latest version was published about a week ago ...
日本AI数据中心热潮正推动企业从传统空气冷却转向液冷技术,主要原因是AI GPU机架的散热需求激增。当前冷却已占数据中心用电量的30%至40%,且GPU发热量在5年内翻了一倍多。传统风冷因空气载热能力有限,面临噪声大、能耗高及物理空间限制。液冷技术通过将金属冷板直接贴合芯片,利用液体流道高效导热,能更高效地移除热量并提升芯片温度稳定性。其主要挑战在于安装成本较高且需专门的服务器机架设计。日本的Fuji Electric、Nidec、Mitsubishi Heavy等公司正积极开发相关系统。
Steve Yegge 在 Medium 发表观点文章《最后一次技术面试》,探讨 AI 时代传统技术面试的意义变化。文章在 Hacker News 社区获得 100 分关注。
AI can give researchers the freedom to pursue "crazier" ideas. For Terence Tao, AI creates more room to experiment, test...
Chrome的CDP调试在使用Codex或Claude Code时,每次调用都弹出确认对话框,尤其在远程服务器或Mac Mini上运行技能时影响自动化执行。由于强制确认且无配置文件调整,用户让Codex编写脚本自动点击确认,虽可能不安全,但个人电脑上可接受。这启发将电脑重复操作脚本化,避免使用Computer Use等方案,因其速度慢且成本高。
本文批评当前AI家教产品(如Claude、GPT)直接给出完整答案的模式,认为这相当于“抄袭答案”,跳过了学习必需的“适度挣扎”过程,导致知识无法进入长期记忆。作者指出,研究显示适度挣扎能强化大脑记忆连接。而提供完整思维链(如Qwen、GPT展示CoT)或追求交互满意度并非关键。相比之下,Koji与Brilliant等产品通过追问卡点、分步解锁等方式鼓励学生主动思考。文章强调,优秀的AI家教核心应是帮助学生真正掌握知识,即便过程“有点烦”。
AI is making kids dumber. It should be making them geniuses. Introducing Koji, the first AI tutor that gets kids to actu...
So I spent some time studying the new Twitter/X algorithm today since the latest version was published about a week ago ...
http://x.com/i/article/2059811469081141248
今晚八点,会通过WaytoAGI做第一场GEO直播分享,会把GEO的底层逻辑、方法、系统原理及理念做一轮讲解,相关的一些资料和系统如下,分享给大家: 1、GEOFlow,今晚主讲的系统和背后的GEO原理 https://github.com...
Claude Opus 4.8发布后,部分用户反馈其相比Opus 4.7升级感知不强,甚至认为模型变笨了。同时,有声音指出GPT-5.5更好用,并调侃该模型是否蒸馏了Qwen。此外,有用户在发布后尝试测试,发现自己的新注册账号意外变为“未注册”状态,此前该账号仅发送过一条消息,引发了对账号安全性的担忧。
我今天对群聊总结的 Skill 更新了个小功能,在群里 @bot,总结群聊记录的时候,就可以结合聊天记录的上下文,在总结的时候回复问题 具体参考:https://github.com/JimLiu/baoyu-skills/commit/a85c81e8db8a19a633e30dda0823e8a9c686263d
baoyu-skills 新加了一个 Skill: 微信群聊总结 Skill:https://github.com/JimLiu/baoyu-skills/tree/main/skills/baoyu-wechat-summary 依赖于 ...
Nous Research 的 Hermes Agent 为 MCP 添加了工具搜索功能,以解决上下文膨胀问题。该功能采用 BM25 渐进式模式披露机制。根据 Anthropic 的评测,在 Opus 4 模型上,此功能实现了 49% 到 74% 的准确率提升。
作者认为MCP(模型上下文协议)对AI智能体的未来至关重要,其核心价值不仅在于工具连接,更在于它所启用的抽象能力。作者以自身构建的自我改进系统为例,该系统完全通过MCP驱动,展示了MCP如何赋能智能体间交互、实现复杂协调、版本控制、评估工作流及工具集成等关键功能。作者强调,尽管新事物可能不断涌现,但MCP协议本身对于未来所有进展将是必要且关键的基础。
Salesforce 分享了工程团队从“Copilot 辅助”演进到“Agentic 工程”的路径,即让智能体承担软件开发生命周期的执行层,工程师专注于目标、规则与验收。关键变革包括:全组织采用 Claude Code 并取消 token 限额、推行“规则即代码”(Markdown 规则+参考实现)、以及自治与并行。一个原估 231 人天的 API 迁移案例,仅用 13 天完成。变革成果体现在:PR 数量增加 79%,有效产出增加 151%,事故减少 5%。真正的信号是下游流程也被智能体接住,避免了“代码洪水”。工程师的核心能力转变为设计智能体工作流与沉淀规则库等复利资产。
Salesforce published a detailed writeup on going agentic with Claude Code. A couple things jumped out. A migration they'...
Hacker News上一篇题为“MCP 死了?”的文章引发讨论,获得了103分。文章来自quandri.io,发布于2026年5月29日,但未提供关于MCP(模型上下文协议)现状的具体论述或结论。
基于您提供的文章内容,当前仅包含标题“What Is a Dickover?”及元数据(来自daringfireball.net,2026年5月29日发布,获108 HN Points)。由于缺少正文主体,无法提取关于“迪科弗”的具体定义、背景或论述,因此无法生成完整摘要。
如何构建你自己的 Agent Harness? 先看几个问题: · 生产级 Harness 是“选一个框架”就能搞定的吗? · 生产级 Harness 必须承担的 15 项真实职责是什么? · 每项职责如何做成可安装、可版本化、可换语言的 worker? · 单次 turn 如何跑通? · 策略、审批、预算、trace 在生产级 Harness 里为什么重要? @mfpiccolo 在他的「How to Build Your Own Agent Harness」中给出了完整答案,强烈建议阅读原文: https://iii.dev/blog/how-to-build-your-own-agent-harness/ [引用 @mfpiccolo]:http://x.com/i/article/2060024515619397638
http://x.com/i/article/2060024515619397638