AIHOT

全部动态

5月27日周三

5月27日

22:27

Berryxia.AI@berryxia

推文分享了关闭X后工作效率提升的个人体验，指出干扰源正是社交媒体。其引用的@berryxia内容，具体展现了"Vibe Coding"（AI辅助编程）这一实践：该过程令人上瘾，但作者因自身的"强迫症"，对一个已完成核心功能、历时两周打磨的文旅视频demo，仍在反复修改细节，并因此"干掉"了初步剪好的成片。

Berryxia.AI: 我靠,Vibe Coding 太特么上头了... 但是,更上头的是我这该死的"强迫症" 下面这个片子,本来是我已经初步剪好的一个正片视频 demo 演示,但最终还是被我干掉了。因为我发现还有一些细节内容需要打磨和提升,真的是绝了。这个东...

其他

22:27

Berryxia.AI@berryxia

麻蛋，Agent成精了。但就是，我想要的状态。这种Agency，真实令人舒服啊！

智能体其他

22:20

Hugging Face：Blog（RSS）

精选61

TRL 新增 Delta Weight Sync：通过 Hub Bucket 传输权重变化，每步从 1.2 GB 降至 20-35 MB

异步强化学习中，训练器每步需将完整模型权重（如1T参数checkpoint约1 TB）传输给推理引擎。TRL新增PR利用相邻RL优化步骤间约99%的bf16权重比特相同的特点，仅将变化的权重编码为稀疏safetensors文件，上传至Hugging Face Bucket并通知vLLM获取。在Qwen3-0.6B上，每步传输从1.2 GB降至20–35 MB。实验还展示了完全分离的训练场景：训练器、vLLM和Wordle环境分别位于不同机器和Hugging Face Space中，权重通过单个Hub bucket流动，无需共享集群、RDMA或VPN。

Hugging Face教程/实践数据/训练部署/工程

推荐理由：异步RL训练中权重同步的瓶颈被HuggingFace用稀疏增量方案解决了，带宽直接省了两个数量级，还给了可运行的TRL分支，做RL训练的可以直接上手试。

22:10

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选56

使用 Codex 构建自改进税务智能体

OpenAI、Thrive 与 Crete 合作，使用 Codex 构建了一个自改进的税务智能体。该智能体能够自动处理报税流程，提升工作准确性并加速整体工作流。

智能体OpenAI教程/实践

关联讨论 1 条

推荐理由：OpenAI 联合 Thrive 把 Codex 塞进税务流程，做出了能自我纠错的申报 agent，金融自动化的同学可以看看他们的错误反馈循环怎么设计的。

22:05

Chubby♨️@kimmonismus

AI就业预测与现实数据的差距

Anthropic CEO Dario Amodei曾预测AI将在数年内大幅取代白领工作，但他本人近期已转向“杰文斯悖论”观点，即自动化最终会创造更多需求。OpenAI CEO Sam Altman也承认此前的预测“大错特错”。然而，耶鲁大学预算实验室自ChatGPT推出以来的持续追踪数据显示，美国职业结构并未发生显著变化，AI曝光度高的岗位失业率也未加速增长。德意志银行为此创造了“AI冗余清洗”一词。目前，AI能力的快速增长与实际就业市场反应之间，存在着前所未有的差距。

AnthropicOpenAI现象/趋势

22:05

Rohan Paul@rohanpaul_ai

Uber COO：AI"tokenmaxxing"尚未证明能可靠创造成功功能

Uber首席运营官Andrew Macdonald对当前AI应用热潮中的“tokenmaxxing”现象提出质疑。他指出，当公司高调宣称上季度25%的代码提交由AI驱动或token使用量显著增长时，这些亮眼数据并未转化为实际的产品成功。他询问资深工程负责人是否有原本搁置的项目因此得以推进，得到的答复是否定的。这与Uber CEO Dara Khosrowshahi此前描绘的乐观图景形成对比：后者曾表示90%的工程师使用AI，其中头部30%的用户生产力获得前所未有的提升，并预测未来AI智能体和GPU算力的投资回报率将超越人类工程师。

Rohan Paul: Uber CEO Dara Khosrowshahi said earlier that currently, 90% of Uber's engineers use AI, but the top 30% (power users) ar...

大佬观点部署/工程

22:01

Baidu Inc.@Baidu_Inc

智能体现象/趋势

21:31

向阳乔木@vista8

让GPT5.5 调研短剧套路，然后生成了个短剧生成Skill，发现有点意思啊！剧名是《我在烂尾美食综艺里封神》

OpenAI教程/实践

21:27

Berryxia.AI@berryxia

开源Codex实战指南发布

一份由开发者“苍老师”撰写的免费开源Codex实战指南（CodexGuide）已发布，旨在帮助新手跳过入门门槛。手册按四层结构组织：认识入口、跑通任务、建立方法、团队沉淀，详细覆盖CLI入门、桌面端安装、Plus订阅，乃至通过ChatGPT App远程指挥Mac Mini等场景。目前，该指南已收录13个可直接复刻的实战案例，例如配合Draw.io自动绘制架构图、GitHub Actions CI失败自动修复、以及在Obsidian中搭建AI知识库。

苍何: http://x.com/i/article/2059577896449331201

智能体OpenAI开源/仓库教程/实践

21:27

Berryxia.AI@berryxia

这次AI 跨过了一个"奇点"！

近期两个事件表明，前沿模型在高级抽象层面的可靠推理能力已跨越临界点。一是Anthropic发布了Claude Mythos Preview，其网络攻防能力过强，因此未公开，仅开放给合作伙伴用于防御。二是OpenAI的内部通用推理模型成功推翻了数学家Paul Erdős提出的一个猜想。两者共同显示，模型稳定处理的推理单元已从句子层级跃升至能维持核心论点、建立逻辑结构的“段落”与“整篇论证”层级，标志着能力的关键跃迁。

Lisan al Gaib: http://x.com/i/article/2058529613370802177

AnthropicOpenAI大佬观点安全/对齐

21:14

IT之家（RSS）

【IT之家评测室】把 267 吋巨幕戴在头上、将 AI 融入日常：雷鸟 GT Max / V4 智能眼镜评测

多模态端侧评测/基准