AIHOT

全部动态资讯 · 1334 条

全部一手资讯 X 论文

5月14日周四

5月13日周三

5月12日周二

5月14日

10:00

公众号：百度智能云（文心）

百度沈抖：万物一体，AI云为基

大佬观点

08:55

Simon Willison 博客

欢迎来到 Datasette 博客

Datasette 项目正式推出官方博客，用于发布一系列即将到来的公告。博客的创建使用了 OpenAI Codex desktop，该工具具备 Markdown 会话转录导出功能，简化了开发流程。构建过程的完整会话记录已公开在 GitHub Gist 中，相关项目 issue 也提供了更多背景信息。此举标志着 Datasette 项目通过 AI 辅助编程工具扩展其沟通渠道。

OpenAI教程/实践

07:59

Hacker News 热门（buzzing.cc 中文翻译）

Tell HN：不要使用Claude Design，取消订阅后我无法访问自己的项目了

一位用户在Hacker News上发帖警告开发者不要使用Claude Design服务。该用户称自己在取消订阅该服务后，完全失去了对自己所有项目的访问权限。这篇帖子获得了超过100个社区点赞，被归类为“Ask HN”讨论。事件凸显了该服务在用户数据控制权方面可能存在严重问题，即订阅关系终止后用户内容被封锁，而非转为只读或可导出状态。

Anthropic行业动态

04:29

Hacker News 热门（buzzing.cc 中文翻译）

在美国，人工智能竞赛的关键领域--商业化--美国正处于领先地位

美国在人工智能竞赛的关键领域——商业化方面处于领先地位。文章指出，尽管全球多国在AI基础研究上竞争激烈，但美国凭借其成熟的科技生态系统、活跃的风险投资和强大的企业应用能力，成功将大量AI技术转化为商业产品和服务，从而在实际应用和市场占有率上取得显著优势。这一商业化领先态势进一步巩固了美国在全球AI产业中的主导位置。

现象/趋势行业动态

03:47

Ars Technica：AI（RSS）

AI入侵普林斯顿大学，30%学生作弊--但同学拒绝举报

普林斯顿大学近期被AI技术渗透，学生中出现高达30%的作弊比例。该校传统的“荣誉守则”系统正面临严重冲击，核心困境在于同学之间普遍不愿举报作弊行为，导致这一监督机制实质上失效。

现象/趋势

03:29

Claude：Blog（网页）

精选73

Claude 电脑与浏览器使用的最佳实践

Claude 最新模型在电脑与浏览器使用能力上显著提升，支持构建复杂智能体系统。本文针对Claude 4.6系列和Opus 4.7提供实践指南，重点优化截图分辨率：Claude 4.6系列API限制最大长边1568像素、总像素115万；Opus 4.7提升至最大长边2576像素、总像素375万。发送前将截图缩放到限制内是提升点击准确性的最有效方法。推荐起始分辨率为1280x720，Opus 4.7用户可优先使用1080p，并避免发送未经缩放的原始截图或过低分辨率图像。

智能体Anthropic教程/实践部署/工程

关联讨论 1 条

推荐理由：如果你正在让 Claude 操作桌面或浏览器，这篇官方指南把分辨率、token 压缩和缓存策略一次讲透了，附带代码和踩坑表，是那种"读完就能少写一堆 bug"的硬核文档。

03:18

Tomer Tunguz 博客（VC 分析）

精选59

The 6 Messages That Actually Matter

知识工作者平均每天收到121封邮件，传统收件箱处理模式难以为继。未来邮件处理将转向高度个性化与自动化：用户能用自然语言定义处理规则，实现收据自动转发、销售线索自动录入CRM等流程。所有历史邮件将构成个人上下文层，为AI处理新邮件提供背景信息，敏感信息则由设备端模型进行私密处理。最终，收件箱本身将消失，真正重要的信息可能浓缩至仅6条。

智能体大佬观点端侧

推荐理由：Tunguz 描绘了一个让收件箱消失的未来，关键是那 6 条真正重要的消息如何被 AI 接管，做产品的人可以把这个当成工作流重构的思考起点。

02:31

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选62

在 Windows 上构建安全有效的沙箱以启用 Codex

OpenAI 为 Windows 平台上的 Codex 构建了一个安全沙箱环境。该沙箱通过严格控制文件访问权限和实施网络限制，确保了代码生成与执行过程的安全性。这一举措使得基于 Codex 的编码助手能够以高效且受控的方式运行，在提供强大编程辅助功能的同时，有效隔离了潜在风险，保障了用户系统的安全。

OpenAI安全/对齐教程/实践

推荐理由：OpenAI 首度公开 Codex 在 Windows 上的沙箱细节，控制文件访问和网络限制的架构设计讲得很实在，做自主编程代理安全的值得一读。

00:55

Simon Willison 博客

引用 Boris Mann 的观点

Boris Mann 对“11个AI智能体”这一表述提出质疑，认为其与“我有11个电子表格”或“我有11个浏览器标签”在含义上并无本质区别。他强调，单纯罗列智能体的数量并无实际意义，关键在于这些工具如何具体协助完成工作。这一观点引发了关于如何准确定义和评估AI智能体实际价值的讨论。

智能体大佬观点

5月13日

22:39

IT之家（RSS）

澳洲放羊大叔引爆 AI 编程革命！Claude Code 急推 goal 模式，不干完不许停

澳大利亚牧羊大叔Geoffrey Huntley为解决AI编程工具Agent中途停止的痛点，编写了一个名为“Ralph Loop”的三行bash脚本。该脚本通过无限循环将任务持续喂给AI，确保其工作至完成。此简单粗暴的思路在11天内被OpenAI、Anthropic和Hermes三家顶级AI实验室集体采纳，并分别集成至Codex、Claude Code和Hermes Agent产品中，推出了/goal等类似功能。这一变化标志着AI编程的核心正从“生成代码”转向“闭环交付”，显著提升了AI的自主性和任务完成能力，被视为通用人工智能发展的关键一步。

智能体AnthropicOpenAI现象/趋势

21:41

公众号：数字生命卡兹克

聊聊豆包维权事件的风波。

大佬观点现象/趋势

21:28

Hacker News 热门（buzzing.cc 中文翻译）

Show HN： Statewright--让人工智能代理更可靠的可视化状态机

Statewright发布了一个开源的可视化状态机工具，旨在通过图形化界面提升人工智能代理的可靠性。该工具允许开发者直观地设计和监控AI代理的状态转换，简化开发流程，减少错误并增强系统稳定性。在Hacker News上，该项目获得101个点赞，显示出技术社区对其创新性的关注。开发者可通过GitHub访问代码，将其集成到AI项目中以提高可维护性和性能。

智能体GitHub开源/仓库开源生态

关联讨论 1 条

17:39

IT之家（RSS）

哈佛计算机科学教授马兰：AI 并不是导致本专业热度下降的唯一原因

哈佛大学教授大卫·J·马兰指出，计算机科学专业热度下降不能仅归因于AI。科技行业整体降温及岗位减少的趋势在生成式AI爆发前就已出现，并已影响学生选择和公司校招。数据显示，美国四年制大学该专业2025年秋季报名人数同比骤降8.1%，为2020年以来最大跌幅。马兰认为行业热度未来仍会波动，但计算机科学培养的解决问题能力是长期受用的核心技能，社会需更理性看待科技行业的长期价值。

大佬观点

17:39

IT之家（RSS）

Anthropic Claude Code 缔造者：数千个 AI 智能体夜间自动为我写代码

Anthropic工程师鲍里斯・切尔尼透露，他利用Claude Code的循环指令和例行任务功能，在夜间自动运行数千个AI智能体进行编程开发。他通常同时开启5至10个会话，每个会话包含多个智能体，并通过手机应用管理这些任务。这种模式标志着工程师将AI从聊天机器人转变为全天候自主助手。切尔尼此前在社交平台分享的智能体配置方案已获得超10.4万次收藏和810万次浏览。

智能体AnthropicMCP/工具教程/实践

15:39

IT之家（RSS）

理想汽车李想建议所有公司不要裁人：AI 时代容易把最好的人裁掉

理想汽车创始人李想在播客中建议所有公司不要在AI时代轻易裁员。他指出，AI时代的人才标准已发生变化，若按旧标准裁员，很可能误裁掉最优秀的人才。李想以公司内部Token消耗量前20的员工为例，他们并非传统认知中的顶级员工，不擅长表达却思维极强，在获得Token和业务环境后能创造巨大价值。他强调，专业人才若善用AI，其价值将提升至新高度，无法被简单替代。

大佬观点

13:55

Simon Willison 博客

CSP允许列表实验

该工具展示了一项实验：将应用加载于受内容安全策略（CSP）保护的沙盒iframe中，并通过自定义的`fetch()`函数拦截CSP错误，将其传递至父窗口。父窗口随后可提示用户将受阻域名（如`https://api.inaturalist.org`）添加至允许列表，刷新页面后即可生效。工具界面包含源代码、预览面板及允许列表管理区，用户可手动添加如`https://api.github.com`等受信来源。此项目由作者在Codex桌面应用中借助GPT-5.5 xhigh协助构建完成。

教程/实践部署/工程

11:39

IT之家（RSS）

百度李彦宏称 AI 时代的度量衡不是 Token 消耗，而是日活智能体数（DAA）

在Create 2026百度AI开发者大会上，百度创始人李彦宏提出，AI时代的核心度量衡应是“日活智能体数”（DAA），而非当前业界常用的Token消耗。他认为Token仅代表成本和投入，无法衡量产出与价值；DAA则关注有多少智能体在有效为人类工作并交付成果，更能反映平台与生态的繁荣本质。李彦宏同时指出，在智能体浪潮中，开发者、创业者与创造者的角色正融合为一体。大会于5月13日至14日在北京举行，多位行业领袖出席。

智能体大佬观点

11:37

公众号：MiniMax（稀宇科技）

一个 AI 还是不够

其他

09:39

IT之家（RSS）

OpenAI 前研究员揭露"公开秘密"：人类正打造无法完全控制的 AI

OpenAI前研究员丹尼尔·科科塔伊洛指出，AI行业正竞相构建自身尚未完全理解或控制的系统，这已成为一个“公开的秘密”。核心挑战在于“对齐”难题，即难以确保能力超越人类的AI系统能稳定遵循人类指令与价值观。他警告，一旦超级智能诞生，人类可能失去主导地位。尽管行业正投入巨资开发更强大模型，但许多人仍低估了AI的发展速度与相关风险。

OpenAI安全/对齐

09:18

Tomer Tunguz 博客（VC 分析）

Theory 2026年度市场进入策略调查启动

Theory公司正式启动2026年度市场进入策略调查，旨在通过对比2022至2025年数据，分析初创企业在销售、营销等领域的演变。本次调查聚焦五个核心假设：人机协同的销售代表表现将优于纯AI或人类团队；AI可能拉大顶尖与末位团队的绩效差距；买方AI的采用比卖方AI更具颠覆性；AI效率提升可能主要导致人员编制缩减而非收入增长；创始人对AI的预期已随现实落地而下调。调查结果将在后续办公时间活动中公布，参与者可获得匿名原始数据。

大佬观点数据/训练

07:53

Simon Willison 博客

引用 Mo Bitar：一则关于"AI裁员下不道德生存指南"的讽刺视频

TikTok用户Mo Bitar发布了一段名为“AI裁员下的不道德生存指南”的讽刺视频。视频中，他建议员工向CEO推销“Ralph Loops”等虚构技术概念以获取预算与晋升，并不断空谈自动化，甚至公开点名同事称“我自动化了Gary”，以此进行表演，在裁员潮中保全自己。这段内容尖锐地讽刺了当前AI热潮中，许多企业盲目跟风、员工利用信息差故弄玄虚的企业文化现象。

大佬观点现象/趋势

07:26

Hacker News 热门（buzzing.cc 中文翻译）

为人工智能时代重新构想鼠标指针

DeepMind重新构想人工智能时代的鼠标指针，将其从简单的图形符号转变为动态的、情境感知的AI交互界面。新指针能根据用户当前任务和屏幕内容智能变化形态与功能，例如在文本编辑时变为书写工具，在分析数据时可视化显示相关信息。这一设计旨在减少传统图形界面中的频繁窗口切换，通过指针直接提供上下文辅助，提升人机协作效率，标志着输入设备从被动工具向主动协作伙伴的演进。

DeepMind多模态现象/趋势

07:09

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选63

财务团队如何使用 Codex

财务团队能够利用 Codex，基于实际工作输入构建管理层报告、报告包、差异桥接、模型检查和规划场景。该工具将自然语言指令转化为代码，自动化处理财务数据整合、差异分析和模型验证等复杂任务，从而提升报告生成效率与准确性，并支持快速创建多版本规划场景。

OpenAI教程/实践编码

推荐理由：金融团队终于有了一个正经的 AI 用例，用 Codex 自动生成 MBR、差异桥接和规划场景，比手工拉 Excel 高效太多了，做财务分析的建议点开看看。

06:53

Simon Willison 博客

引用 Mitchell Hashimoto

Mitchell Hashimoto 在讨论 Redis 官网设计时指出，约90%的技术决策者主要动机是“不被解雇”。他们通常朝九晚五工作，不涉足业余技术社区，决策依赖分析师报告和大众趋势。例如，若 Gartner 强调“AI战略”或 McKinsey 提及管理“上下文”，他们就会倾向采购“AI应用上下文引擎”这类符合潮流的方案，以确保决策安全。

大佬观点现象/趋势

06:08

OpenAI：官网动态（RSS · 排除企业/客户案例）

AutoScout24 通过 AI 驱动的工作流扩展工程能力

AutoScout24 Group 采用 Codex 和 ChatGPT 来加速开发周期并提升代码质量。公司通过 AI 工具自动化代码审查、生成测试用例和编写文档，将部分开发任务效率提升高达 40%。工程师得以更专注于复杂问题，同时 AI 应用范围从代码辅助扩展至需求分析和数据查询。这一转变推动了团队 AI 采用率的显著增长，并系统化地融入了日常开发工作流。

OpenAI教程/实践编码

06:08

OpenAI：官网动态（RSS · 排除企业/客户案例）

财务团队如何使用 Codex

财务团队可利用 Codex 从实际工作输入中构建管理层报告、报告包、差异桥接、模型检查和规划场景。该工具能将非结构化数据（如电子邮件、会议记录和电子表格）自动转换为结构化的财务分析框架，从而提升报告效率与准确性。Codex 的应用减少了手动数据整理时间，使团队能更专注于高价值的分析与决策支持工作。

OpenAI教程/实践编码

03:08

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选64

Parameter Golf 揭示了关于 AI 辅助研究的哪些经验

Parameter Golf 项目汇聚了超过 1000 名参与者和 2000 多份提交作品，在严格限制条件下探索了 AI 辅助的机器学习研究、编码智能体、模型量化及新颖模型设计。活动展示了 AI 工具如何帮助研究人员在受限参数规模下优化模型性能，推动了高效模型架构与自动化代码生成技术的实践进展。核心发现包括智能体协作能显著提升研究效率，而量化技术可在微小精度损失下大幅压缩模型体积。

智能体OpenAI现象/趋势

推荐理由：OpenAI让1000多人一起玩AI辅助研究，这篇复盘给出了几个很实在的教训，尤其关于代码Agent和量化，搞研究的人值得花五分钟读一下。

02:54

Claude：Blog（网页）

精选58

Anthropic 网络安全团队如何利用 Claude Code 构建威胁检测平台

Anthropic 检测平台工程团队技术负责人 Jackie Bow 运用 Claude Code 开发了 CLUE 威胁检测与响应平台。该平台通过自然语言界面连接内部系统，包含 CLUE Triage 自动初筛警报，整合上下文信息分配处置建议；以及 CLUE Investigate 支持分析师用自然语言查询日志，由 Claude 自动生成并执行查询，将数小时的人工分析缩短至几分钟。团队在一天内完成概念验证，一周内交付实现，显著提升了安全运营效率。

智能体Anthropic安全/对齐教程/实践

推荐理由：我一直好奇大模型公司自己怎么用 AI 做安全，这篇挖出了 Anthropic 内部 CLUE 平台的构建细节——从一天出原型到每周省下 234 人天，数据比很多 PR 稿扎实。

01:55

Hacker News 热门（buzzing.cc 中文翻译）

亚马逊员工因被迫使用人工智能工具而进行"tokenmaxxing"

亚马逊员工因公司强制使用人工智能工具而进行“tokenmaxxing”，即通过优化输入策略以最大化AI工具输出，应对绩效压力。这一行为揭示了AI技术集成到工作流程中时，员工被迫适应新系统带来的挑战，可能影响工作效率和职场动态。报道在Hacker News上获得110点关注，显示科技社区对该议题的重视。

现象/趋势部署/工程

01:05

Google Developers Blog（RSS）

精选73

使用ADK构建可暂停、恢复且永不丢失上下文的长时运行AI智能体

本文探讨了如何从无状态聊天机器人升级为生产级AI智能体，以管理长达数天或数周的企业工作流程（如HR入职）。通过引入Agent Development Kit（ADK），其架构核心采用持久状态机和持久化会话存储，确保智能体在“空闲时间”或服务器重启时永不丢失上下文。系统利用事件驱动的Webhook和多智能体委托机制，实现在暂停期间“休眠”，并在唤醒后以高推理准确性恢复复杂任务，从而构建出具备韧性和可靠性的长时运行智能体系统。

智能体Google教程/实践部署/工程

关联讨论 1 条

推荐理由：Google 官方手把手教你把无状态 chatbot 升级成能跨天跨周的持久化 agent，状态机和持久会话是两个关键切入点，做过生产环境 agent 的都懂这东西有多刚需。

00:26

Nathan Lambert：Interconnects（RSS）

精选64

开放模型生态的复合增长

中国AI生态呈现高参与度与开放优先特征，开源模型社区形成自我强化循环。开发者基于主流架构二次创新，国产开源模型下载量季度环比激增超200%。开放协作降低了技术门槛，推动应用层涌现大量行业解决方案，模型微调工具使用量同比大幅增长。生态参与者通过贡献代码、数据及优化方案，持续反哺核心模型迭代，构建了技术红利共享的复合增长网络。

大佬观点开源生态现象/趋势

推荐理由：Nathan Lambert这篇对中国开放模型生态的剖析，点出了‘参与人数×开源速度’的飞轮，做开源的人该认真看看。

5月12日

23:53

GitHub Blog

精选58

Dungeons & Desktops：使用 GitHub Copilot CLI 构建一款程序化生成的 Roguelike 游戏

一位 GitHub 员工利用 GitHub Copilot CLI 开发了一款扩展程序，能够将任何代码库转换成一个独特的 Roguelike 风格地下城。该工具通过 AI 辅助的代码生成，实现了程序化关卡创建，展示了 Copilot CLI 在创意编码和游戏原型开发中的实际应用潜力。项目核心是自动解析代码结构并生成对应的可探索地下城布局。

GitHub教程/实践编码

推荐理由：用 GitHub Copilot CLI 把代码库变成 roguelike 地牢，玩法挺有脑洞，做 Copilot 扩展的开发者可以看一眼思路。

23:37

Artificial Intelligence News（RSS）

JBS Dev：关于不完美数据与人工智能最后一公里--从模型能力到成本可持续性

JBS Dev总裁Joe Rose指出，在部署生成式与代理AI系统时存在一个普遍误解，即认为数据必须完美无缺才能开展相关工作。文章结合AI Fieldbook近期内容，探讨了AI应用从模型能力提升到实现成本可持续性的实际挑战，强调在真实场景中应对不完美数据是突破AI落地“最后一公里”的关键。

数据/训练现象/趋势部署/工程

22:10

The Decoder：AI News（RSS）

亚马逊员工"刷榜"内部AI排名，公司推出自动提示优化功能

据报道，部分亚马逊员工为提升内部AI排行榜排名，正通过自动化手段执行非必要任务。与此同时，亚马逊为其Bedrock AI服务推出了自动提示词优化功能，旨在简化耗时的手动提示工程流程，根据任务不同可将模型性能最高提升22%。该功能已在Bedrock平台的Claude-3、LLaMA-3等多个模型上提供。尽管Anthropic和OpenAI等公司也提供了类似工具，但整个行业在准确评估这些自动优化结果的有效性方面仍面临普遍挑战。

现象/趋势

18:00

公众号：小红书技术（dots.llm）

QCon 北京 2026 | 把自动化测试当 AI Coding 来做：小红书 GUI Agent 实战回顾

小红书在 QCon 北京 2026 分享了 GUI Agent 实战经验，核心思路是将自动化测试当作 AI Coding 来做，通过工程化方式让 GUI Agent 在真实业务场景中“跑起来、跑得稳、跑得省钱”。

智能体教程/实践部署/工程

17:36

IT之家（RSS）

AI 时代新怪象：越来越多人抱着"半开笔记本电脑"到处跑

随着AI智能体热潮兴起，技术从业者为保持AI编码任务持续运行，不得不抱着半开笔记本电脑在公共场所走动。报道采访了多位有此习惯的人，他们出现在溜冰场、机场、高中走廊等地，因任务一旦合盖中断就会丢失进度。有人将电脑开合角度调至最小以避人耳目。这种行为已形成网络梗文化，当事人常感尴尬，但在旧金山湾区等技术密集区已较常见。

智能体AnthropicOpenAI现象/趋势

14:55

Hacker News 热门（buzzing.cc 中文翻译）

Show HN：就像TikTok，但专为科学论文而设

一款名为“TikTok for scientific papers”的新工具上线，它借鉴TikTok的短视频信息流模式，专门用于浏览和发现学术论文。用户可以通过快速滑动的交互方式，高效接触多篇论文的核心内容。该平台旨在改变传统线性阅读习惯，提升科研信息获取的效率和广度，目前已在GitHub页面发布并获得了103个Hacker News社区点赞。

产品更新搜索

12:25

Hacker News 热门（buzzing.cc 中文翻译）

我让人工智能开发了一个工具，帮助我找出是什么在半夜吵醒我

作者利用人工智能开发了一款工具，用于监测和分析夜间可能吵醒他的声音。该工具通过记录和分析环境音频，识别并分类噪音来源，帮助作者找出睡眠中断的具体原因。这一实践展示了AI在解决个人生活问题上的实际应用潜力。

多模态教程/实践编码

10:55

Hacker News 热门（buzzing.cc 中文翻译）

交互模型

2026年5月11日，thinkingmachines.ai发布关于交互模型的文章，在Hacker News上获得103点关注。交互模型作为人机交互的核心概念，可能涉及人工智能系统与用户互动方式的创新或改进。这一高关注度反映了技术社区对交互模型发展的兴趣，表明该主题在AI领域具有讨论价值。文章链接指向详细内容，但未提供具体技术细节或变化指标，仅从社区反馈可见其影响力。

智能体MCP/工具现象/趋势

10:08

公众号：数字生命卡兹克

分享5个Claude Code + 飞书的超实用Agent办公玩法。

智能体教程/实践