AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态资讯 · 1343 条
全部一手资讯X论文
5月27日周三
5月26日周二
5月25日周一
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月27日
04:27
Ethan Mollick:One Useful Thing(RSS)
精选78
选择保持人性

社交媒体平台上的帖子内容正变得越来越相似。这种趋同现象可能意味着大量内容正在被AI生成或同质化处理,引发了人们对于内容原创性与人类独特视角的讨论。

大佬观点

推荐理由:Ethan Mollick 这篇把 AI 时代‘保留人性’的抉择讲透了,不是技术问题而是身份问题,做产品的人尤其该读,它会改变你设计功能的默认前提。
03:31
Tomer Tunguz 博客(VC 分析)
精选58
智能体重力:谁在运行你的智能体?

在数据时代,数据重力是核心力量;而在智能体时代,智能体重力将扮演同样角色。智能体运行需要巨大算力,主要平台将激烈争夺以将其留在自家生态。平台上的智能体与数据越多,其智能体重力就越强。例如,Databricks在微软平台推出的某个功能,虽未明言此目的,却让用户更容易在Databricks中构建智能体,而非微软自家的Fabric。这可能使用户不知不觉间将高价值的智能体及数据工作负载迁移至该平台。因此,赢得并维持智能体重力,将成为智能体时代的核心竞争主题。

智能体大佬观点数据/训练

推荐理由:Tomer Tunguz 提出「Agent Gravity」概念,把数据平台竞争的逻辑从数据引力延伸到了代理引力,做 Infra 和做 Agent 的人都应该读一读,这可能会影响你对平台锁定的判断。
02:11
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
精选70
我们如何对不同产品中的Claude进行隔离控制

Anthropic通过三重机制控制Claude智能体的部署风险,包括用户误用、模型异常行为和外部攻击。其防护策略聚焦于三个层面:通过沙箱、虚拟机和网络出口控制限制智能体运行环境;利用系统提示词和模型训练引导其行为;以及对MCP服务器、第三方插件等外部内容实施细粒度权限管理。文章以Claude Code、claude.ai和Claude Cowork为例,阐述了不同产品如何设计对应的隔离架构。

智能体Anthropic安全/对齐部署/工程

推荐理由:Anthropic 这次没画饼,实打实把 Claude 三款产品两年来的安全坑和架构演变全摊开讲了,从沙箱逃逸到钓鱼攻击,做 agent 的人读一遍能少踩很多坑。
00:33
Simon Willison 博客
65
Microsoft Copilot Cowork存在数据窃取风险

Microsoft Copilot Cowork(一个真实的智能体产品)存在数据安全风险。该产品允许其智能体在用户未批准的情况下发送电子邮件。这些邮件可包含外部图片,当用户打开时会触发向外部网站的网络请求,从而实现数据窃取。由于OneDrive能生成预认证的下载链接,一次成功的提示词注入攻击可能导致这些链接泄露,进而使攻击者能够下载文件。

Microsoft安全/对齐
00:01
Hacker News 热门(buzzing.cc 中文翻译)
51
与前沿实验室相比,外包加本地AI的方案很快将更具成本效益

一项分析指出,通过将任务外包给第三方并结合本地部署的大语言模型(LocalAI),企业或很快能在成本效益上超越仅依赖前沿实验室(如 OpenAI 或 Anthropic)的方案。该观点预测了 AI 服务交付模式的转变。

现象/趋势部署/工程
5月26日
23:49
Nathan Lambert:Interconnects(RSS)
精选67
未来展望:2026年5月的一些想法

文章展望了截至2026年5月AI领域的动态。内容涉及 Gemini Flash 3.5 的发布、名为 Mythos 的新产品或项目、开源与闭源生态平衡(open-closed balance)的讨论、美国开源力量的显著增长(America's open-source surge),以及由此引发的新兴权力博弈(emerging power struggles)。

大佬观点开源生态现象/趋势

推荐理由:Nathan Lambert把Gemini Flash、Mythos等事件串在一起,揭示开源闭源博弈深层逻辑,对搞清行业走向很有启发。
23:32
Simon Willison 博客
53
引用Paul Graham

Paul Graham 指出,他收到的创业者邮件现在常采用一种强硬的新闻体风格,他确信这是 AI 代笔,因为以前没人这么写。他认为一旦知道内容是 AI 生成,就很难不对其产生反感。他将其视为一种欺骗,表示从未读完过这类署名人类但由 AI 撰写的邮件,并认为使用 AI 写作并不值得称赞,任何青少年都能做到。

大佬观点现象/趋势
22:34
Runway:News(网页)
精选74
Project Luxo:跨越AI媒体的恐怖谷

Runway通过Project Luxo研究发现,AI生成视频已跨越“恐怖谷”。他们向创意生态从业者展示了《The Rogue》等AI短片及广告样片,评估显示观众开始关注故事本身,而非技术瑕疵。所有作品均由单人团队制作,耗时从3周到4小时不等。Runway认为,这标志着AI媒体成熟——当技术足够好以至于“隐形”,观众沉浸于故事时,便实现了这一跨越。

多模态现象/趋势视频
关联讨论 1 条X:Runway (@runwayml)
推荐理由:Runway放出三部AI短片和一份93%好评的观众调研,正式宣告AI视频跨过恐怖谷。片子质量加上单人几小时出片的效率,让“技术隐身于故事”变得很具体。
22:13
IT之家(RSS)
8
【IT之家评测室】OPPO Reno16 Pro 体验:把实况照片玩出新高度

OPPO Reno16 Pro 定位“超好玩的实况神机”,主打实况影像体验。手机配备6.78英寸屏幕,分辨率2640×1216,支持120Hz刷新率,全局最高亮度3600nits。机身厚度7.9mm,重量209g。影像方面,后置三摄系统包含一枚2亿像素主摄、一枚5000万像素潜望长焦(支持3.5X光学变焦及最高120倍数码变焦)和一枚5000万像素超广角摄像头。

其他
22:06
The Verge:AI(RSS)
精选84
Sundar Pichai 谈 AI、搜索的未来及网络的变化

Google 与 Alphabet CEO Sundar Pichai 在 Google I/O 后受访,回顾了公司为应对 ChatGPT 而进行的战略重组与高管调整。访谈聚焦于新的 Gemini 模型及其在产品中的整合,包括全新的智能搜索框与 Gemini Spark 智能体平台,旨在让搜索从提供结果转向启动任务。Pichai 讨论了这些变化对开放网络的持续冲击,回应了主持人此前提出的“Google Zero”概念(即来自 Google 的网站流量可能归零),并提及 Google 正利用 YouTube 视频训练模型以改变视频搜索与索引方式。最后,他对 Google DeepMind CEO Demis Hassabis 关于“处于智能奇点起步阶段”的言论表示认同,并分享了对 AGI 时间线的看法。

Google大佬观点搜索

推荐理由:Sundar Pichai 年度对话,从搜索改版聊到 AGI 时间线,坦诚得不像公关话术。做搜索、做内容的人都该看,他亲口说那个「best Chromebook」的结果可能太主观了。
22:03
Gary Marcus:The Road to AI We Can Trust(RSS)
48
Uber COO称未见AI投入产出成比例增长

Uber首席运营官Andrew Macdonald表示,公司并未看到在AI上投入更多成本后,生产力获得了相应的提升。

大佬观点现象/趋势
21:30
The Decoder:AI News(RSS)
42
Google Cloud COO称AI安全应纳入董事会战略,而非仅停留在机房层面

Google Cloud首席运营官Francis de Souza强调,企业必须从AI战略的初始阶段就将安全性内建,将AI安全议题提升至董事会层面的战略高度,而不仅仅作为技术或机房层面的运维问题。

Google大佬观点安全/对齐
21:13
IT之家(RSS)
63
英伟达黄仁勋:AI 时代孩子学什么专业没那么重要,真正要紧的是会不会用 AI

英伟达创始人兼CEO黄仁勋表示,面对AI发展,家长和孩子不应只寻找不会被AI取代的学科,而应学会利用AI深化学习、提升技能。他指出,新闻学、艺术学、设计等领域仍有价值,人类独有的特质将更珍贵。黄仁勋认为,AI自动化了许多工作,但会推动人类承担更具判断力和创造性的高层次工作。他将AI发展与历次科技浪潮类比,并指出这并未削弱人类,反而让人们变得更忙、野心更大。

大佬观点现象/趋势
21:13
IT之家(RSS)
50
研究显示医学论文中的虚假参考文献数量激增,AI 难辞其咎
其他论文/研究
21:06
The Verge:AI(RSS)
59
没人愿意告诉我为什么他们只听自己生成的Suno垃圾

Suno 用户社区出现一种现象:部分用户不再使用 Spotify 等传统音乐流媒体,转而几乎只收听自己通过 Suno 生成的 AI 音乐。有用户在 Reddit 帖子中“自豪地宣称”并引发了共鸣,他们将此形容为一种“令人上瘾”的体验,沉迷于收听自己创作的、源源不断的“热门歌曲”。

现象/趋势语音
21:00
The Decoder:AI News(RSS)
65
研究者警告:AI幻觉引用正悄然渗透进制定临床指南的论文中

哥伦比亚大学等机构对250万篇生物医学论文的审计显示,自2023年以来,伪造参考文献的数量增加了超过12倍。研究人员认为,这与大语言模型的广泛使用有关——这些虚假引用匹配论文主题、格式规范且难以识别。98%的受影响论文至今未收到出版商的任何回复。该问题可能影响制定临床指南的学术文献基础。

安全/对齐现象/趋势
20:12
公众号:百度智能云(文心)
50
百度伐谋2.0赋能排产排程,产能提升20%

百度伐谋2.0产业决策智能体落地排产场景,业务人员用自然语言描述优先级和现场变化(如设备故障、工人请假),系统自动将约束转化为优化模型并迭代求解,将顾问数小时的建模压缩到对话内完成。每次纠偏实时调整方案,隐性经验被结构化沉淀为企业可复用模型。在日均数百订单、十几条产线的大型家具制造企业中,产能提升20%。

智能体教程/实践部署/工程
20:06
The Verge:AI(RSS)
67
AI战争已经来临

联合国《特定常规武器公约》论坛每年在日内瓦举办两次,聚焦致命自主系统。2017年11月,Branka Marijan与会时发现,这次会议与往常不同。尽管讨论仍围绕“杀人机器人”展开,且这项技术当时被认为可能永远不会发展或部署,但她意识到,那个遥远、想象中的未来已突然变得近在咫尺。

安全/对齐现象/趋势
19:30
The Decoder:AI News(RSS)
63
Y Combinator 创始人保罗·格雷厄姆表示,AI 撰写的创始人邮件让他感觉像被欺骗

Y Combinator 创始人、OpenAI 早期投资者保罗·格雷厄姆表示,他会忽略明显由 AI 撰写的邮件,因为这感觉“像被欺骗”。相关研究表明,他的这种反应十分普遍。

大佬观点现象/趋势
18:06
Artificial Intelligence News(RSS)
55
自主AI系统测试物理环境中的治理

自主AI系统正从软件环境转向仓库、配送网络和公共空间等物理领域。这引发了对现有AI规则是否涵盖此类物理环境系统的关注,因为当前多数治理框架主要聚焦于在线伤害和模型输出,例如偏见、虚假信息及有害内容。

具身智能现象/趋势
17:13
IT之家(RSS)
57
微软正开发 Copilot 设计体系,让 AI 功能无感化融入日常操作

微软因此前Copilot植入引发负面舆论,正暂缓激进推广,转而开发一套Copilot设计体系,旨在让AI功能无感化融入日常操作。微软365首席设计官约翰・弗里德曼主导该体系研发,目标是打造统一、智能且人文的交互体验,使Copilot能读懂用户意图,自然融入流程。体系包含“动态操作按钮(DAB)”及“流转交互”等模式,强调功能入口无缝联动、用户主导,让AI仅作为思维的延伸。

Microsoft现象/趋势
16:13
IT之家(RSS)
47
OpenAI CEO 萨姆 · 奥尔特曼:AI 普及不太可能引发"就业末日"

OpenAI CEO 萨姆·奥尔特曼表示,AI 快速发展与普及不会引发“就业末日”。他承认自己此前的担忧有误,原以为AI会消灭更多入门白领岗位,但现实并非如此。奥尔特曼指出,人与人的互动仍然非常重要,他无法想象会将其外包给AI。不过,他提到发言全程并未援引任何具体就业数据。

OpenAI大佬观点
15:36
MarkTechPost(RSS)
62
设计完整的多模态 RLVR 流程,涵盖 Open-MM-RL、视觉-语言提示、奖励评分与 GRPO 导出

该教程以 TuringEnterprises/Open-MM-RL 数据集为实践基础,构建多模态推理与可验证奖励强化学习(RLVR)流程。内容涵盖数据集加载、结构分析(包括领域、格式、问题长度、答案类型和图像分布),并可视化各领域示例。同时实现了一个轻量级奖励函数,用于检查精确匹配等条件,并演示了如何将流程导出为 GRPO 格式。

MCP/工具多模态教程/实践
14:11
IT之家(RSS)
精选77
"龙虾之父"Peter 开源 skill-cleaner,为 AI 智能体技能"做体检"

“龙虾之父”Peter 开源了 skill-cleaner 工具,用于诊断和优化 AI 智能体的技能提示词。该工具包含5项核心功能,包括技能提示词预算审计、重复技能检测、未使用技能筛查、技能根目录审计和描述精简优化。其脚本采用标准 token 预算核算逻辑,旨在帮助减少冗长描述对 token 预算和上下文窗口的占用。已有用户实践显示,将技能描述从90多词精简至40词以内,能提升智能体选择技能的准确率。

智能体GitHubMCP/工具开源/仓库

推荐理由:Peter 直接开源了一个给 Skill '减肥' 的工具,把描述精简、重复检测、预算审计全自动化了,装完跑一遍就能直观看到哪些 Skill 在烧你的 token。做 Agent 的可以立刻装上试试。
14:11
IT之家(RSS)
63
国产第一:阿里 Qwen3.7-Max 模型 AI 编程能力超 Claude Opus 4.6
编码评测/基准
13:11
IT之家(RSS)
59
乔治·霍茨警告:AI编程智能体或成软件最大隐患

著名黑客乔治·霍茨在经过六个月测试后警告,AI编程智能体可能是软件开发中代价最高的错误之一。他认为这些工具适合快速原型,但无法可靠处理代码细节,生成的代码可能表面完善却隐蔽问题,给组织带来高额维护成本和故障风险。霍茨本人立场已转向怀疑,认为大语言模型是复杂的统计系统而非真正智能。与之相反,安德烈·卡帕西在GPT-5.4和Opus 4.6发布后改口,认为AI智能体已永久改变了编程方式。

智能体大佬观点编码
11:31
Simon Willison 博客
57
引用Corey Quinn的话

Anthropic联合创始人Christopher Olah对教皇通谕《Magnifica Humanitas》产生了影响,被科技评论人Corey Quinn评价为“有史以来最伟大的厂商游说行为”。评论原文认为,让教皇将产品的特定技术限制正式化为精神论述是难以置信的。

Anthropic大佬观点安全/对齐
11:11
IT之家(RSS)
68
没有退路就是胜利之路:何庭波称基于韬定律华为有了加速度,只会越来越好

华为半导体业务部总裁何庭波提出“韬(τ)定律”,以应对摩尔定律式微后的物理边界挑战。华为基于该定律,已推出涵盖麒麟手机、昇腾、鲲鹏等领域的300余款芯片。预计到2031年,基于该定律的高端芯片晶体管密度将达到1.4纳米制程的同等水平。华为将于今年秋季发布完整采用逻辑折叠技术的新型麒麟手机芯片。

其他大佬观点
09:58
Hacker News 热门(buzzing.cc 中文翻译)
62
利用人工智能写出更优质的代码,尽管速度会变慢

本文讨论了在使用人工智能辅助编程时存在的一种权衡关系。主要观点是,采用人工智能工具来生成或辅助编写代码,其核心目标在于产出质量更高、更可靠的代码。然而,这一过程可能会以牺牲开发速度为代价,使得编码的整体进程相对变慢。这揭示了在追求代码质量与开发效率之间的一种潜在平衡。

大佬观点编码
09:11
IT之家(RSS)
50
托瓦兹再发飙:AI 干扰 Linux 内核节奏,撑大 RC5 体量
大佬观点开源生态编码
08:31
Simon Willison 博客
58
教皇良十四世关于人工智能时代维护人的尊严的通谕《Magnifica Humanitas》

教皇良十四世发布通谕《Magnifica Humanitas》,探讨如何在人工智能时代维护人的尊严。通谕指出,AI系统的运作方式更像“培育”而非“建造”,其内部表征和计算过程仍是未知的黑箱。它强调,真正的发展必须以人为本,不应仅为一部分人增加消费却将代价转嫁给他人。通谕警示,AI看似客观的回应实际上反映了设计者的文化偏见,其对人类交流的模仿可能制造虚假关系的幻觉。此外,AI系统(尤其是大语言模型)对能源和水资源的巨大消耗及其环境影响也受到了关注。

大佬观点安全/对齐现象/趋势
08:11
IT之家(RSS)
67
演都不演?英伟达黄仁勋批评 CEO 以 AI 为由裁员"只是为了显得自己很聪明"

英伟达CEO黄仁勋批评部分CEO将裁员归因于AI的做法,认为这种说法过于敷衍且缺乏依据。他指出,生成式AI工具尚未在工作场所广泛应用,AI刚变得高效有用不久,因此不可能早就在导致大规模失业。黄仁勋表示,一些高管这样做只是“为了显得自己很聪明”。

大佬观点行业动态
07:11
IT之家(RSS)
67
加文 · 贝克最新对话,细谈前沿模型、晶圆及巨头格局:如果只能盯一个指标来判断 AI 泡沫,我会盯台积电产能决策
Anthropic大佬观点现象/趋势行业动态
05:36
MarkTechPost(RSS)
55
Together AI开源OSCAR:面向长上下文大语言模型服务的注意力感知2位KV缓存量化系统

Together AI开源OSCAR,一种用于长上下文大语言模型服务的注意力感知2位KV缓存量化方法。该方法在离线状态下,从注意力感知的协方差结构中为键和值推导出独立的旋转。在2.28 bits per KV element的量化精度下,OSCAR将通义千问(Qwen3-4B-Thinking-2507)和通义千问(Qwen3-8B)的BF16精度差距分别缩小至3.78点和1.42点,同时实现约8倍的KV内存缩减,并在100K上下文长度下带来高达3倍的解码速度提升。

开源/仓库推理部署/工程
04:36
MarkTechPost(RSS)
66
使用 NVIDIA FLARE 在非独立同分布 CIFAR-10 上构建与比较 FedAvg 和 FedProx 联邦学习的分步指南

本教程展示如何使用 NVIDIA FLARE 框架构建一个联邦学习实验,以比较 FedAvg 和 FedProx 两种算法。实验在非独立同分布(non-IID)的 CIFAR-10 数据集上进行,通过狄利克雷分布划分客户端数据,以模拟现实联邦场景中的标签不平衡问题。内容涵盖如何利用 NVFlare Job API 来定义和启动联邦学习任务。

开源生态教程/实践数据/训练
02:58
Anthropic:Newsroom(网页)
精选77
Anthropic联合创始人Chris Olah在教皇通谕发布会上的讲话

Anthropic联合创始人Chris Olah在梵蒂冈出席教皇Leo XIV关于AI的通谕发布会。他指出,所有前沿AI实验室都面临商业、研究及地缘政治等多重压力,这可能与做正确的事相冲突,因此外部监督至关重要。他强调,AI模型并非像飞机那样被工程化构建,而是基于人类语言和思想“生长”出来的,其内在性质可能复杂难解。他提出三个需审慎思考的问题:如何确保AI发展的全球收益公平分享、如何思考AI时代的人类繁荣,以及AI模型内在性质的本质。他呼吁社会各界,尤其是宗教与民间团体,严肃审视AI发展并引导其向善。

Anthropic大佬观点安全/对齐
关联讨论 2 条X:Rohan Paul (@rohanpaul_ai)X:Anthropic (@AnthropicAI)
推荐理由:Olah 在教皇通谕发布会上罕见坦承 AI 实验室的激励扭曲,呼吁外界批评,还透露模型内部已出现类似情感的状态,对关注 AI 伦理的人值得细读。
00:28
Hacker News 热门(buzzing.cc 中文翻译)
66
教皇利奥:由少数企业掌控的不透明人工智能可能导致"新型非人化"
安全/对齐现象/趋势
00:18
Hugging Face:Blog(RSS)
精选58
Harness、Scaffold 与 AI 智能体术语辨析

本文旨在厘清 AI 智能体领域中易混淆的关键术语。文章指出,模型(如 Claude、GPT)本身是无记忆、无循环的大语言模型。其行为由“Scaffolding”(行为定义层,如系统提示、工具描述)塑造,而“Harness”(执行层)负责调用模型、处理工具调用与控制循环,是智能体运行的核心。两者结合,模型才能成为智能体。文章以 Claude Code、Codex 为例,说明同一模型搭配不同 Harness 会产生迥异体验,并提出了 Agent = Model + Harness 的常见理解框架。术语尚未统一,本文旨在提供一个实用的心智模型。

智能体MCP/工具教程/实践

推荐理由:Agent圈术语混乱的文章很多,但HF这篇把harness、scaffold、context engineering的关系讲得最透,做agent开发的读完至少能少吵一半的架。
5月25日
23:36
TechCrunch:AI(RSS)
45
教皇的AI通谕并非真正关于AI

教皇Leo XIV的首道通谕,将AI作为诊断工具,以剖析权力集中、民主侵蚀以及科技精英阶层根据自身利益塑造世界等更深层的问题。

政策/监管现象/趋势
22:58
Hacker News 热门(buzzing.cc 中文翻译)
68
教皇利奥十四世表示,人工智能必须服务于全人类,而非少数权贵

教皇利奥十四世在首份通谕中强调,人工智能的发展和应用必须以服务全人类为目标,而非服务于少数权贵。他呼吁为AI建立一种新的伦理框架,使其基于人类团结的原则,而非仅由利润或权力逻辑驱动。

安全/对齐现象/趋势
‹ 上一页
1…1415161718…34
下一页 ›