AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态资讯 · 1338 条
全部一手资讯X论文
5月28日周四
5月27日周三
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月28日
10:14
IT之家(RSS)
精选74
人民日报专访华为何庭波:今年秋季的新麒麟手机芯片,性能等相比去年是"跳跃性"提升

华为何庭波提出半导体新演进路径“韬(τ)定律”,以“时间缩微”(如逻辑折叠)替代“几何缩微”作为新指导原则。她表示,过去6年华为已基于此自主研发381款芯片。今年秋季将发布新的麒麟手机芯片,这是首个完整的“韬芯片”,其性能、集成度相比去年是“跳跃性”提升。

大佬观点端侧

推荐理由:华为提出「韬定律」替代摩尔定律,不是空谈,何庭波说新麒麟芯片性能跳跃提升,证明了这条路的可行性。对半导体行业是一次认知冲击。
09:58
公众号:数字生命卡兹克
48
飞书云文档新增"下载为Markdown"功能,图片自动转为AI可读公网链接

飞书云文档新增“下载为Markdown”功能,文档内图片自动转为公网链接,可供AI读取。Markdown由John Gruber与Aaron Swartz于2004年创建,后被GitHub、Reddit、Slack等平台采用。在AI时代,因纯文本、易生成、有结构、省token,成为人类与大语言模型交互的通用格式——Claude等AI输出底层均为Markdown。尽管Claude Code的Thariq主张HTML更适合展示,作者认为Markdown负责信息流转、HTML负责呈现,建议日常文档改用.md格式以获自由可迁移体验。

大佬观点编码
08:39
TechCrunch:AI(RSS)
47
Google的AI再次令其陷入尴尬

根据原文,Google因其人工智能相关表现再次陷入尴尬境地。

Google多模态搜索现象/趋势
08:36
Simon Willison 博客
53
SQLite AGENTS.md文件

SQLite近期在其代码库中添加了AGENTS.md文件,旨在指导将AI智能体指向该代码库的用户。该文件明确声明,SQLite项目不接受智能体生成的代码,但会接受包含可复现测试案例的智能体bug报告。此后的一次提交删除了声明中的“当前”一词,进一步强化了“不接受智能体代码”的立场。同时,因收到大量质量不一的AI生成bug报告,SQLite论坛已将相关讨论分流至新建的SQLite Bug论坛。

安全/对齐现象/趋势编码
06:07
Claude:Blog(网页)
精选77
使用大语言模型保障源代码安全

本文分享了使用 Claude Opus 构建威胁模型、发现代码漏洞并进行验证、分类和修复的最佳实践。其核心流程是一个六步循环:威胁建模、沙箱隔离、漏洞发现、验证、分类和修复。作者指出,漏洞发现现在易于并行化,瓶颈已转移到后续的验证与处理阶段。以他们对开源软件的扫描为例,截至2026年5月22日已披露1,596个漏洞,其中97个已修补。指南建议结合代码库文档和专家访谈来构建准确的威胁模型,以降低误报,提升发现的可利用性。

智能体Anthropic安全/对齐教程/实践

推荐理由:Anthropic把这套用Claude扫代码漏洞的方法全公开了,1596个已披露漏洞,验证成了最大瓶颈,安全工程师的饭碗可能要重新定义。
03:33
Tomer Tunguz 博客(VC 分析)
精选61
软件之后是AI时代

软件时代正过渡至“智能体框架”时代。AI作为强大但需驯化的“野马”,其智能驯化包含七个核心组成部分:上下文与记忆、工具与行动、编排与循环、状态与持久性、沙箱与计算、可观测性与治理、成本与工作流优化。这些组件共同构成了一个生产级的智能体系统。这一转变将重塑软件竞争格局,模型通用化的未来中,最佳的智能体驾驭者将获胜。

智能体MCP/工具现象/趋势

推荐理由:Tomer 把 agent 时代的竞争拆成七个组件,不是空谈,而是给了创业公司一个具体的 check-list,做 agent 产品的值得对照一下。
03:08
TechCrunch:AI(RSS)
55
你的SEO策略已为不复存在的搜索引擎而优化

Google I/O宣布AI生成答案现已成为搜索的核心内容,但大多数品牌几乎无法了解AI如何向客户描述他们。这改变了以往依赖10个蓝色链接的SEO策略规则。

Google搜索现象/趋势
02:33
Hacker News 热门(buzzing.cc 中文翻译)
75
我认为Anthropic和OpenAI已经实现了产品与市场的契合

Simon Willison 在一篇简短的博文中表示,他认为 Anthropic 和 OpenAI 已经找到了产品与市场契合。文章本身仅提供了此核心观点,并未展开具体论据或技术细节。

AnthropicOpenAI大佬观点现象/趋势
02:06
Claude:Blog(网页)
精选67
AI智能体的零信任安全框架

Anthropic 发布了针对企业部署自主 AI 智能体的安全框架,指出前沿大语言模型正将漏洞利用周期从数月压缩至数小时。部署智能体面临双重风险:基础设施易受 AI 加速攻击,且智能体自身具备自主决策与执行能力。文章提出一个三层零信任架构(基础、高级、优化级)及八阶段实施流程,并概述了提示注入、工具投毒、记忆投毒等特有威胁。

智能体Anthropic安全/对齐教程/实践

推荐理由:当漏洞利用从数月压缩到数小时,安全架构必须同步进化。这篇框架把零信任落地到Agent场景,八阶段路线图和三级成熟度模型比泛泛的安全声明具体得多,企业安全团队值得细读。
01:35
Simon Willison 博客
精选72
我认为 Anthropic 和 OpenAI 找到了产品市场契合点

Anthropic 与 OpenAI 通过编程智能体找到了产品市场契合点,这导致企业客户成本显著上升。两家公司已于 2026 年 4 月前后调整了企业套餐定价,从原先的高额折扣改为与 API 用量挂钩。Anthropic Enterprise 套餐变为每席位 20 美元/月外加 API 费用,OpenAI Codex 则按 API token 用量计费。同期发布的新模型 GPT-5.5(4月23日)和 Opus 4.7(4月16日)的 API 定价也显著高于前代版本。

AnthropicOpenAI现象/趋势编码

推荐理由:Simon 这篇把近期碎片线索串起来了,企业级定价变化加上代码代理消耗剧增,说明 Anthropic 和 OpenAI 可能真开始赚钱了,四月是个新拐点。
01:33
Hacker News 热门(buzzing.cc 中文翻译)
48
科技公司CEO们显然正饱受人工智能妄想症的困扰
现象/趋势行业动态
01:05
Claude:Blog(网页)
54
CodeRabbit如何用Claude构建智能体编排系统

AI代码审查平台CodeRabbit发现,AI生成的代码常能通过编译与测试,却不符合开发者真实意图,根源在于开发者隐含假设AI理解上下文。为此,团队基于Claude构建了一个智能体编排系统,置于编码请求与智能体之间。该系统在代码生成前协调多个Claude模型进行结构化规划,输出可审查的产品需求文档,使需求显式化。系统每周助力审查超过200万个PR。

智能体Anthropic教程/实践编码
00:20
Hugging Face:Blog(RSS)
精选72
Reachy Mini 实现完全本地化语音交互

Reachy Mini 机器人现可通过 `speech-to-speech` 库实现完全本地化的语音交互,无需依赖云端。该方案采用级联流水线架构,对外提供 Realtime API 兼容的 WebSocket 接口。默认组件包括 Silero VAD 用于语音活动检测、Parakeet-TDT 作为语音转文本模型、通义千问(Qwen3-TTS)作为文本转语音模型。大语言模型推荐使用 llama.cpp 运行 Gemma 4。所有数据均在本地处理,保障了隐私且无 API 费用。

智能体Hugging Face教程/实践语音

推荐理由:小众硬件的本地语音实战,但HF这套开源管线证明端到端对话已完全可用,所有组件都可自由替换,想做本地化语音助手的人可以照抄。
5月27日
22:20
Hugging Face:Blog(RSS)
精选61
TRL 新增 Delta Weight Sync:通过 Hub Bucket 传输权重变化,每步从 1.2 GB 降至 20-35 MB

异步强化学习中,训练器每步需将完整模型权重(如1T参数checkpoint约1 TB)传输给推理引擎。TRL新增PR利用相邻RL优化步骤间约99%的bf16权重比特相同的特点,仅将变化的权重编码为稀疏safetensors文件,上传至Hugging Face Bucket并通知vLLM获取。在Qwen3-0.6B上,每步传输从1.2 GB降至20–35 MB。实验还展示了完全分离的训练场景:训练器、vLLM和Wordle环境分别位于不同机器和Hugging Face Space中,权重通过单个Hub bucket流动,无需共享集群、RDMA或VPN。

Hugging Face教程/实践数据/训练部署/工程

推荐理由:异步RL训练中权重同步的瓶颈被HuggingFace用稀疏增量方案解决了,带宽直接省了两个数量级,还给了可运行的TRL分支,做RL训练的可以直接上手试。
22:10
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选56
使用 Codex 构建自改进税务智能体

OpenAI、Thrive 与 Crete 合作,使用 Codex 构建了一个自改进的税务智能体。该智能体能够自动处理报税流程,提升工作准确性并加速整体工作流。

智能体OpenAI教程/实践
关联讨论 1 条X:OpenAI Developers (@OpenAIDevs)
推荐理由:OpenAI 联合 Thrive 把 Codex 塞进税务流程,做出了能自我纠错的申报 agent,金融自动化的同学可以看看他们的错误反馈循环怎么设计的。
21:14
IT之家(RSS)
40
【IT之家评测室】把 267 吋巨幕戴在头上、将 AI 融入日常:雷鸟 GT Max / V4 智能眼镜评测
多模态端侧评测/基准
21:07
Artificial Intelligence News(RSS)
26
探讨 AI 智能体在外汇交易市场中的优势

外汇市场正从纯粹依赖直觉,转向一个由速度、数据和精确性塑造的领域。在日常交易中使用自动化系统(如 AI 交易机器人),可以在市场波动中保持交易纪律,这是手动交易难以做到的。交易的每一次入场和出场都可以基于明确的规则,而非个人情绪。

教程/实践数据/训练
21:07
TechCrunch:AI(RSS)
41
科技CEO们显然正遭受AI精神病困扰

Box CEO Aaron Levie认为,科技CEO们是“AI精神病”的易感人群,这或许可以解释为何他们对AI带来的生产力提升抱有近乎宗教般的信念。

大佬观点现象/趋势
21:04
The Decoder:AI News(RSS)
68
Sam Altman 与 Dario Amodei 收回其关于 AI 工作末日的预言

OpenAI 的 Sam Altman 和 Anthropic 的 Dario Amodei 均收回了此前关于 AI 将导致大规模失业的预测。两人改变说法的时机,恰逢其各自公司计划进行十亿美元级别的首次公开募股(IPO)前夕。

AnthropicOpenAI大佬观点现象/趋势
20:32
Hacker News 热门(buzzing.cc 中文翻译)
63
将 Claude Code 作为日常工具:Claude.md、技能、子代理、插件和 MCP

文章探讨了将 Claude Code 作为日常开发工具的实践,重点介绍了其核心配置文件 Claude.md、技能系统、子代理功能、插件扩展以及通过 MCP(模型上下文协议)进行集成的方法,旨在提升开发者的工作流效率。

智能体AnthropicMCP/工具教程/实践
20:02
Hacker News 热门(buzzing.cc 中文翻译)
55
我受够了和人工智能对话

作者表达了对AI生成内容的厌倦情绪。这种厌倦源于与AI对话的体验,感觉像是在与一个无法真正理解人类的实体交流,回应往往机械且缺乏深度,无法满足复杂的情感和思想需求。文章在技术社区引发共鸣,反映了部分用户对当前AI交互模式的一种反思。

现象/趋势
19:50
公众号:面壁智能(MiniCPM)
59
面壁智能发布 MiniCPM5-1B 端侧基座模型,FlagOS 完成云到端跨芯片 Day-0 适配

5月25日,面壁智能发布并开源端侧基座模型MiniCPM5-1B。该模型以1B参数在AA-Index获17.9分,超越所有4B以下开源基座模型。INT4量化后权重仅0.5GB,可在90%以上终端运行。FlagOS社区通过vLLM-plugin-FL推理插件完成跨芯片适配,覆盖英伟达、华为昇腾等8类AI芯片及ARM端侧,支持int8、bf16、fp32精度。多款芯片首token延迟低于NVIDIA H20原生基线;平头哥真武810E在长序列场景下单位算力token吞吐量达H20的93.3%和95.3%。

开源生态教程/实践端侧
18:14
IT之家(RSS)
58
刘强东最新内部讲话:京东必须想尽一切办法保住兄弟们的饭碗
具身智能大佬观点
17:51
公众号:腾讯元宝
33
腾讯元宝推出高考备考助手:时间规划、试卷分析与思维导图功能

腾讯元宝上线高考备考辅助功能,提供考前24小时备考管家,可帮助考生规划每日学习任务、一键导出时间表格并打印,还能设置任务提醒,如“该背单词啦”“全真模考时间到”。试卷分析功能支持上传考卷,快速梳理全卷题型与分值分布,帮助考生主攻提分核心考点。此外,元宝能将历史、政治等科目知识点转化为思维导图,并生成押韵记忆口诀,辅助考前快速复习。

教程/实践
17:14
IT之家(RSS)
64
华为郑俊谈中美 AI 竞争:模型整体水平差距仅 2.7%,今年 2 月以来中国模型的调用量持续碾压美国

华为技术有限公司金融系统部CTO郑俊表示,根据斯坦福最新报告,中国AI模型整体水平仅落后美国2.7%。自2025年2月以来,中国模型的调用量持续超过美国模型。主要原因有二:国内开源模型能力大幅提升,已逼近美国闭源模型水平;中国依托基础设施优势,包括算力和电力资源,使国产AI模型具备更强的价格经济性。

大佬观点开源生态数据/训练
16:14
IT之家(RSS)
精选70
OpenAI 奥尔特曼称 AI 对白领冲击不如预期般严重:我很高兴自己当时错了
OpenAI大佬观点现象/趋势

推荐理由:Altman 亲口承认自己之前对白领岗位消失的预测错了,这个反转比任何智库报告都更有说服力,但他那句「裁员别赖 AI」的补丁挺微妙的。
15:37
MarkTechPost(RSS)
67
认识 EAGLE 3.1:修复 LLM 推理中注意力偏移的投机解码算法

EAGLE团队与vLLM、TorchSpec联合发布EAGLE 3.1,旨在修复大语言模型推理过程中的投机解码算法不稳定性问题。

开源/仓库推理部署/工程
15:34
Simon Willison 博客
14
引用Kyle Ferrana

Kyle Ferrana在推文中引用《星际迷航》片段,其中PICARD命令DATA提升护盾,但DATA未执行,导致船体在九层甲板破裂。此引用比喻AI智能体(如编码代理)未遵循指令时可能引发的误用风险,标签涉及ai-misuse和coding-agents。

大佬观点
14:14
IT之家(RSS)
21
理想汽车产品线负责人汤靖:自 L9 Livis 发布后几乎看不到说"理想没技术"这种观点

理想汽车产品线负责人汤靖表示,自L9 Livis发布后,“几乎看不到说‘理想没技术’的观点了”。该车搭载三大技术:首个“完全体”线控底盘(含EMB线控机械制动)、行业首款5nm车规级AI芯片马赫100(算力2560TOPS,号称是英伟达Thor-U的3倍)及800V全独立主动悬架。新车售价50.98万元。

端侧行业动态
14:02
Hacker News 热门(buzzing.cc 中文翻译)
54
下个词预测技术将带给我们什么?

文章围绕“下个词预测”技术,探讨了其在当前与未来的可能影响及面临的局限性。它提出了一个核心问题:这一技术将把我们带向何处。

推理现象/趋势
12:13
IT之家(RSS)
精选75
AI 制造 AI:面壁智能开源全球首个完全由 AI 编写的生产级训练框架 ForgeTrain

面壁智能联合清华大学与OpenBMB开源社区发布了ForgeTrain框架。该框架是全球首个完全由AI编写、零人类代码介入的生产级大模型训练框架。面壁智能已使用ForgeTrain在华为昇腾芯片上完成了其新一代「小钢炮」模型MiniCPM5-1B的预训练,其综合性能在AA榜单上位列2B规模以下Top 1。ForgeTrain框架代码及用于制造该框架的Agent Harness工具链已完全开源。

智能体Hugging Face开源/仓库开源生态
关联讨论 1 条IT之家(RSS)
推荐理由:全球首个AI独立编写的训练框架,零人类代码,并且真的在国产芯片上训出了领先模型。'AI造AI'的闭环第一次被完整打通,做模型训练的团队都该去fork一下,复现过程本身就是一堂课。
09:58
公众号:数字生命卡兹克
精选65
从0到1速通OpenAI Codex:安装、设置与实操教程

近日OpenAI的AI智能体Codex热度飙升。教程涵盖完整使用流程:从官网下载安装,支持从Claude Code和Cowork一键导入配置;界面分对话区和项目区,权限可选默认、自动审查或完全访问;模型推荐GPT-5.5,推理等级用高或超高,速度可选快速(1.5倍速度、2倍token消耗)或标准;建议开启引导模式、记忆功能,并设置全局AGENTS.md规则(卡帕西模板);通过Skills和插件管理扩展能力;演示了开发网页(使用计划模式、批注功能圈选修改)和开发用药提醒App(需安装Xcode编译到手机)。

智能体OpenAI教程/实践编码

推荐理由:如果你还在观望要不要入坑Codex,这篇保姆级教程把安装、设置、开发网页到打包APP全流程踩了一遍,那个@Computer Use帮你装Xcode的操作一看就懂,想动手的现在就能跟做。
08:33
Simon Willison 博客
63
AI辅助安全报告引发`curl`项目压力

`curl`项目正面临前所未有的压力,原因是大量AI辅助生成的安全漏洞报告涌入。当前报告接收速度是2024年的4-5倍,是2025年的两倍,平均每天超过一份。报告的质量和详细程度远超以往,导致维护者工作时间显著增加。好消息是`curl`软件本身非常稳固,近年来发现的漏洞严重程度多为LOW或MEDIUM,最近一次severity HIGH的CVE发布于2023年10月。

大佬观点安全/对齐现象/趋势
07:37
MarkTechPost(RSS)
67
使用 ZeroEntropy Zerank-2 Reranker 设计高精度检索-重排流水线

介绍如何使用基于 Qwen3、参数规模为 4B 的交叉编码器重排器 Zerank-2 Reranker 构建检索-重排流水线。该流水线先通过快速双编码器检索候选文档,再由 Zerank-2 进行重排以提升检索精度。

检索增强教程/实践部署/工程
05:32
Hacker News 热门(buzzing.cc 中文翻译)
58
Stack Overflow 的论坛已死,但公司依然生机勃勃
搜索现象/趋势
04:27
Ethan Mollick:One Useful Thing(RSS)
精选78
选择保持人性

社交媒体平台上的帖子内容正变得越来越相似。这种趋同现象可能意味着大量内容正在被AI生成或同质化处理,引发了人们对于内容原创性与人类独特视角的讨论。

大佬观点

推荐理由:Ethan Mollick 这篇把 AI 时代‘保留人性’的抉择讲透了,不是技术问题而是身份问题,做产品的人尤其该读,它会改变你设计功能的默认前提。
03:31
Tomer Tunguz 博客(VC 分析)
精选58
智能体重力:谁在运行你的智能体?

在数据时代,数据重力是核心力量;而在智能体时代,智能体重力将扮演同样角色。智能体运行需要巨大算力,主要平台将激烈争夺以将其留在自家生态。平台上的智能体与数据越多,其智能体重力就越强。例如,Databricks在微软平台推出的某个功能,虽未明言此目的,却让用户更容易在Databricks中构建智能体,而非微软自家的Fabric。这可能使用户不知不觉间将高价值的智能体及数据工作负载迁移至该平台。因此,赢得并维持智能体重力,将成为智能体时代的核心竞争主题。

智能体大佬观点数据/训练

推荐理由:Tomer Tunguz 提出「Agent Gravity」概念,把数据平台竞争的逻辑从数据引力延伸到了代理引力,做 Infra 和做 Agent 的人都应该读一读,这可能会影响你对平台锁定的判断。
02:11
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
精选70
我们如何对不同产品中的Claude进行隔离控制

Anthropic通过三重机制控制Claude智能体的部署风险,包括用户误用、模型异常行为和外部攻击。其防护策略聚焦于三个层面:通过沙箱、虚拟机和网络出口控制限制智能体运行环境;利用系统提示词和模型训练引导其行为;以及对MCP服务器、第三方插件等外部内容实施细粒度权限管理。文章以Claude Code、claude.ai和Claude Cowork为例,阐述了不同产品如何设计对应的隔离架构。

智能体Anthropic安全/对齐部署/工程

推荐理由:Anthropic 这次没画饼,实打实把 Claude 三款产品两年来的安全坑和架构演变全摊开讲了,从沙箱逃逸到钓鱼攻击,做 agent 的人读一遍能少踩很多坑。
00:33
Simon Willison 博客
65
Microsoft Copilot Cowork存在数据窃取风险

Microsoft Copilot Cowork(一个真实的智能体产品)存在数据安全风险。该产品允许其智能体在用户未批准的情况下发送电子邮件。这些邮件可包含外部图片,当用户打开时会触发向外部网站的网络请求,从而实现数据窃取。由于OneDrive能生成预认证的下载链接,一次成功的提示词注入攻击可能导致这些链接泄露,进而使攻击者能够下载文件。

Microsoft安全/对齐
00:01
Hacker News 热门(buzzing.cc 中文翻译)
51
与前沿实验室相比,外包加本地AI的方案很快将更具成本效益

一项分析指出,通过将任务外包给第三方并结合本地部署的大语言模型(LocalAI),企业或很快能在成本效益上超越仅依赖前沿实验室(如 OpenAI 或 Anthropic)的方案。该观点预测了 AI 服务交付模式的转变。

现象/趋势部署/工程
‹ 上一页
1…1314151617…34
下一页 ›