AIHOT

全部动态资讯 · 1324 条

全部一手资讯 X 论文

6月9日周二

6月8日周一

6月9日

07:33

Hacker News 热门（buzzing.cc 中文翻译）

46

Ask HN：自AI问世以来你为自己开发了哪些工具？

Hacker News 用户发起讨论，询问大家自 AI 兴起以来为自己开发了哪些个人工具。该提问来自 HN（news.ycombinator.com），获得 100 个点赞，标签为 #Ask HN。

智能体其他编码

07:21

IT之家（RSS）

55

苹果WWDC26改变AI演示方式：实机展示而非宣传片

苹果在2026年WWDC主题演讲中未推出全新产品，主要介绍Apple Intelligence优化及全面革新的Siri。不同于2024年宣传片式演示，本次多数AI功能通过工作人员操作真机实时展示，证明功能已实际可用。苹果曾因2024年虚假宣传被起诉，上月达成和解赔付2.5亿美元。新版Siri随iOS 27推送，适配iPhone 15 Pro系列、iPhone 16及以上、M1及以上iPad和Mac等设备，无需换最新款手机。

现象/趋势语音

05:19

The Verge：订阅版科技（RSS）

58

苹果设备即将迎来多项新功能

Siri和人工智能是本次展示的核心亮点，但它们并非苹果设备即将推出的唯一新功能。还有许多其他更新与改进值得用户关注。

教程/实践端侧

04:46

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选56

OpenAI 公布让 AGI 造福所有人的计划

OpenAI 发布计划，阐述让 AGI 造福所有人的愿景。该计划聚焦于 AI 的可及性、安全性和共享繁荣，确保技术进步惠及每个人。

OpenAI大佬观点安全/对齐

关联讨论 1 条

推荐理由：这份计划是 OpenAI 对“AGI 公益”的例行布道，提供了解其高层思维的窗口，但建议别指望找到产品路线图。

04:15

Bloomberg：Technology（RSS）

58

Siri联合创始人对苹果更新评价为"很棒的第一步"

Siri联合创始人Dag Kittlaus在Bloomberg The Close节目中对苹果的AI雄心作出反应，认为新发布的Apple Intelligence系统是在公司全球开发者大会（WWDC）主题演讲中推出的关键一步。

大佬观点

03:38

Gary Marcus：The Road to AI We Can Trust（RSS）

34

Gary Marcus：整个AI行业被疯狂的数学所支撑

Gary Marcus 在博文中引用“幻想之地”的比喻，指出整个 AI 行业建立在不合理的数学基础之上。

大佬观点现象/趋势

03:32

Hacker News 热门（buzzing.cc 中文翻译）

52

针对《大语言模型正在侵蚀我的职业生涯》的评论回复

作者发帖抱怨大语言模型对自身职业生涯的冲击后，在Hacker News上收到了大量评论。本文是对这些评论的集中回复与讨论，原帖获得103个点赞。

其他现象/趋势

03:19

The Verge：订阅版科技（RSS）

67

WWDC 2026 附加直播博客：与 Craig Federighi 的技术座谈

一场关于 Apple Intelligence 的公开技术座谈，对话者为苹果高管 Craig Federighi。

大佬观点端侧

03:11

MarkTechPost（RSS）

50

ClawHub Security Signals：AI技能数据集的端到端安全信号分析与判定分类编程指南

该教程使用ClawHub Security Signals数据集分析扫描器如何评估AI技能。从Hugging Face Parquet格式加载数据，检查判定结果、扫描输出和严重性标签，通过Jaccard分数和Cohen's kappa衡量VirusTotal、静态分析和SkillSpector之间的重叠与分歧，最后将SKILL.md文本与扫描信号结合，训练逻辑回归模型预测ClawScan判定。

安全/对齐教程/实践

03:02

Hacker News 热门（buzzing.cc 中文翻译）

56

人工智能发展放缓

一篇题为“AI Is Slowing Down”的文章在 Hacker News 获得 102 个点赞，发布于 06-08，原文链接为 www.wheresyoured.at。

数据/训练现象/趋势

03:02

Hacker News 热门（buzzing.cc 中文翻译）

64

xAI看起来更像是一家数据中心房地产投资信托基金，而非前沿实验室

xAI在资产结构和运营模式上被比作数据中心REIT，而非传统的前沿AI实验室，这一观点来自martinalderson.com的分析文章。

xAI现象/趋势行业动态

02:21

IT之家（RSS）

40

苹果抨击"为 AI 而 AI"，称有用 AI 需以用户为中心

在 2026 年全球开发者大会上，苹果软件工程高级副总裁 Craig Federighi 抨击企业急于将 AI 塞进生活各个方面而不顾及最终服务对象的现象，强调真正有用的 AI 必须以用户和用户的需求为中心。他透露新一代 Apple Intelligence 技术将使苹果产品更加个性化和实用。

大佬观点现象/趋势

02:15

Dwarkesh Patel：Podcast & Blog（RSS）

精选69

样本效率黑洞：AI能力背后隐藏的数据需求深渊

将AI比作一个闪耀着能力的星系，其核心存在一个肉眼不可见的巨大黑洞——数据。这个比喻揭示了AI模型惊人能力背后对海量数据的依赖，样本效率的瓶颈如同引力中心，将各色能力凝聚在一起。

大佬观点数据/训练

推荐理由：「我们见到的 AI 如星河璀璨，但中心却是个看不见的、有着不可思议质量的样本效率黑洞」——这个比喻把 scaling law 背后被忽视的真相撕开给你看，做模型训练的人该读一读。

02:14

Bloomberg：Technology（RSS）

66

苹果大型AI与Siri发布后的期待

Creative Strategies总裁兼首席分析师Carolina Milanesi与彭博社的Ed Ludlow在加州库比蒂诺讨论苹果推出改版后的Siri数字助手后的后续发展，以及将AI嵌入消费者设备的重要性。

大佬观点端侧语音

02:14

Bloomberg：Technology（RSS）

45

开发者期待苹果AI带来重大飞跃

软件开发者和Hacking with Swift平台创建者Paul Hudson在Bloomberg Tech节目中表示，他期待苹果AI能推出“great APIs”。

编码行业动态

00:41

Tomer Tunguz 博客（VC 分析）

精选56

AI 替代浪潮：三大力量重塑成本结构

三大力量重塑 AI 成本：前沿闭源模型持续涨价，开源模型在多数场景已足够好，买家开始替代。Coinbase 将提示词路由至更便宜模型，成本持平但 token 用量指数增长。Lindy 全切至 DeepSeek v4，节省数百万美元且多项核心性能提升。Harvey 在 Legal Agent Benchmark 上通过 SFT 使 Kimi 2.6 all-pass 率达 15%，超越 Opus 的 14%，同一 100 任务成本 $84 vs $954（约 11 倍价差）。Cursor 后训练 Kimi K2.5 得到 Composer 2.5，称其“性能优异且效率高达同类模型 10 倍”。闭源越来越贵，开源平价且性能接近，选择决定企业单位经济学的斜率。

AnthropicDeepSeek开源生态推理

推荐理由：Tunguz 用 Coinbase、Lindy 等真实案例，把「用开源/便宜模型替代昂贵前沿模型」的趋势讲透了，做 AI 应用的人该重新算一下单位经济账。

6月8日

23:38

TechCrunch：AI（RSS）

49

WWDC 2026 前瞻：Siri 备受期待的改造、Apple Intelligence 与 iOS 27

苹果 WWDC 2026 临近，Siri 备受期待的改造、Apple Intelligence 和 iOS 27 是本次大会的主要看点。

行业动态语音

22:17

The Verge：订阅版科技（RSS）

75

微软 AI 负责人 Mustafa Suleyman 称超级智能即将到来，但不会取代你的工作

微软 AI 负责人 Mustafa Suleyman 表示超级智能即将到来，但不会夺走人类的工作岗位。他同时讨论了自动化、OpenAI 相关话题，并认为将 AI 称为“活着的”是危险的。

Microsoft大佬观点现象/趋势

关联讨论 1 条

22:09

The Decoder：AI News（RSS）

62

Frontier Radar #3：智能体AI如何将token转化为业务指标

生成式AI商业模式正从月订阅制转向按token消耗计费。智能体工作流消耗数倍于传统对话的token，可自主运行数小时，使固定费率不可持续。token价格因响应速度、专业化程度及结果经济价值而异。本期报告梳理订阅制向消费制迁移、看似低廉的token单价背后的实际成本，以及为何仅凭token消耗量衡量AI价值创造是片面的。

智能体现象/趋势

22:08

The Verge：AI（RSS）

精选79

微软AI CEO：超级智能即将到来，但不会取代你的工作

微软AI CEO Mustafa Suleyman在Decoder访谈中表示，超级智能即将到来，但不会导致大规模失业。他透露微软与OpenAI于去年10月签署新合同，巩固合作关系的同时，微软获准独立追求超级智能。微软已组建超级智能团队、训练前沿模型，并于本周Build大会上发布7个全模态新模型。他批评Anthropic将Claude描述为有意识的做法，认为消费者产品需要足够好才能克服公众对AI的负面情绪。

Microsoft大佬观点

关联讨论 1 条

推荐理由：Mustafa 首次系统阐述微软的「自给自足」路线，一边甩开 OpenAI 一边定义「人文主义超级智能」，开发者和产品人都该听听这段博弈论。

21:50

Hugging Face：Blog（RSS）

精选57

五个模型经济体中消失的崩溃：控制与涌现

用五个不同实验室的AI模型（OpenAI、NVIDIA、OpenBMB及一个自微调的5亿参数模型）各自驱动一个智能体构建经济市场，试图复现此前单一模型下出现的银行挤兑式价格崩溃。结果同一场景下模型不仅不抛售反而囤积，导致价格不跌反涨。通过纯谣言、库存泛滥、加大做空三种方式均无法重现崩溃。最终在结算环节直接覆盖价格，使崩溃成为设计事实。实验表明，AI智能体的涌现行为是偶然的而非稳健的，有效系统需在涌现纹理与确定性控制之间找到精确接缝。

智能体大佬观点

推荐理由：做 agent 的人必读，自己动手构建一个多模型经济体后才发现，涌现行为脆弱，控制要卡在结算层而非输入层，廉价模拟器会给你虚假信心。这篇复盘比成功案例更值钱。

21:20

IT之家（RSS）

66

郭明錤：WWDC26 不会改变苹果股票下半年向好趋势，但将检验其 AI 叙事

天风国际分析师郭明錤指出，苹果当前核心叙事是“即使AI进度暂时落后，最终仍能后来居上”。供应链调查显示苹果业绩将好到今年年底，强化了“没有AI都这么好，有了AI还得了”的看法。WWDC26不会改变股票下半年正向趋势，但真正值得观察的是：在同样使用Gemini的情况下，苹果能否做出比谷歌更好的AI应用、Agentic workflow和端侧/云端混合体验。若肯定，可延长核心叙事；若否定，则意味着Gemini决定了苹果AI体验上限，更多人将重新审视后来居上的叙事。

大佬观点端侧

20:12

Bloomberg：Technology（RSS）

48

Nvidia CEO称科技股抛售是买入机会

在Bloomberg《The Pulse》节目中，Nvidia CEO表示当前科技股抛售提供了买入机会。节目嘉宾包括高盛资产管理多行业投资主管Lindsay Rosner、Multiverse创始人兼CEO Euan Blair，以及英国AI与在线安全部长Kanishka Narayan。

大佬观点行业动态

20:00

OpenRouter：Announcements（RSS）

精选63

OpenRouter Agent SDK 推出 HITL 工具：满足 EU AI Act、Colorado ADMT 与 NIST AI RMF 合规要求

OpenRouter 的 Agent SDK 新增人类参与循环（HITL）工具，用于 AI 智能体的合规监督。该工具可帮助 AI 智能体满足欧盟 AI 法案、科罗拉多州自动化决策技术法（SB26-189）以及 NIST AI 风险框架（NIST AI RMF）的监管要求。

智能体安全/对齐教程/实践

关联讨论 1 条

推荐理由：欧盟AI法案的人类监督要求终于有现成方案了，OpenRouter这个教程把合规从法条翻译成具体代码，做Agent出海的产品经理可以拿来就用。

19:50

Hugging Face：Blog（RSS）

精选74

Pakistan Notice Helper：一款面向本地安全问题的轻量 AI 工具

Pakistan Notice Helper 是一款安全工具，帮助巴基斯坦用户在点击链接、拨打电话、分享 OTP 或支付前识别可疑消息。它接受文本或截图输入，返回风险等级、简短解释、可见警示标志和安全下一步建议。工具支持英文和乌尔都语，乌尔都模式采用从右向左布局并全界面翻译。最终部署选用 Qwen3.5 4B Q8 模型（通过 llama.cpp + CUDA），在 10 个测试用例中通过了所有高风险诈骗和截图场景。此前曾测试 Qwen3.6 27B（质量高但成本高）和 MiniCPM-V 4.6 Q8（速度慢且不稳定），最终选择了精度、速度和成本平衡的 4B 模型。项目受限于 hackathon 的 32B 模型上限规则。

Hugging Face多模态教程/实践

推荐理由：一个只有4B的小模型，把巴基斯坦本地诈骗文案分析得明明白白，比那些参数大但看不懂乌尔都语的通用模型实用得多。做给特定地区特定问题的小工具，这才是AI落地的真节奏。

19:12

Ars Technica：AI（RSS）

45

天气与气候科学中的AI革命并非一场革命

机器学习在天气与气候科学中的应用仍有局限，所谓“革命”并未真正到来。业界正在审视其实际使用方式，而非夸大其颠覆性。

现象/趋势论文/研究

19:11

Bloomberg：Technology（RSS）

51

苹果重塑的AI是低迷PC和手机市场的长期布局

苹果对Siri进行重塑，将其作为AI长期布局的一部分，但在PC和手机市场持续下行的背景下，短期内难以刺激iPhone和Mac的销量增长。

现象/趋势端侧

18:59

Hacker News 热门（buzzing.cc 中文翻译）

61

招聘中的算法单一化

一篇来自 algorithmichiring.github.io 的文章指出招聘行业正面临算法单一化风险——多数企业采用少数几种相同的算法模型评估候选人，可能导致系统性偏差和同质化。该文在 Hacker News 获得 102 个点赞。

GitHub现象/趋势

18:41

Bloomberg：Technology（RSS）

64

美国科技工作者正为AI繁荣付出代价

信息行业在利润扩张中占据主导地位，却成为就业环境最糟糕的行业之一。AI热潮推高了企业盈利，但并未带来相应的工作岗位增长，科技工作者反而面临更严峻的就业困境。

现象/趋势行业动态

18:00

公众号：通义实验室（千问）

精选68

Agent 辅助开发，一站式打通 Qwen3-VL Android 端侧推理

通义实验室教程演示了如何用 Agent（Qoder）辅助完成 Qwen3-VL-2B 模型在 Android 端侧的全流程部署。操作包括：检查 JDK 21、NDK 27、CMake 3.18.1 等环境；创建 arm64-v8a 的 Native C++ 工程（minSdk 29、compileSdk 35）；通过 ModelScope CLI 下载约 1.4GB 的 MNN/Qwen3-VL-2B-Instruct-MNN 模型；编译开启 LLM 视觉支持（MNN_BUILD_LLM、LLM_SUPPORT_VISION）的 libMNN.so；构建 APK 并推送模型至手机私有目录。最终 App 提供图文推理页面，输出 MNN 版本（v3.5.0）、ABI 及推理指标。所有繁琐步骤均可由 Agent 自动执行。

多模态推理教程/实践端侧

推荐理由：用Agent辅助走通Qwen3-VL安卓端侧推理全流程，从环境搭建到JNI桥接一步到位。如果你在做移动端AI应用，这可能是目前最详细的实战指南，可以直接抄作业。

17:42

公众号：数字生命卡兹克

精选71

微信AI Agent生态曝光：嵌入小程序调用与手机厂商合作

腾讯正测试嵌入微信的AI Agent，用户右滑唤出对话窗口，通过自然语言指令调用数百万小程序完成点咖啡等任务。微信还与华为、荣耀、小米、OPPO、vivo合作推出A2A助手能力，可通过手机语音助理发起微信音视频通话或发送消息。6月8日，微信官方发布《关于开发者接入微信AI生态的指引》，提供自动接入模式，利用微信沙箱全自动改造小程序，使其可被AI直接调用。这一布局被视为Agentic Commerce（代理式交易）的雏形。

智能体MCP/工具现象/趋势

关联讨论 1 条

推荐理由：微信想用Agent把小程序生态变成操作系统，靠Agentic Commerce抽佣，一旦跑通，想象力比广告大得多。

17:20

IT之家（RSS）

9

小米 17T Pro 手机体验：以影像为抓手的全能旗舰

小米 17T Pro 是 T 系列首次面向国内市场发布的机型，定位“全能影像旗舰”。搭载天玑 9500，后置徕卡三摄：5000 万像素主摄、5000 万像素 5× 潜望长焦（支持 Ultra Zoom 超级变焦至 120 倍，AI 大模型算法辅助）及 1200 万像素超广角。配备 6.83 英寸 144Hz 1.5K 屏幕，峰值亮度 3500nit；7000mAh 金沙江电池。游戏实测《原神》60FPS、《崩坏：星穹铁道》58.1FPS，机身最高温度 42.3℃。支持 Leica Live 动态照片与实况运镜功能。

其他

16:11

Bloomberg：Technology（RSS）

精选70

CoreWeave 如何看待当前计算市场

CoreWeave 对当前计算市场进行了分析，指出推动增长的因素和限制增长的因素。该公司的市场看法即围绕这两个维度展开。

行业动态部署/工程

推荐理由：CoreWeave 作为 AI 算力的「卖铲人」，对计算市场的判断能摸到真实供需的脉搏，做基础设施的人该看一眼。

15:20

IT之家（RSS）

51

英伟达CEO黄仁勋：AI基建刚起步，科技股遭抛售是买入良机

英伟达CEO黄仁勋将上周开始的全球科技股抛售视为买入良机，称人工智能基础设施建设仍处于初期阶段。他强调AI终将成为全球基础设施，如同当年的互联网。英伟达已与SK海力士达成多年合作协议，联合研发新一代AI专用存储芯片。韩国总统李在明认为本国股市估值偏低，受此影响SK海力士等个股跌幅有所收窄。

大佬观点行业动态

15:20

IT之家（RSS）

52

猎豹移动董事长傅盛谈组织改造：所有人都要用 AI 写代码，包括行政

猎豹移动董事长兼CEO傅盛今日接受访谈，总结了用AI改造组织体系的四个步骤：一把手自己得懂；全员思想变革；所有人都要用AI写代码，包括行政；建立以年轻人为核心的“特区”。傅盛早在2019年就表示人工智能业务走在正确道路上，并相信未来10到20年AI会把人从繁重工作中解放出来，让人有时间阅读、提升、寻找自我。

现象/趋势编码

12:59

Hacker News 热门（buzzing.cc 中文翻译）

53

你能构建的最简单的人工神经网络：用 Python 实现的感知器

一篇关于用 Python 构建最简单人工神经网络——感知器（Perceptron）的文章在 Hacker News 上获得 108 个用户点赞。

教程/实践数据/训练

12:00

公众号：数字生命卡兹克

47

12款旗舰AI大模型参加高考语文数学测试，MiMo v2.5 Pro总分第一仅领先Kimi k2.6 0.01分

Claude Opus 4.8、GPT-5.5等12款旗舰模型参加今年高考语文数学（全国一卷部分试题）测试，采用API调用、禁用代码推理和网页搜索。总分第一MiMo v2.5 Pro（256.3分），第二名Kimi k2.6（256.29分）差0.01分，第三至第九名分差仅2分。语文最高分由GLM5.1和Gemini 3.1 Pro并列，数学最高分由DeepSeek V4 Pro、MiMo、ERNIE 5.1并列。DeepSeek作文得分偏低拉低总分。语文卷基于101分版本折算至150分制。

推理评测/基准

11:55

公众号：卡尔的AI沃茨

42

13个顶级AI模型参加2026年数学高考，GPT 5.5等并列第一

13个顶级AI模型参加2026年数学全国一卷测试，GPT 5.5 Thinking、Deepseek-v4 Pro、Gemini 3.1 Pro Thinking和Claude Opus 4.8 Max并列第一，Kimi 2.6 Thinking以微小分差位居第二梯队。测试采用LaTeX格式统一输入，禁用联网。多数模型在长解答题和多选题上容易失分，如第11题（多选题，正确答案ABD）所有模型均未完全答对。Claude Opus 4.8 Max因额度不足未完成所有题目，Claude Sonnet 4.6 Thinking尝试直接搜答案，Deepseek-v4 Pro曾拒绝完成。模型在上下文记忆、题目理解和符号识别方面仍有明显短板。

推理评测/基准

11:29

Hacker News 热门（buzzing.cc 中文翻译）

63

DeepSeek V4 Pro 在准确率方面超越 GPT-5.5 Pro

DeepSeek V4 Pro 在准确率（precision）指标上击败 GPT-5.5 Pro，具体分数和参数量未透露。该结果来自 runtimewire.com 的评测，在 Hacker News 获得 110 个点赞。

DeepSeekOpenAI模型发布评测/基准

11:20

IT之家（RSS）

60

Palantir CEO 卡普抨击"词元刷满"风潮：滥用 AI 如同沉迷色情

Palantir CEO 亚历克斯·卡普在人工智能平台十周年大会场外接受采访，将行业无节制消耗 token 的行为比作“精神沉溺式滥用”和“自慰成瘾”。CTO 沙亚姆·桑卡在财报电话会议上表示，词元用量越多产出越粗劣，企业需依靠 Palantir AI 平台（AIP）才能规避低价值陷阱。Uber COO 安德鲁·麦克唐纳坦言看不出攀升的 AI 成本与效率提升之间存在关联。卡普认为，AI 可完成“撰写 GDP 增长报告”等简单任务，但优化油气开采、重塑供应链等复杂业务需依靠严谨的流程，大语言模型无法取代。

大佬观点现象/趋势