AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态资讯 · 1325 条
全部一手资讯X论文
6月4日周四
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月4日
21:42
Hugging Face:Blog(RSS)
精选75
Nemotron 3.5 ASR:为你的语言、领域或口音进行微调

Nemotron 3.5 ASR 是一个 600M 参数的多语言流式语音识别模型,单个检查点覆盖 40 种语言-地区(含英、西、德、法、意、日、韩、中、阿拉伯等)。采用 Cache-Aware FastConformer 编码器与 RNNT 解码器,缓存内部状态避免重复计算,实现低延迟流式转录且不损失精度。模型原生输出带标点和大写的生产级文本,无需后处理。支持指定语言(target_lang=es-ES)或自动语言检测(target_lang=auto)。通过注意力上下文大小(att_context_size)可在推理时直接调节延迟-准确率权衡,范围从 80ms 到 1.12s,无需重新训练。模型以 NeMo 检查点形式发布,可用于微调以适配特定语言、领域或口音。

教程/实践语音

推荐理由:一个模型搞定40种语言的实时语音转文字,NVIDIA还给了完整微调代码和实测数据,做语音Agent和字幕的可以照着抄作业。
21:09
The Verge:订阅版科技(RSS)
54
《The Verge》呼吁在线平台提供AI内容过滤选项

在线平台本可通过提供AI内容过滤选项来检验AI标签是否有效,但它们拒绝这样做——因为一旦开放过滤,它们将不得不面对现实。

GoogleMeta现象/趋势
21:07
公众号:百度智能云(文心)
35
百度伐谋助力北京工业大学攻克三大科研难题

北京工业大学苗扬团队借助百度伐谋(全球首个可商用自我演化决策智能体),在三个高可靠性科研场景实现突破:空间站色谱柱构型优化中,72小时演化出新构型,归一化误差降低8.17%,体积缩小40%,分离效率提升3倍;PEM电解槽故障检测准确率从92.26%提升至95.04%,综合评分升至0.9383,建模周期从数天压缩到小时级;旋转机械故障诊断准确率从98.9055%提升至99.9877%,预测误差降至原来1%,参数量下降34%。科研人员用自然语言描述目标和约束,伐谋自动演化逼近全局最优解。

智能体教程/实践
21:00
公众号:昆仑万维(天工)
精选64
SkyClaw-v1.0 深度实测:Agent专属模型,顶尖性能表现,极致价格优势

5月26日,昆仑万维发布SkyClaw-v1.0,定位面向复杂工具使用和真实世界任务执行的高性能Agent模型,输入仅0.5元/百万token、输出4元/百万。实测显示,其从零生成番茄钟和记账本应用时,能自主用Web Audio API合成音效、用SVG手绘图表,细节处理成熟。在现有代码库修改任务中,越难的任务表现越好:单点bug修复精准,能准确诊断iOS Safari滚动问题并给出克制式修复方案。但官方未报告SWE-bench成绩,表明其优势集中在从零生成与模式匹配场景,而非大型仓库精确修改。极致低价使其在批量Agent任务与快速原型生成上性价比突出。

智能体编码评测/基准

推荐理由:这篇实测把SkyClaw的「从零生成」和「老项目修改」摊开了揉碎了测,不看广告看疗效,让我看清Agent模型的分化到底意味着什么——便宜好用但有边界,想省钱做小工具的你值得细读。
20:48
The Verge:AI(RSS)
58
社交媒体平台应允许用户过滤AI生成内容

YouTube、Instagram、TikTok等平台过去一年已陆续采用自动标签区分AI生成的图像、视频和音乐,但用户仍无法主动过滤这些内容。目前的标签机制并未改变内容的呈现方式,用户依然被迫接触大量AI垃圾内容。文章呼吁平台提供过滤选项,让用户自行屏蔽AI生成内容。

GoogleMeta图像生成现象/趋势
20:00
OpenRouter:Announcements(RSS)
54
OpenRouter 横评 11 款 LLM 机器人冲刺对决:Claude 与 Grok 谁更胜一筹?

OpenRouter 在 30 场机器人冲刺对决中测试了 11 款大语言模型,共耗 482 美元推理成本。结果指向一个发现:应该重新审视模型 benchmark 的解读方式。

智能体推理评测/基准
19:54
Bloomberg:Technology(RSS)
68
Netflix首席产品技术官Stone谈AI整合

Netflix首席产品与技术官Elizabeth Stone在旧金山Bloomberg Tech 2026上接受Bloomberg的Emily Chang专访,讨论了技术领导力以及如何在AI时代扩展平台规模。

大佬观点视频
19:11
IT之家(RSS)
29
华硕破晓 Ultra 评测:第三代酷睿 Ultra 处理器 + 双层 OLED 触控屏

华硕破晓 Ultra 于今年 3 月发布,搭载第三代酷睿 Ultra X7 358H 处理器和 Intel Arc B390 核显(12 个 Xe3 核心),配备 14 英寸 2.8K 120Hz 双层串联 OLED 触控屏,峰值亮度 1400nit。整机重 1.1kg、厚 10.9mm,内置 70Wh 电池并支持 90W PD 快充,32GB+1TB 版本售价 14999 元。游戏实测方面,1080P 低画质下《CS2》达 306 帧,《赛博朋克:2077》开启 XeSS 后达 100 帧,45W 功耗下噪音不超过 45 分贝。

端侧评测/基准
18:54
Bloomberg:Technology(RSS)
63
中国Robotaxi困局:AI政策在增长与就业间博弈

中国在全球Robotaxi领域处于领先地位,但这种竞争优势伴随着代价,反映出AI政策在促进经济增长与保障就业之间的紧张关系。

政策/监管现象/趋势
18:25
公众号:面壁智能(MiniCPM)
42
智能座舱卷到头了?这份白皮书给出了答案
多模态现象/趋势端侧
17:11
IT之家(RSS)
55
TrendForce:预估 2029 年 Arm 架构笔记本渗透率将达 34.2%

TrendForce集邦咨询报告称,当前AI笔记本仍缺大规模驱动换机产品。随着Nvidia在Computex发布RTX Spark平台及N1/N1X处理器,首次将CUDA生态延伸至Windows笔记本市场,AI笔记本渗透率预计从2025年19.3%升至2029年84.9%。其中Windows x86 AI笔记本2029年占整体约50.7%,Windows on Arm AI笔记本由2025年1.2%升至2029年11.5%。苹果M系列维持约17%市场占比。在Windows on Arm、苹果M系列及AI Chromebook推动下,2029年Arm架构笔记本渗透率预计达34.2%。

现象/趋势端侧
16:53
Bloomberg:Technology(RSS)
63
高盛CEO David Solomon谈AI时代的银行业:不预测白领大规模失业

高盛董事长兼CEO David Solomon在采访中讨论AI对银行业的影响。他指出银行正快速部署AI,从后台员工到初级分析师再到资深投行家都在使用该技术,但认为并不会导致白领大规模失业。Solomon还谈及员工数量前景、当前资本市场状况、高盛在SpaceX IPO和Alphabet历史性股权融资中的角色,以及AI如何改变音乐制作。

大佬观点行业动态
16:53
Bloomberg:Technology(RSS)
54
BNP策略师称AI泡沫"值得关注",并警告模型token可能短缺

法国巴黎银行资产管理公司高级跨资产策略师Sophie Huynh表示,AI交易领域存在泡沫风险。她更关注模型token配给问题,称有迹象显示当前token消耗量过大,可能导致供给不足。Huynh还讨论了中东冲突对市场的影响。

大佬观点现象/趋势
16:23
Bloomberg:Technology(RSS)
61
Odd Lots 播客:高盛 CEO Solomon 谈 AI 时代的银行业

高盛 CEO David Solomon 在 Odd Lots 播客中探讨了 AI 的未来:它能否带来投资者期待的回报,以及是否会导致大规模工人替代。大型银行快速部署 AI,从后台员工到初级分析师乃至高级投行家都在使用这项技术,成为观察这些问题的绝佳窗口。

大佬观点行业动态
16:23
Bloomberg:Technology(RSS)
65
高盛CEO David Solomon:AI不会引发华尔街就业末日

高盛CEO David Solomon不认为AI将引发华尔街的就业末日。

大佬观点现象/趋势
16:11
IT之家(RSS)
61
安全研究员测试AI漏洞挑战:GPT-5.5成功率最高,DeepSeek V4 Pro成本最低

安全研究员Kasra Rahjerdi在故意留有漏洞的APK中植入暴露的Firebase凭据,测试多款大语言模型的安全推理能力。每个模型预算10美元,限时2小时,总花费1500美元。GPT-5.5运行10次成功7次,每次成功成本9.46美元;DeepSeek V4 Pro成功3次,每次成功成本仅0.62美元,约为GPT-5.5的1/15。Claude Sonnet 4.6与Claude Opus 4.8各成功2次,Opus多次被安全护栏中断。Gemini 3.1 Pro Preview几乎每次开局就拒绝,Token消耗中位数仅约9000。测试还涉及GLM 5.1、Qwen 3.7 Max等模型。

AnthropicOpenAI安全/对齐评测/基准
15:53
Bloomberg:Technology(RSS)
54
AI集中风险是问题所在:3分钟MLIV

在《Bloomberg: The Opening Trade》节目中,Anna Edwards、Guy Johnson、Tom Mackenzie 和 Mark Cudmore 为分析师和投资者剖析了AI集中风险这一关键主题。

现象/趋势行业动态
15:11
Hacker News 热门(buzzing.cc 中文翻译)
66
Anthropic 发布文章:我们在各产品中对克劳德的管控措施

Anthropic 在其官方博客发布文章,介绍其在各产品中管控 Claude 的具体方式。该文章在 Hacker News 上获得 103 个点赞。

Anthropic安全/对齐
13:40
Hacker News 热门(buzzing.cc 中文翻译)
65
随着人工智能应用的普及,伯克利计算机科学课程中的不及格率激增,数学能力持续下滑

加州大学伯克利分校的计算机科学课程中,随着学生越来越多地使用AI工具,课程不及格率显著上升,同时学生的数学基础能力持续下滑。

推理现象/趋势
12:40
Hacker News 热门(buzzing.cc 中文翻译)
62
我开发了一个有漏洞的应用,并花费1500美元测试LLMs能否攻破它

一位开发者构建了一个故意包含安全漏洞的Web应用程序,并投入1500美元,用于评估当前主流大语言模型(LLMs)在真实场景中自主发现并利用这些漏洞的能力。测试涵盖了多种模型及其API调用成本,旨在量化LLM在渗透测试与漏洞利用任务上的实际表现与成本效益。结果尚未在正文中提供,但该实验为AI在网络安全攻防中的应用提供了第一手数据。

安全/对齐评测/基准
12:10
Hacker News 热门(buzzing.cc 中文翻译)
44
它们是用哑铃做的

一篇来自 maxleiter.com 的博文,标题为“它们是用哑铃做的”。正文内容极为简短,仅包含一张图片和一句声明“They're made out of weights”(中文翻译为“它们是用哑铃做的”),未提供任何上下文或技术细节。该博文在 Hacker News 上获得 113 个点赞。由于缺少具体说明,读者无法得知所指对象以及“哑铃”的真实含义。

其他数据/训练
10:01
公众号:阶跃星辰(Step)
45
阶跃 Step 3.7 Flash 拿下 Artificial Analysis 多个第一

阶跃星辰的 Step 3.7 Flash 在 Artificial Analysis 最新榜单中多项关键维度领先。其输出速度达 409 tokens/s,位列主流模型第一;端到端响应时长仅 7.1 秒;智能效率与速度价格比均进入最吸引人的象限。模型在搜索、代码、多模态理解和 Agent 工作流中保持稳定表现,兼顾速度、智能与成本,适合大规模商业化部署。

智能体推理评测/基准
07:26
OpenAI:官网动态(RSS · 排除企业/客户案例)
42
Wasmer 使用 Codex 构建边缘 Node.js 运行时

Wasmer 借助 Codex(基于 GPT-5.5)构建了一个用于边缘计算的 Node.js 运行时,将开发速度提升 10 到 20 倍,交付周期从数月缩短至数周。

OpenAI教程/实践编码
05:52
Bloomberg:Technology(RSS)
51
洛克菲勒国际的 Ruchir Sharma:AI 热潮与美国市场断层线

洛克菲勒国际主席兼 Breakout Capital 首席投资官 Ruchir Sharma 认为,尽管 AI 技术进步推动科技板块利润强劲,但整体盈利叙事可能不如投资者感知的那样稳健,市场正暴露出脆弱性。

现象/趋势行业动态
05:39
Hacker News 热门(buzzing.cc 中文翻译)
69
不,人工智能没有意识--陈景德

科幻作家陈景德(Ted Chiang)在《大西洋月刊》发表评论,直接否定人工智能具备意识的可能性。文章从哲学和认知科学角度论证,当前的大语言模型仅是模式匹配与文本生成的统计系统,并不拥有主观体验或自我意识。

大佬观点现象/趋势
04:39
Hacker News 热门(buzzing.cc 中文翻译)
57
随着人工智能迅速发展,数学家们发出警告

Science.org 报道称,数学家们对人工智能的快速进展发出警告。

推理现象/趋势
03:22
Bloomberg:Technology(RSS)
58
DoubleLine的Cohen警告AI泡沫即将波及信贷市场

DoubleLine全球发达信用债主管Robert Cohen在纽约彭博全球信贷论坛上警告,AI债务几乎必然将达到泡沫水平。

大佬观点
03:18
MarkTechPost(RSS)
62
如何使用Workers、Functions和Cron Triggers通过iii构建文档智能后端

一篇教程介绍如何通过注册模块化函数,并在Workers、Functions和Cron Triggers等多个触发器间复用这些函数,使用iii构建文档智能后端。该文章展示了模块化注册与跨触发器复用的核心方法。

教程/实践部署/工程
03:09
Hacker News 热门(buzzing.cc 中文翻译)
精选73
优步每月 1,500 美元的 AI 使用上限为 AI 工具定价提供参考

优步将 AI 工具每月使用上限定为 1500 美元,这一做法为行业 AI 工具定价提供了有价值的参考信号。

大佬观点行业动态

推荐理由:Uber 这个 1500 美元的人均 AI 月限额,不是内部规定那么简单,它为所有 AI SaaS 产品划出了一条定价天花板,想做企业生意的都应该盯着这个数字。
02:52
Bloomberg:Technology(RSS)
61
AI 泡沫即将降临信贷市场,DoubleLine 的 Cohen 表示

DoubleLine 投资组合经理 Robert Cohen 指出,参照铁路和互联网等重投资领域的历史,AI 债务几乎必然会最终达到泡沫水平。

数据/训练现象/趋势
02:52
Bloomberg:Technology(RSS)
32
AI融资是一场军备竞赛,GoldenTree的Tananbaum表示

GoldenTree Asset Management创始人兼首席投资官Steven Tananbaum在彭博全球信贷论坛上表示,信贷市场将继续低迷,但仍存在一些机会。他还指出,AI融资正演变为一场军备竞赛。

现象/趋势行业动态
02:49
Google Research:Blog(网页)
精选72
洪水韧性新篇章:Google 开源水文建模框架

Google Research 在 GitHub 开源了其水文建模框架,这是一个基于 PyTorch 的 Python 包,采用与 Flood Hub 河段洪水预报相同的模型架构和训练数据。该框架允许研究者和预报员训练 AI 洪水预报模型、添加新模型与数据,并已与捷克水文气象研究所(CHMI)等合作测试。开放模型架构和训练管线旨在让各国气象水文部门在保留数据完全控制权的同时,整合基于 AI 的洪水预报。

Google开源/仓库开源生态数据/训练

推荐理由:谷歌开源的水文模型框架,是少数真正能救命的AI应用。不是秀参数,而是把工具直接塞给一线预报员,让他们用本地数据训练。务实,值得给赞。
02:38
Hacker News 热门(buzzing.cc 中文翻译)
64
大型人工智能公司的一半股份应归公众所有

美国参议员伯尼·桑德斯(Bernie Sanders)在其官网发布的专栏文章中提出,大型人工智能公司的一半股份应归公众所有。

政策/监管行业动态
02:23
Claude:Blog(网页)
精选76
Claude Cowork 入门最佳实践

Anthropic 增长营销负责人 Austin Lau 介绍了非技术知识工作者使用 Claude Cowork 的最佳实践。Claude Cowork 是面向文档、电子表格等多步骤任务的 AI 助手,用户无需编程技能,将其指向文件夹或连接已有应用即可委托任务。与用于快速问答和头脑风暴的 Chat 以及面向开发者的 Claude Code 不同,Claude Cowork 适用于需要产出交付物、涉及多个文件或应用、可重复执行的场景。Lau 给出了判断任务是否适合的五项检查清单,并预告将于6月4日分享具体营销用例。

Anthropic教程/实践
关联讨论 1 条Claude:Blog(网页)
推荐理由:Anthropic 官方教你如何把 Claude Cowork 用到极致,从每日摘要到自动报表,非技术人员看完就能上手,比自己硬摸索省十倍时间。
02:17
The Verge:AI(RSS)
49
Google Gemini AI 智能体 Spark 上手体验:高效得令人不安,但也暴露了空洞的承诺

Google 发布 Gemini AI 智能体 Spark,同事 David Pierce 和 Jay Peters 分别进行了体验。Spark 能够自动获取用户未明确输入的信息,例如 David 的狗名 Frida 和 Jay 妻子的名字。尽管功能强大,但文章指出,这种对“生产力”的追逐忽略了真正需要解决的问题。

智能体Google现象/趋势
01:38
Hacker News 热门(buzzing.cc 中文翻译)
58
莱顿人工智能与数学宣言

莱顿人工智能与数学宣言(Leiden Declaration on Artificial Intelligence and Mathematics)在 leidendeclaration.ai 上线发布。

现象/趋势
01:23
Claude:Blog(网页)
精选68
Claude Code技能使用经验:Anthropic内部实践

Anthropic 分享了内部使用 Claude Code 的 Skills(技能)功能的经验。Skills 是指令、脚本和资源的文件夹,智能体可发现并调用它们以提升准确性和效率。Anthropic 内部已有数百个活跃使用的技能,它们可归为九类,包括库和 API 参考、产品验证、数据获取与分析、业务流程与团队自动化、代码脚手架与模板、代码质量与审查等。最佳技能专注于单一类别,涵盖过多功能会混淆智能体。团队发现,投入时间优化验证类技能对 Claude 输出质量的提升最显著。

智能体AnthropicMCP/工具教程/实践
关联讨论 4 条Claude:Blog(网页)X:小北 (@frxiaobei)X:Claude Devs (@ClaudeDevs)Hacker News 热门(buzzing.cc 中文翻译)
推荐理由:这不是产品公告,而是从几百个内部技能中血泪总结出的实战手册。如果你想让Claude Code真正变成你的工程副驾驶,这9类技能和‘gotchas’章节至少省你三个月踩坑。
01:23
Claude:Blog(网页)
精选73
Anthropic 用 Claude 赋能自助数据分析

Anthropic 使用 Claude 自动化了 95% 的业务分析查询,整体准确率约 95%。其关键在于构建智能体分析栈(agentic analytics stack),通过数据基础层、维护验证流程和技能(skills)分别解决概念-实体歧义、数据过时和检索失败三大错误来源。相比编码场景,数据分析的难点在于将用户问题映射到正确的数据实体,而执行 SQL 反而是简单的。Anthropic 的数据科学团队因此得以专注于因果建模、预测和机器学习等战略工作。

智能体Anthropic教程/实践数据/训练
关联讨论 1 条X:Claude Devs (@ClaudeDevs)
推荐理由:Anthropic 把内部用 Claude 搞自助分析踩过的坑全摊开,技能模板和「语义层优先」的强制流程是实打实的干货,做数据 agent 的团队可以直接抄作业。
01:21
Bloomberg:Technology(RSS)
49
高盛Minnis:AI是驱动市场的"代际性"力量

高盛集团全球另类资产发起部门主管Christina Minnis表示,人工智能投资热潮是一个“根本性、代际性”的现象,正在驱动市场并向整体经济扩散。

现象/趋势
00:51
Bloomberg:Technology(RSS)
67
Ray Dalio 称 AI 泡沫终将破裂,财富将转化为货币

亿万富翁投资者 Ray Dalio 表示,所有伟大的技术变革都会产生泡沫,他在蓬勃发展的 AI 市场中看到了泡沫迹象,并认为这个泡沫最终会随着财富转化为货币而破裂。

大佬观点现象/趋势
‹ 上一页
1…7891011…34
下一页 ›