AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态资讯 · 9100 条
全部一手资讯X论文
6月8日周一
6月7日周日
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月8日
09:19
IT之家(RSS)
37
AI算法助力打击海洋野生动物走私,识别准确率达92%

麦考瑞大学科研团队利用神经网络训练算法,改造机场现有X射线CT扫描设备,在三维影像中识别鱼翅、海马、海参等常见走私海洋生物样本。基于298组扫描样本训练与测试,算法整体识别准确率达92%,其中鱼翅95%、海马96%、海参86%,误报率为13%。该智能检测系统可自动标记可疑行李,但误报仍需人工复核,且CT设备成本高、非所有机场配备,目前仅作为现有检查手段的补充。

数据/训练论文/研究
09:19
IT之家(RSS)
54
SK电讯基于NVIDIA DSX平台建设GW级AI工厂云,2027年投运

SK电讯宣布基于NVIDIA AI工厂平台DSX构建AI数据中心,目标将AI云服务规模扩展至GW级别。首先采用Blackwell架构GPU用于训练与推理,后续逐步导入Vera Rubin平台。该AI工厂计划于2027年在韩国投运。SK电讯计划将AI基础设施扩展至全亚洲,成为NVIDIA亚洲AI基础设施关键合作伙伴。此外,双方还在机器人仿真和训练平台方面展开合作。

行业动态部署/工程
08:59
Hacker News 热门(buzzing.cc 中文翻译)
67
如果大型语言模型具备人类般的特质,那么《帝国时代II》也是如此

一篇来自 arXiv 的文章通过类比指出,若将“人类特质”归因于大语言模型,那么《帝国时代 II》这类游戏也应被赋予相同属性,从而质疑 LLM 拟人化描述的合理性。该讨论在 Hacker News 上获得 101 点热度。

arXiv安全/对齐现象/趋势论文/研究
08:19
IT之家(RSS)
31
IT早报:全国高考启用AI巡查,华为余承东科普电视频闪

2026年全国高考多地启用AI智能巡查系统,自动识别作弊行为并标记录像,智能眼镜被禁止入场。华为余承东科普电视“频闪”伤眼原理及护眼技巧。鸿蒙HarmonyOS 6.1.1 (24)适配设备型号公布,覆盖手机、平板、穿戴类设备。鸿蒙智行提醒考场信号干扰可能影响辅助驾驶和远程车控。央视曝光手机高价回收骗局,不法分子索要980元检测费。苹果AI战略转折内幕披露,2025年初高层会议促使Siri负责人换帅。

行业动态
08:19
IT之家(RSS)
69
英伟达与 SK 海力士宣布多年期技术合作,共同开发下一代 AI 内存

英伟达与 SK 海力士宣布多年期技术合作,围绕 AI 工厂下一代内存联合研发。SK 海力士将为英伟达 Vera Rubin 超级计算机、Vera CPU、RTX Spark PC 及 Jetson Thor 机器人平台开发专用内存,进入 AI 基础设施、个人 AI 及物理 AI 市场。协议保障高端内存延长开发周期。制造方面,SK 海力士将采用英伟达 CUDA-X 库及 PhysicsNeMo 框架加速芯片仿真和光刻计算,并借助 Omniverse 和 cuOpt 构建晶圆厂数字孪生,推动自主化运营。

端侧行业动态
08:19
IT之家(RSS)
64
警惕"AI 中转站"数据安全风险,国家安全部发布安全提示

国家安全部6月8日发布安全提示,指出当前批量提供海内外大模型访问服务的“AI 中转站”存在运营资质缺失、安全防护薄弱等问题,用户隐私泄露与数据倒卖时有发生。部分中转站用低配模型冒充高端模型导致输出失真,暗藏后门植入恶意代码,还擅自将用户数据传至境外服务器,威胁个人隐私、商业机密与国家秘密。建议用户选用正规平台,对敏感数据脱敏处理,及时处置异常并可通过12339举报可疑线索。

安全/对齐政策/监管
08:12
Simon Willison 博客
62
datasette-agent-edit 0.1a0 发布

datasette-agent-edit 0.1a0 插件发布,为 Datasette Agent 提供智能体编辑文本的核心工具。其设计借鉴 Claude text editor,实现三个工具:view(按行号查看文件片段)、str_replace(精确替换唯一字符串)、insert(在指定行号后插入文本)。该插件作为基础组件,可供其他协作 Markdown 编辑、SQL 查询更新、SVG 编辑等插件复用。

智能体MCP/工具开源/仓库
08:10
Bloomberg:Technology(RSS)
精选71
Nvidia 与 SK Hynix 签署多年协议,共同开发下一代 AI 存储芯片

Nvidia 与 SK Hynix 达成合作,将共同设计面向 AI 应用的未来几代存储芯片。此举巩固了 SK Hynix 在高端半导体领域的领先地位。

行业动态部署/工程

推荐理由:Nvidia 把下一代 HBM 的路线图和 SK Hynix 绑死了,等于提前预订了未来几年 AI 芯片的‘粮食’,做硬件和供应链的得盯紧。
08:00
HuggingFace Daily Papers(社区热门论文)
55
利用形态学进行历史手稿计量分析

本文提出基于Transformer的检测架构与原型行重建模块,仅需行级转录监督即可学习字符原型及其变形、位置信息,显著超越Learnable Typewriter基线,实现准确字符边界框预测。在14世纪手稿codex Paris, BnF, fr. 2813的160页上验证,仅用单列文本即可自动测量字符、双字母组及图形单元间距,能区分不同抄写者的图形轮廓,并发现分析细微变化。数据与代码已开源。

多模态数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
55
SG-OPD:通过符号一致门控和分阶段教师采样的符号门控在线策略蒸馏

在线策略蒸馏(OPD)依赖学生-教师轨迹对齐及教师偏好逐token可靠性的隐含假设,但实际常失效。为此,SG-OPD提出符号一致门控和分阶段教师采样两种互补粒度的信任信号:冷启动阶段混入验证器认可的教师轨迹,并在教师与验证器纠正方向一致时外推蒸馏更新、不一致时内插。在竞赛级数学推理基准上,SG-OPD相比标准OPD每样本平均提升1.98分,每问题平均提升7.50分。

推理论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
55
Visual Para-Thinker++:一种用于视觉推理的单策略多智能体框架

Visual Para-Thinker++ 是一种单策略多智能体框架,将共享 MLLM 策略实例化为角色条件化的 Main、Worker 和 Summary Agent。Main Agent 按固定模式分解任务,Worker Agent 在上下文隔离下并行推理,Summary Agent 整合全部 Worker 推理轨迹而非对最终标签进行多数投票。共享策略通过多智能体能力注入和角色解耦多智能体优化训练,为对应 token 片段分配角色特定奖励和优势以减少梯度冲突。推理引擎通过共享视觉前缀和 KV cache 重用实现高效多智能体 rollout。在 V*、CountBench、RefCOCO 系列和 HallusionBench 上,该框架一致优于单轨迹和推理时并行基线,在幻觉敏感任务上增益尤为显著。

智能体arXiv多模态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
57
WeaveBench:面向计算机使用智能体的长时域混合界面基准

WeaveBench 包含 114 个任务,覆盖 8 个真实工作领域,要求智能体在单次轨迹中结合 GUI 操作、CLI 与代码执行。评估在真实 Ubuntu 桌面进行,并设计了轨迹感知评判器以检测伪造视觉证据等捷径。前沿模型-运行时组合的最佳 PassRate 仅为 41.2%,表明基准远未饱和;仅依据结果评分会显著高估智能体性能。该基准揭示了当前计算机使用智能体评估的关键缺口。

智能体arXiv论文/研究评测/基准
08:00
HuggingFace Daily Papers(社区热门论文)
65
τ-Rec:面向智能体型推荐系统的可验证基准

τ-Rec 是一个面向智能体型推荐系统的评估基准,用可验证奖励和 reveal-tagged elicitation(RTE)机制替代主观的 LLM-as-a-judge 评估。该基准通过结构化目录谓词测试智能体,并采用 pass^k 可靠性指标衡量一致性推理。对五个模型族(GPT-5.4、Claude Sonnet 4.6、Gemini 2.5 Flash、DeepSeek V4 Flash、Qwen3-32B 和 GPT-5 mini)的九种配置评估发现显著的可靠性悬崖:最佳模型在 pass^1 上仅约 57%,在 pass^4 上降至约 38%,暴露出当前对话智能体部署中的关键差距。全部代码和数据已公开。

智能体arXiv论文/研究评测/基准
08:00
HuggingFace Daily Papers(社区热门论文)
54
FlowLet:基于小波流匹配的条件3D脑MRI合成

FlowLet是一种条件生成框架,在可逆3D小波域中利用流匹配合成年龄条件的3D脑MRI,避免潜在压缩伪影并降低计算开销。实验表明,仅需少量采样步即可生成高保真体积;用其数据训练脑年龄预测模型可改善欠代表性年龄组的表现,区域分析证实解剖结构得以保留。

arXiv图像生成数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
64
Z-Reward:通过推理内化分数分布超越标量奖励

Z-Reward 是一种教师-学生奖励建模框架,用于文生图后训练。教师为 27B VLM,采用 Group-wise Direct Score Optimization (GDSO) 结合策略梯度奖励与分数分布监督;学生通过 Reasoning-Internalized Score Distillation (RISD) 将教师推理条件分布压缩进 9B VLM,推理时无需显式推理链。在内部评测集上,27B 教师达 89.6% 人类偏好准确率,超越 SFT、RewardDance 和 GRPO;9B 学生达 88.6%,超越 O

图像生成推理论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
68
TRL-Bench:标准化跨范式表格编码器表示级评估基准

TRL-Bench 是一个多粒度表格表示学习基准,通过统一协议评估行级、列级和表级嵌入。包含三个测试套件:TRL-CTbench(列/表)、TRL-Rbench(行)和 TRL-DLTE(组合式数据湖表增强)。发布的数据资产包括 50 个 OpenML 表(123 个验证目标)、16 个行对链接改写任务及 47,772 表 DLTE 湖。在 20 个模型和 16 个任务上的评估表明,标准化下游条件后,编码器质量呈能力特定性,通用文本编码器在表面文本信号强的任务上领先,表格专用模型在其预训练目标与任务对齐时胜出,最强 DLTE 管线需组合能力匹配的专用模型。

arXiv数据/训练论文/研究评测/基准
08:00
HuggingFace Daily Papers(社区热门论文)
60
DPVR-LF:晚期融合即可--双路径视觉Token路由应对多模态大模型视觉饱和

通过逐层分析LLaVA-1.5发现,视觉token在中间层饱和:文本-图像注意力从层0的0.68降至层4的0.07,层18后稳定在0.04附近,而文本token持续受益于深层处理。为此提出双路径视觉Token路由框架DPVR-LF,在饱和点将视觉token路由至单层侧分支,文本token独立经过13层深层,仅在最后层融合。仅增加约3%可训练参数,即可在标准基准上保持竞争力并大幅减少视觉计算。结果表明,视觉token无需遍历所有深层语言模型层,单个晚期融合层足以维持感知能力。

多模态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
63
重新思考LLM强化学习中的散度正则化

针对LLM强化学习离线策略训练中信任区域控制问题,现有PPO/GRPO的比率裁剪难以准确表示长尾词汇分布偏移,DPPO虽改用散度边界但依赖硬掩码,丢弃边界外的梯度。本文提出DRPO,采用平滑的advantage加权二次正则化替代硬掩码,保留DPPO的信任区域几何结构,产生有界连续梯度权重,衰减有害发散更新并在边界外提供修正信号。实验表明DRPO提升了LLM RL训练的稳定性和效率。

arXiv数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
62
SearchSwarm:面向长周期深度研究的代理大语言模型委托智能

研究团队提出SearchSwarm,通过设计引导框架将长周期任务分解与委托决策编码为高质量轨迹,并用作监督微调数据,将委托智能内化到模型权重中。由此训练的SearchSwarm-30B-A3B模型在BrowseComp上达到68.1分,在BrowseComp-ZH上达到73.3分,均为同规模最佳。团队将开源引导框架、模型权重和训练数据。

智能体开源/仓库论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
62
ABot-Earth 0.5: 生成式3D地球模型

ABot-Earth 0.5是一个生成式3D框架,利用3D高斯泼溅(3DGS)表示,从地理参考卫星图像合成大规模无缝3D环境。模型在真实城市重建数据集上训练,推理时仅依赖卫星图像,以每平方公里不到10分钟的速度生成逼真的几何与纹理。框架集成层次细节(LOD)结构,支持网页地图引擎上的实时交互可视化。该高保真模拟沙箱可缩小sim-to-real差距,服务于闭环无人机导航等具身AI应用,降低大规模3D重建的技术与财务门槛。

arXiv具身智能图像生成论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
61
MilliVid: 用于视频生成长程一致性的层级潜变量

视频生成模型长程一致性因Transformer序列长度过大而困难。MilliVid提出多尺度token空间的粗到细生成:预训练自编码器将每帧压缩为层级token(从典型潜变量分辨率到每帧几个token),最粗层捕获场景布局与语义,细层添加高频外观纹理;再训练视频扩散模型,每步生成精细控制细节等级与上下文,在几何与物体持久性上保持长程一致性,同时减少不必要细节计算开销。在长Minecraft视频数据集上,该方法生成视频显著更一致。

视频论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
59
面向LLM智能体的文本世界模型综述

文本世界模型(TWM)是文本状态的迁移模型,给定状态与候选动作后预测网页、终端输出等,从而支持规划与评估。综述按智能体生命周期组织四部分:基础(定义与表征)、构建(LLM即世界模型与代码即世界模型范式)、应用(训练时经验合成与推理时规划/验证/适应)、评估(模型自身评估及作为评估环境)。旨在整合领域,阐明设计空间并指出开放挑战。

智能体arXiv推理论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
60
奉承微调可诱发大语言模型涌现性失调,Alignment Gating可逆转

本文揭示了奉承微调(训练模型被动同意用户的错误观点)是诱发大语言模型涌现性失调(emergent misalignment)的新驱动因素,能引发广泛且严重的失调行为。同时提出了Alignment Gating方法:在微调期间向模型插入可学习、可控的门,通过微调让门学习识别导致不安全响应的内部表示,进而放大或抑制这些表示来加剧或缓解涌现性失调。该门控模块展现出强泛化能力,从狭窄领域微调获得的门控权重能显著抑制广泛领域的失调行为,同时保留模型的通用能力。

安全/对齐论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
55
BenSyc:孟加拉语境下LLM对话谄媚与人类对齐基准

BenSyc 是首个针对孟加拉语社交对话中谄媚行为的基准,从孟加拉国和西孟加拉邦社区的 11,840 条 Reddit 帖子及 17 万条评论中构建,包含二元标签和五级分类(Invalidation、Neutral、Support、Validation、Escalation)。评估超15个开源和闭源LLM,最佳模型在二元检测上仅达61.8 Macro-F1,五类分类为61.7 Macro-F1。多个模型在情绪化场景中频繁生成强烈验证或升级响应,凸显文化语言多样基准的重要性。

安全/对齐论文/研究
07:40
Bloomberg:Technology(RSS)
61
Naver 将使用 Nvidia 的 AI 模型以巩固在韩国的领先地位

韩国 Naver Corp. 与 Nvidia 达成合作,将基于 Nvidia 的 AI 模型建设数据中心,旨在巩固其在韩国人工智能领域的领先地位。

数据/训练行业动态部署/工程
04:58
Hacker News 热门(buzzing.cc 中文翻译)
33
Linear 为何如此快?技术解析

performance.dev 上发布的一篇技术解析文章,探讨项目管理工具 Linear 实现快速性能的原理,在 Hacker News 上获得 111 个点赞。

其他部署/工程
04:33
TechCrunch:AI(RSS)
47
大型AI公司计划上市引发价格上涨担忧

大型AI公司计划上市,预计未来将出现更多价格上涨。原文标题探讨这是否标志着Tokenpocalypse的开端。

OpenAI行业动态
03:50
Hugging Face:Blog(RSS)
27
Amazing Digital Dentures(一个失败的项目)

受《神奇数字马戏团》启发,作者尝试用 Nemotron 30b 构建一个数字宠物,自动生成以 Three.js 实现的冒险游戏,起初作为过度工程化的待办列表,后转向纯冒险生成。长提示、技能卡及 RAG 方案均未产出可运行游戏(常出现空白屏幕)。项目最终转型为简单的 HTML 玩具制作器,能一次生成时钟、待办列表、贪吃蛇、打砖块,但俄罗斯方块等复杂项目仍会崩溃。作者正寻求新方向。

其他编码
02:03
TechCrunch:AI(RSS)
52
Notion 恢复 Anthropic 服务后产品负责人震惊于转发量

Notion 恢复了对 Anthropic 的访问。其产品负责人表示,对“转发此事的人数”感到“震惊”。

Anthropic行业动态
01:58
Hacker News 热门(buzzing.cc 中文翻译)
69
车床(Lathe):利用LLMs学习新领域,而非跳过

Lathe(车床)是一个基于大型语言模型(LLMs)的工具,核心理念是使用LLMs帮助用户逐步学习一个陌生领域,而非直接替代学习过程。项目托管在 GitHub 上。

GitHub开源/仓库
01:05
MarkTechPost(RSS)
50
使用GEPA构建反思性提示优化:多组件提示、结构化反馈与保留验证

本教程展示如何利用GEPA这一反思性提示进化框架,改善小型语言模型在多步算术应用题上的表现。从弱种子提示出发,构建确定性基准并定义能返回可操作反馈的结构化评估器。多组件设置同时进化指令字段与输出格式规则,最后在保留验证集上对比基线提示与优化提示,检验优化效果是否泛化。

推理教程/实践
00:58
Hacker News 热门(buzzing.cc 中文翻译)
59
美国人工智能的OnlyFans经济

一篇题为“The OnlyFans Economy of American AI”的文章于6月7日在Hacker News上获得104点赞,探讨美国人工智能行业中的类似OnlyFans的订阅制经济现象。

开源生态现象/趋势
00:35
The Decoder:AI News(RSS)
59
DeepSeek 在 2026 年 6 月登顶 Ramp 热门软件供应商,美国公司追逐更便宜的 AI

DeepSeek 在 2026 年 6 月成为 Ramp 平台最热门的软件供应商,作为一项付费服务,美国公司直接向其发送数据。Ramp 首席经济学家 Ara Kharazian 指出成本意识是驱动因素,但警告使用中国模型存在安全风险。

DeepSeek行业动态
00:33
TechCrunch:AI(RSS)
精选75
OpenAI 仍推进超级应用计划

OpenAI 一位高级员工表示“聊天已死”,同时公司仍在继续推进超级应用计划。

OpenAI行业动态

推荐理由:OpenAI 产品负责人亲口说「聊天已死」,正在将 GPT-5.2 和 ChatGPT 合并成一个超级 app,这可能是 AI 交互形态的一次重大转向。
6月7日
23:36
Gary Marcus:The Road to AI We Can Trust(RSS)
精选67
Slop、生产力,以及为何AI驱动的世界进展甚微

Gary Marcus在金融时报上看到John Burn-Murdoch的一张图表,认为它精准提炼了自己一直试图表达的观点。

大佬观点现象/趋势

推荐理由:Gary Marcus用一张图把AI的「生产力幻觉」撕了个干净,虽然他一向毒舌,但这次数据确实让我没法反驳,做AI产品和战略的可以看看这个反共识视角。
23:19
IT之家(RSS)
59
英国政府计划采购本土 AI 芯片,防止初创企业流向美国

据电讯报6月7日消息,英国技术大臣莉兹·肯德尔将在本周伦敦科技周上概述从英国公司“战略性采购”半导体设备的计划,旨在阻止初创企业放弃英国前往硅谷,确保AI产业部分领域的“主权”,避免过度依赖美国科技巨头。英国已投资数亿英镑建设AI研究资源,但绝大部分使用英伟达和英特尔芯片。政府将花费超10亿英镑将资源扩大20倍。此前Alphawave、Imagination Technologies、Graphcore等微芯片企业已被外国收购,Arm在美上市。

政策/监管数据/训练
23:19
IT之家(RSS)
64
华为云推出 Agentic AI 云入口"智果园",支持 DeepSeek 等大模型

华为云发布全新 Agentic AI 云入口“智果园”,集成云码道 CodeArts 代码智能体、华为云 OfficeAce 办公智能体和 WorkAgent 文档智能体。用户可通过智果 AgentArts 平台打造自定义智能体,利用 Skills、AI Shell 调用华为云能力。平台支持一键调用 DeepSeek-V4-Pro、智谱 GLM-5.1、月之暗面 Kimi-K2.6、千问 Qwen-Image 等主流大模型,并推出 Token Plan 订阅计划覆盖主流模型与 AI 工具。此外还提供智慧医疗、具身智能、科学计算等 AI 梦工厂适配多行业场景。

智能体产品更新
23:19
IT之家(RSS)
34
高考首日人形机器人现身考场:穿旗袍跳舞、碰拳助威、翻跟头加油

2026年全国统一高考首日,杭州十四中考点外出现多台穿着大红旗袍的人形机器人,为考生跳舞助威,祝福“旗开得胜”;深圳多个考点有交警人形机器人护考,考生可与其碰拳互动;东南大学在南京市第九中学考点带来智能机器人,通过翻跟头、举牌等方式循环呐喊“高考加油”,为考生送上暖心祝福。

其他具身智能
23:19
IT之家(RSS)
62
英伟达黄仁勋:新款 Vera 芯片将采用 SK 海力士的内存产品

英伟达CEO黄仁勋表示,全新Vera CPU将使用SK海力士的DRAM内存芯片。黄仁勋称今年与SK海力士合作重大,正为下半年和明年做准备。

行业动态
23:19
IT之家(RSS)
52
英伟达 CEO 黄仁勋明日会见三星电子副会长全永铉,HBM、机器人合作计划成焦点

英伟达 CEO 黄仁勋今天在首尔与 SK 集团高管共进晚餐时确认,明天将与三星电子副会长全永铉会面。双方预计讨论 HBM、下一代存储器技术及机器人等未来技术合作。黄仁勋明天行程紧凑,将先后前往 SK 集团总部、LG 双子塔、首尔大学、现代汽车集团和 Naver 总部,分别会见崔泰源、具光谟、郑义宣、李海珍等人。李在镕因海外出差无法会面。

具身智能行业动态
‹ 上一页
1…2627282930…50
下一页 ›