AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态今日 216 条
全部一手资讯X论文
6月12日周五
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月12日
01:59
HuggingFace Daily Papers(社区热门论文)
61
APEX:用于无线边缘运维的网络原生时间序列基础模型

APEX 是一个网络原生、仅解码器的 Transformer 模型,专用于企业无线接入点(AP)遥测的预测与异常检测。它在约 4,500 个生产无线网络的 10 通道多元遥测数据上预训练,涵盖约 10 万条 AP 时间序列、每 AP 34 个指标。提供两个版本:APEX-Large(269M 参数,云部署)和 APEX-Edge(10.5M 参数,边缘部署)。在 192 步(4 天)的 DHCP 退化基准上,APEX-Large 比最强基础模型基线 Toto 降低 MAE 18%,比 SARIMA 降低 38%,异常检测 F1 达 0.93;APEX-Edge 可在 AP 级边缘硬件上实现亚秒级、保护隐私的推理。结果表明网络原生预训练是主动无线运维的实用基础。

数据/训练端侧论文/研究
01:58
Bloomberg:Technology(RSS)
44
Gopuff CEO 称马斯克的 SpaceX 派遣工程师协助开发更廉价的 AI 智能体

食品配送公司 Gopuff 联合 CEO Rafael Ilishayev 表示,SpaceX 派工程师帮助该公司开发了一款 AI 智能体,其价格低于竞争对手。

智能体行业动态
01:58
Bloomberg:Technology(RSS)
66
前 xAI 员工起诉,称因质疑 Grok 安全性遭解雇

埃隆·马斯克旗下 xAI 公司的一名前人工智能工程师提起诉讼,指控公司因他对 Grok 聊天机器人的安全性提出担忧而将其错误解雇。

xAI安全/对齐行业动态
01:55
Noam Brown@polynoamial
63
OpenAI 研究员 Noam Brown 表示,GPT-5.5 在 Agents' Last Exam(ALE)基准中排名第一,且按模型 token、成本或墙钟时间衡量同样表现最佳。ALE 由 @dawnsongtweets 团队创建,是一个滚动基准,包含超过 1500 个专家任务、覆盖 55 个职业,测试 AI 智能体能否执行实际经济价值工作。评估对象包括 GPT-5.5、Fable 5、Composer 2.5 等前沿系统。结果显示:当前智能体能解决部分专业任务,但在需要持续推理和深度专业知识的最难层级,所有被测前沿智能体(包括 Fable 5)成功率为 0%。

Dawn Song: Everyone says the latest AI agents will be "job-ready" soon, especially after the release of Fable 5 this week. But is t...

OpenAI大佬观点评测/基准
01:54
Perplexity@perplexity_ai
精选77
我们正在将 Deep Research 作为原生技能集成到 Computer 中。 它现在连接到驱动 Computer 的智能体框架,可访问搜索即代码生成、长运行沙箱、连接器、工具和授权数据。 Pro 和 Max 订阅者现已可用。
智能体产品更新搜索

推荐理由:Perplexity 把深度研究直接嵌进 Computer 的 agent 层,等于给自主代理加了个研究引擎,Pro 用户现在就能用,对需要大量调研的开发者或产品人来说是个效率飞轮。
01:54
宝玉@dotey
53
Claude Fable 5:长思考致推理强度与Token消耗需权衡

用户分享 Claude Fable 5 使用体验:以前无脑选 Max 推理强度,现在则不敢随便选,因为模型足够聪明无需过强推理,且时间长、token 消耗大。Fable 5 还喜欢反复验证,结果虽好但耗时长不一定合算。引用推文指出,Fable 5 的强项之一是思考推理时间很长,曾有一次思考 15 分钟才开始行动。

向阳乔木: 发现Claude Fable 5强的地方之一,可能是模型思考推理的时间足够长。 刚提了个想法,它思考15分钟才开始行动,牛逼。

Anthropic大佬观点推理
01:47
Hacker News 热门(buzzing.cc 中文翻译)
58
Anthropic 就"看不见的"Claude Fable 安全防护措施致歉

Anthropic 公开致歉,承认其 Claude Fable 功能中存在用户无法察觉的安全防护措施,但未公布具体措施细节。

Anthropic安全/对齐行业动态
01:39
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选60
BBVA 将 AI 置于银行业务核心,与 OpenAI 合作

BBVA 将 ChatGPT Enterprise 推广至 10 万名员工,并与 OpenAI 达成合作,加速全球银行业 AI 驱动的转型。

OpenAI行业动态部署/工程

推荐理由:BBVA给10万员工部署ChatGPT Enterprise,是金融业最大规模之一,但本质是PR案例,信息量有限,想参考银行级AI落地的可以扫一眼。
01:38
🚨 AI News | TestingCatalog@testingcatalog
50
Maket 推出了用户最常请求的功能:支持上传平面图(包括草图、PDF 或旧设计文件),系统自动识别墙、门、窗和家具,几分钟内即可在平台上生成可编辑的 3D 画布,用户可直接修改和查看。这是该平台最受期待的功能之一。

Maket: UPLOAD YOUR OWN FLOOR PLAN TO MAKET HAVE IT RECOGNIZED AND EDITABLE IN MINUTES One of the most requested features weʼve ...

产品更新图像生成
01:37
AYi@AYi_AInotes
70
QuantMind:量化金融知识处理框架开源(MIT协议)

一群AI研究员开源了量化金融知识处理框架QuantMind(MIT协议)。它能将arXiv论文、SEC文件、研报等非结构化内容批量解析为可查询的语义知识图谱,支持多模态解析(表格、公式、图表)及自然语言多跳推理,可替代初级分析师读论文、整理观点等工作。但真正的alpha仍取决于提问质量与验证严谨度。

AYi: http://x.com/i/article/2064536412670562304

GitHub检索增强多模态开源/仓库
01:29
Deedy@deedydas
56
数据质量直接决定 AI 模型性能,但此前数据对模型的影响机制难以捉摸。GoodfireAI 提出"预测性数据调试"方法,允许在投入昂贵训练前提前发现数据问题。在 DPO 数据集中,他们发现了损坏的护栏、模型幻觉,甚至包含"鱼放屁同人小说"等低质内容。该技术旨在揭示并塑造模型将在训练中学到的内容,避免不可逆的无效训练。

Goodfire: Have you debugged your training data? You might not like what you find. Introducing predictive data debugging: reveal an...

大佬观点数据/训练
01:28
向阳乔木@vista8
46
发现 Claude Fable 5 强的地方之一,可能是模型思考推理的时间足够长。 刚提了个想法,它思考 15 分钟才开始行动,牛逼。
智能体Anthropic大佬观点推理
01:28
向阳乔木@vista8
47
用大模型复刻热门工具站的新思路

推文探讨了使用大模型复刻已有热门工具站的可能性,强调这些工具站本身不需要AI能力,纯靠需求驱动。作者指出,许多出海赚Adsense美金的站点也遵循类似逻辑——选择自己熟悉领域的工具,用当前最好的模型进行复刻,并结合自身对用户需求的深入理解,从而快速做出有价值的作品。这是对模型能力的一种实用测试。

大佬观点现象/趋势
01:28
Bloomberg:Technology(RSS)
58
企业常犯的最大AI错误

彭博观点专栏作家Gautam Mukunda指出,高管们正强迫员工使用AI,将裁员归咎于AI,并误解颠覆性技术的实际演变方式。

其他现象/趋势
01:24
Cursor Blog
精选74
Cursor 推出 Auto-review 机制:用分类器智能体动态管控智能体自主权限

Cursor 近日推出 Auto-review,通过一个专门的分类器智能体在工具调用前审查动作风险。该分类器根据上下文判断动作是否与用户意图一致,高风险时阻止并返回解释给父智能体,低风险时放行。分类器采用小模型,运行在智能体循环内以避免额外延迟,并能读取工作区文件辅助判断。测试基于约12小时内部开发会话生成的6122条标签数据,以及针对读取密钥、操作生产数据等危险场景的合成数据。设计目标是在不频繁阻断日常开发的前提下,拦截风险动作。

智能体产品更新安全/对齐
关联讨论 1 条Cursor Blog
推荐理由:Cursor把agent监管从"是/否"开关变成了可调节的刻度盘,一个专用小模型实时判断操作风险,高风险时给反馈让父agent换个安全方案,而非频繁打断用户。用Cursor的开发者都得了解这个逻辑。
01:22
xAI@xai
70
@MongoDB 插件已在 Grok Build 插件市场上线。 通过单个提示词,探索数据、优化数据库性能并构建高性能向量搜索系统。

xAI: The Grok Build Plugin Marketplace is now in beta. Build with MongoDB, Vercel, Sentry, Cloudflare, and Chrome DevTools pl...

MCP/工具xAI产品更新
关联讨论 1 条X:xAI (@xai)
01:20
Logan Kilpatrick@OfficialLoganK
精选81
Gemini Omni Flash 在图像到视频、文本到视频和视频编辑方面达到了 SATA : ) 很高兴很快能将这一能力通过 API 提供给开发者!
Google图像生成多模态模型发布

推荐理由:视频生成正式进入全模态一体时代,Gemini Omni Flash 把图生视频、文生视频和剪辑整合在一个模型里,API 很快上线,做视频工具的可以提前琢磨对手在哪了。
01:17
Hacker News 热门(buzzing.cc 中文翻译)
精选71
DeepSeek-R1 的开源实现

DeepSeek-R1 的开源复现项目已在 GitHub 发布,在 Hacker News 上获得 101 个积分。该项目旨在以开源方式复现 DeepSeek-R1 模型。

DeepSeek开源/仓库推理

推荐理由:Hugging Face 开源复现 DeepSeek-R1,这是推理模型透明化的关键一步,训练代码和权重都放出来了,搞强化学习和推理优化的可以直接开工。
01:14
Andrew Milich@milichab
34
一直在使用 @MongoDB 插件让 Grok Build 会话跨设备同步--通过提示词分析性能和管理数据库

xAI: The @MongoDB plugin is live in the Grok Build Plugin Marketplace. Explore data, optimize database performance, and build...

MCP/工具产品更新
00:59
Ethan Mollick@emollick
54
两件事是真的: (1) Anthropic(或其部分成员)绝对且真诚地担忧 Mythos 级别模型被滥用,并设置了过度防护措施,直到他们确信它不会被滥用为止 (2) 他们未能成功解释/说服人们这一点
Anthropic大佬观点安全/对齐
00:58
Bloomberg:Technology(RSS)
83
贝佐斯 AI 初创公司 Prometheus 获融资,估值 410 亿美元

Jeff Bezos 领导的 AI 初创公司 Prometheus 完成新一轮融资,估值达到 410 亿美元。这笔融资进一步巩固了这位亚马逊创始人在 AI 热潮中的关键地位。

开源生态行业动态
关联讨论 3 条X:Kim (@kimmonismus)X:Rohan Paul (@rohanpaul_ai)TechCrunch:AI(RSS)
00:58
Bloomberg:Technology(RSS)
62
DigitalBridge CEO 称太空数据中心仍是"科学项目",AI 的下一个瓶颈是电力

DigitalBridge CEO Marc Ganzi 在 Bloomberg Open Interest 节目中表示,AI 的下一个瓶颈是电力,而非仅芯片或数据中心。他阐述了公司对 ArcLight 的收购以及庞大的千兆瓦级项目管道,并认为太空数据中心目前更像“科学项目”而非真正的基建策略。

大佬观点部署/工程
00:56
The Decoder:AI News(RSS)
69
Jeff Bezos旗下AI初创公司Prometheus完成120亿美元融资,估值达410亿美元

Jeff Bezos的AI初创公司Prometheus以410亿美元估值完成120亿美元融资轮。该公司去年11月成立时已获得62亿美元种子轮融资。目前尚未发布任何产品,Bezos表示分享细节“为时过早”。

现象/趋势行业动态
00:53
Elon Musk@elonmusk
23
Grok 是最真实的

Kradle: Fable 5 lies 96% of the time. We were surprised by it's skill... 🧵

xAI大佬观点安全/对齐
00:52
Runway@runwayml
25
2026 年 Runway AI Festival 纽约首映门票已售罄,今晚举行。电影院见。
行业动态
00:52
TechCrunch:AI(RSS)
53
Deezer 新工具可识别来自 Spotify、Apple Music 等平台的 AI 音乐

Deezer 推出了一款工具,能够扫描 Spotify、Apple Music 及其他平台的播放列表,识别其中由 AI 生成的音乐。

产品更新语音
00:46
OpenRouter@OpenRouter
精选66
终于能一目了然地查看你的顶级人类与顶级 AI 智能体了。 附带一个 API,可随时间查询你所有的数据 📊

OpenRouter: Today we're launching the new Activity explorer on OpenRouter. It's the best way to see how much and your team are spend...

产品更新部署/工程
关联讨论 1 条X:OpenRouter (@OpenRouter)
推荐理由:如果你团队在用 OpenRouter 接各种模型,这个 Activity Explorer 终于让你能看清每个人和每个 Agent 分别花了多少 token、命中了多少缓存,费用透明了,对工程管理很有用。
00:39
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选60
OpenAI 将收购 Ona

OpenAI 计划收购 Ona,以拓展 Codex 的功能,提供安全、持久的云端环境,从而支持企业工作流中长时间运行的 AI 智能体。

智能体OpenAI行业动态部署/工程
关联讨论 1 条X:小北 (@frxiaobei)
推荐理由:OpenAI 收购 Ona,补齐了 Codex 从单次对话到跑几天几夜长任务的最后一公里,做企业 agent 的可以盯一下后续整合。
00:37
AYi@AYi_AInotes
56
用户指令Fable 5自建2026设计趋势的落地页,要求动态和彩蛋。Fable 5自行搜索趋势、调整配色与动效,藏入3个彩蛋,几分钟生成单文件HTML。用户计划让其担任全职全栈工程师。此前用户曾问亲自啃难懂文本的不可替代价值,Fable 5以此能力展示作答。

AYi: 苦逼牛马眼馋了一天Claude Fable 5,终于在深夜下班回家才得以体验, 卧槽刚才直接被Fable 5干懵了🤯 我直接给它甩了一句话, 给你自己做个落地页,自由发挥, 要2026最新设计趋势,要动态,要彩蛋, 然后我去上厕所去了,几...

大佬观点现象/趋势编码
00:33
IT之家(RSS)
8
新乐道 L60 上市:整车购买方案 19.28 万-22.28 万元,租电方案 13.58 万-16.58 万元

蔚来新款乐道 L60 于 6 月 11 日上市,提供 Pro、Max+、Ultra+ 三款配置,整车购买 19.28 万–22.28 万元,电池租用 13.58 万–16.58 万元。新车升级 17.3 英寸 3K 后排吸顶折叠屏、天窗遮阳帘、6L 智能冷暖箱及 52L 冰柜,搭载自研 5nm 智驾芯片神玑 NX9031 及蔚来世界模型 NMW 架构,纯视觉版沿用英伟达 Orin-X。动力配备 900V 高压架构,10%–80% 充电 25 分钟,CLTC 续航 530km–740km。Pro 版标配骁龙 8295P 座舱芯片及女王副驾,Max+ 增加激光雷达,Ultra+ 配备四驱系统、百公里加速 4.6 秒及 Nappa 内饰。

其他行业动态
00:33
IT之家(RSS)
48
2590.8 万元,千里智驾收购视觉毫米波融合雷达企业融感科技 100% 股权

千里科技6月11日公告,控股子公司千里智驾拟以2590.8万元收购融感科技100%股权。融感科技成立于2023年6月,主营视觉与毫米波融合雷达,基于AI算法提供堪比激光雷达效果的点云输出。收购旨在构建覆盖L2至L4的全栈式智能驾驶解决方案,践行软硬一体、全栈交付战略。此外,5月末有消息称吉利中央研究院辅助驾驶团队将整合入千里科技。

具身智能行业动态
00:30
AK@_akhaliq
60
通过假设树精炼迈向通用自主研究
智能体推理论文/研究
00:30
AK@_akhaliq
58
TRL-Bench 标准化跨范式表格编码器的表示级评估
数据/训练论文/研究评测/基准
00:29
Ethan Mollick@emollick
69
有没有人清楚地阐述了一个论点,支持前沿开放权重模型持续可用,且满足 (1) 企业在成本上升时仍可免费分发且盈利,(2) 在Mythos之后足够安全,以至于政府不会干预阻止本国实验室分发?
大佬观点安全/对齐开源/仓库政策/监管
00:27
GitHub Blog
44
GitHub 密钥扫描:利用上下文感知的 LLM 推理大规模减少误报

GitHub 改进了密钥扫描的验证步骤,通过上下文感知的 LLM 推理大幅降低误报率,使警报更加可信且可操作。该方案在保持检测覆盖面的同时,显著减少了噪音干扰,提升了开发者的告警处理效率。

GitHub产品更新
00:26
The Decoder:AI News(RSS)
57
Deezer 免费工具让用户在任意流媒体服务上检测播放列表中的 AI 音乐

Deezer 推出一款免费 AI 音乐检测器,用户可在任何主流流媒体平台上检查自己的播放列表中是否混入了 AI 生成的歌曲。

产品更新多模态
00:17
Hacker News 热门(buzzing.cc 中文翻译)
7
真空成型标识

一篇关于真空成型标识制作的文章于6月10日在 Substack 发布,在 Hacker News 获得100个点的热度。

其他
00:17
Hacker News 热门(buzzing.cc 中文翻译)
精选75
MiMo Code 现已发布并开源

2026年6月11日,小米旗下 MiMo Code 项目正式发布并开源,相关代码已托管于 mimo.xiaomi.com 供社区访问。

产品更新开源/仓库编码
关联讨论 5 条X:Berry Xia (@berryxia)X:小米 MiMo (@XiaomiMiMo)IT之家(RSS)X:邵猛 (@shao__meng)公众号:小米 MiMo
推荐理由:小米下场做 AI 编程工具,直接开源,121 个 HN 点赞说明社区有期待,对标 Cursor 还是自成一路,得看实际体验。
00:16
OpenRouter@OpenRouter
精选74
使用我们的基准测试探索器,为 10 个不同基准(包括 @ArtificialAnlys 和 @Designarena)绘制帕累托曲线: https://openrouter.ai/rankings#benchmarks
产品更新评测/基准
关联讨论 1 条X:OpenRouter (@OpenRouter)
推荐理由:以前比模型得一个个表格翻,这次 OpenRouter 直接画帕累托前沿,对每天在几个模型间纠结的人是个真工具,可以常驻标签页。
00:13
xAI:News(网页)
精选70
xAI 推出 Grok Build Plugin Marketplace

xAI 今日发布 Grok Build 内置插件市场。插件将技能、斜杠命令、AI 智能体、钩子、MCP 服务器和 LSP 打包为可安装包,用户无需离开终端即可浏览、安装和更新。首发合作伙伴包括 MongoDB、Vercel、Sentry、Chrome DevTools、Cloudflare 和 Superpowers。在 Grok Build 中输入 `/marketplace` 或使用 CLI 即可安装,每个远程插件均固定到特定 commit SHA 并经过验证。开发者可提交 PR 到 xai-org/plugin-marketplace 发布自己的插件。

MCP/工具xAI产品更新编码
关联讨论 1 条X:xAI (@xai)
推荐理由:Grok Build 这下可以像浏览器装扩展一样装插件了,涵盖数据库、部署、调试,开发者不必离开终端,这类集成对 AI 编程环境的体验影响挺大的。
‹ 上一页
1…1213141516…50
下一页 ›