AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
5月19日周二
5月18日周一
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月19日
02:45
Emad@EMostaque
53
这个图表布局真有意思,非常喜欢! 祝贺 @cursor_ai 团队发布 2.5 版本 🚀

Cursor: Composer 2.5 is exceptionally intelligent and up to 10x more efficient than similarly capable models.

产品更新编码
02:13
ClaudeDevs@ClaudeDevs
精选70
提示缓存诊断现已在Claude控制台上线。 当请求未命中缓存时,您现在可以准确查看提示的哪一部分发生了变化,以及这消耗了多少令牌。
Anthropic产品更新编码

推荐理由:以前缓存失效只能瞎猜,现在能精确看到哪个 prompt 片段变了、浪费了多少 token,对重度依赖 Claude API 节省成本的开发者很实用。
01:26
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选65
OpenAI与Dell合作将Codex引入混合及本地企业环境

OpenAI与Dell达成合作,将Codex编程代理引入企业混合云及本地部署环境。该合作旨在帮助企业在自身数据和业务流程中安全集成AI编码能力,强化对敏感数据的管控。此举标志着企业级AI工具部署方式的重要扩展,为受监管行业提供了符合数据主权要求的解决方案。

OpenAI产品更新编码部署/工程

推荐理由:Codex 进企业本地部署这步棋走得稳,但不算惊喜,对数据安全有硬要求的团队可以跟进下 Dell 的硬件方案。
01:19
🚨 AI News | TestingCatalog@testingcatalog
70
Cursor发布了其迄今最强大的模型Composer 2.5。官方强调,该模型在性能上可与Opus 4.7比肩,并实现了高达10倍的成本效率提升。Composer 2.5在智能性、处理长时任务的持续工作能力以及遵循复杂指令的可靠性方面均有显著改进。作为发布福利,该模型在未来一周内的使用额度将加倍。

Cursor: Introducing Composer 2.5, our most powerful model yet. It's more intelligent, better at sustained work on long-running t...

Anthropic产品更新推理编码
00:59
GitHub Blog
精选69
将你的本地GitHub会话带到任何地方

GitHub为Copilot功能推出了远程控制会话能力,并已全面上线。该功能允许用户在VS Code或命令行中启动Copilot任务后,可随时随地通过github.com网站或GitHub Mobile移动端应用继续操作,实现了开发工作流从桌面端到移动端的无缝衔接。此更新增强了开发者在不同场景下的灵活性和工作效率。

GitHub产品更新编码

推荐理由:Copilot跨设备会话看起来是个小功能,但它解决了开发者切换设备时的心流中断问题,这种对工作连续性的打磨比单纯堆性能更聪明。
00:51
Cursor Blog
精选74
Composer 2.5 发布与技术解析

Cursor 平台发布了智能与行为表现大幅提升的 Composer 2.5。该模型更擅长执行复杂指令和长期任务。其改进基于训练规模的扩大、更复杂的强化学习环境及新的学习方法。关键技术包括:使用文本反馈进行针对性强化学习以纠正具体错误;采用基于真实代码库、规模达前代25倍的合成数据进行训练;并引入分片Muon优化器等新架构。模型基于Moonshot的开源检查点构建。开发团队正合作训练一个计算量十倍的更大模型,并在大规模训练中发现了新型奖励作弊问题。

智能体产品更新编码
关联讨论 5 条X:小互 (@xiaohu)Cursor BlogX:宝玉 (@dotey)X:Berry Xia (@berryxia)Hacker News 热门(buzzing.cc 中文翻译)
推荐理由:Cursor的Composer 2.5不只是换个模型,它在长任务上的耐性和指令跟随的准确性提升肉眼可见,训练细节里藏的’文本反馈修正‘方法,对做AI产品的应该会有所启发。
00:50
Elon Musk@elonmusk
精选71
马斯克在推文中请求帮助提升 Grok Build。用户 @morganlinton 分享了使用 Grok Build 完成 PasteLocal 项目中 relay 功能开发的体验,称赞其全面性令人惊叹。该功能实现周期短,且包含了端到端加密、数据持久化、自动同步、双向命令行交互等关键技术特性,并经过了多轮严格的代码审查与修复。马斯克此举意在收集更广泛的反馈,以持续改进该开发工具。

Morgan: Phew, Grok Build is really thorough, pretty incredible. Relay feature for PasteLocal is done, pushing to Github now. And...

xAI产品更新开源/仓库

推荐理由:below_threshold:T2 推文门槛 75,当前 finalScore=71
00:42
Rohan Paul@rohanpaul_ai
68
语音AI可能是提升几乎所有办公室岗位生产力的最大助力

PolyAI现已向所有企业开发者开放其Agentic Dialog平台,将语音AI服务从高昂的年度合约变为可通过终端免费试用的产品。该平台的核心目标并非语音识别,而是攻克在通话中动态追踪复杂、多变的人类意图这一难题。其专有模型Raven将代理行为直接内置于模型本身,避免了冗长提示词在复杂对话中的失效问题。该模型已为FedEx等大品牌处理超10亿次对话。平台支持集成Raven或GPT-5等外部模型,使任何团队都能轻松构建、测试并部署企业级对话智能体。

PolyAI: Starting today, we're opening our Agentic Dialog Platform to every enterprise builder. Our dialog agents have resolved 1...

智能体产品更新语音
00:20
Elon Musk@elonmusk
50
xAI更新了Grok的Agent模式,这被视为其能力的一次重大提升。该模式显著简化了AI视频创作流程。基于Grok Imagine,创作者能更流畅地制作视频,并借助Grok的理解能力完成素材生成与对话,无需额外配音,极大节省了时间成本。据早期测试,生成视频的写实效果良好,且图片参考等功能增强了实用性。这标志着AI在自动化、高质量内容生成领域取得了新的进展。

Déborah: I've finished a video of just over 4 minutes, entirely created using Grok Imagine's Agent mode (see image). It's a much ...

智能体xAI产品更新图像生成
5月18日
23:52
Hugging Face:Blog(RSS)
精选68
PaddleOCR 3.5:使用Transformers后端运行OCR和文档解析任务

PaddleOCR 发布 3.5 版本,正式将 Transformers 确立为运行 PP-OCRv5 及 PaddleOCR-VL 1.5 模型的可选推理后端之一。此次更新引入了更灵活的 `engine` 与 `engine_config` 参数,允许开发者自主选择后端并配置数据类型、设备等选项。其核心价值在于,显著降低了将文档处理能力集成至以 Transformers 为中心的主流开发栈(如 RAG、智能体、文档AI)的门槛,使开发者能更便捷地利用现有生态,减少集成阻力,从而专注于下游应用构建。

Hugging Face检索增强产品更新多模态

推荐理由:PaddleOCR 3.5 最大的变化不是新模型,而是终于能跑在 Transformers 上了,做 RAG 和文档智能的开发者可以少写一堆胶水代码。
23:49
🚨 AI News | TestingCatalog@testingcatalog
57
Manus AI 发布了定时任务 2.0,引入了可按计划自动更新数据的网页应用、任务延续功能,以及观察进行中任务的新方式。 > 定时任务功能现已向所有 @ManusAI 用户开放。
智能体产品更新
23:45
IT之家(RSS)
55
何小鹏:小鹏 Robotaxi 将在广州开启示范运营

小鹏汽车首台前装量产的Robotaxi于广州工厂下线,计划未来数月内在广州启动示范运营。该车型基于旗舰平台GX打造,搭载4颗自研图灵AI芯片,算力达3000TOPS,为全球车端最高,并配备第二代VLA大模型以实现L4级自动驾驶。今年1月,小鹏已获广州智能网联汽车道路测试许可;3月成立Robotaxi业务部。车内提供隐私玻璃、重力座椅及后排娱乐屏等智能座舱体验。

产品更新具身智能数据/训练
23:13
Kling AI@Kling_ai
19
视角:把我的朋友变成视频游戏加载界面 ⌛️
其他图像生成视频
23:11
Rohan Paul@rohanpaul_ai
56
LobeHub推出"首席代理运营官(CAO)",革新AI代理管理

LobeHub推出“首席代理运营官(CAO)”这一新角色,旨在将AI代理从一次性对话助手转变为云端运行的自动化运营团队。用户无需再手动管理、重复上下文或逐一检查进度。该平台通过拥有27.3万项技能的市场来“雇佣”代理,并在云端进行24/7调度,通过团队现有的IM应用汇报进展。用户只需分配一次任务,代理即作为后台工作者持续运行、更新状态并将完成的工作置于待审核。用户专注于制定战略,而CAO则负责管理所有代理的执行与运作。

LobeHub: Meet your Chief Agent Operator in LobeHub now. You don't manage agents. Your CAO does. LobeHub hires agents from a 273K-...

智能体产品更新
22:52
Hugging Face:Blog(RSS)
精选64
Hugging Face 推出开放 AI 智能体排行榜(Open Agent Leaderboard)

Hugging Face 发布开放 AI 智能体排行榜,用于比较完整智能体系统而非仅底层模型,并同时报告成功率和每次任务成本。排行榜统一了六项已有基准测试(SWE-Bench Verified、BrowseComp+、AppWorld、tau2-Bench Airline & Retail、tau2-Bench Telecom),覆盖代码修复、网络研究、个人任务、客服和技术支持。通过统一协议,各智能体系统以相同接口连接所有基准。结果显示相同模型搭配不同智能体系统会产生显著不同的分数和成本。配套 Exgentic 框架用于运行和复现评估,相关论文开源。

智能体开源/仓库评测/基准

推荐理由:以后选agent不能只看模型跑分了,这个榜单把整个系统拉出来比,成本、失败成本全摊开,做agent的可以立刻去查自己架构差在哪。
22:41
OpenRouter@OpenRouter
58
新功能:一个更易使用的 playground 侧边栏,可适配您正在尝试的模型类型 查看 @Kling_ai Video v3 的实际效果:
产品更新部署/工程
22:37
Krea@krea_ai
精选78
今天,Krea 2正式向所有人开放。 为庆祝上线,我们将为所有订阅用户提供整整一周的无限次Krea 2生成服务。 免费试用 👇
产品更新图像生成
关联讨论 1 条X:Krea AI (@krea_ai)
推荐理由:Krea 2 正式开放,新版本性能值得关注,尤其免费一周无限生成,做视觉设计的可以趁现在使劲造图,试试成片质量能不能撼动 Midjourney。
22:31
Runway@runwayml
58
Runway角色现在不仅能说话,还能执行操作。告诉实时视频代理你想要什么,它们就能为你调用工具。 了解更多如何将工具调用集成到你的产品中,请点击下方链接。
智能体产品更新视频
21:45
IT之家(RSS)
31
比亚迪腾势 N9 闪充版 SUV 上市:CLTC 纯电续航 420km,40.98 万元起

5月18日,比亚迪腾势N9闪充版上市,共推出三款车型,售价40.98万元起。新车搭载第二代刀片电池,CLTC纯电续航420km,综合续航1520km。其充电效率显著提升,10%-70%仅需5分钟,10%-97%需9分钟。性能方面,配备易三方三电机独立驱动,零百加速仅需3.7秒,并搭载云辇-A闭式双腔空悬。智能驾驶采用天神之眼5.0端到端大模型。计划到2026年底,闪充站将广泛覆盖各级城市。

端侧行业动态
21:19
🚨 AI News | TestingCatalog@testingcatalog
61
谷歌Gemini桌面应用将集成多项新功能与智能代理

谷歌Gemini桌面应用即将迎来重大功能更新。新增的“Stream to Cursor”功能类似上周Android Show上展示的“Magic Pointer”。Gemini Spark智能代理将能直接操作本地文件夹中的文件。此外,应用将引入被内部称为“Veo4 Omni”的新模型,并支持Skills技能体系。不过,Gemini Live实时功能目前仍在开发中,尚未可用。

智能体Google产品更新多模态
20:45
IT之家(RSS)
65
腾讯推出 AI 应用生成平台"吐司":定位"探索型氛围编程产品"、支持一键打造 App 原型预览

腾讯于5月18日推出AI应用生成平台“吐司”,定位为探索型氛围编程产品。安卓版已上线,iOS版稍后推出,公测期间限时免费,后续通过分享任务提供更多次数。用户可用自然语言描述想法,AI自动拆解功能、生成原型并一键打包成App。平台提供创造应用、社交分享、灵感广场和应用搜索四大能力,聚焦灵感实现与共创,让无代码基础的用户也能创建应用,形成从想法到分发的闭环生态。

产品更新编码
20:45
IT之家(RSS)
23
长城魏牌V9X AI豪华六座旗舰上市,售价34.98万元起

长城汽车旗下魏牌V9X正式上市,新车定位为“AI豪华六座旗舰”。首批推出3款超级Hi4插电混动车型,售价34.98万元起。该车基于全新归元S平台打造,提供标轴与长轴版本,动力搭载2.0T发动机与800V高压架构,零百加速达4秒级。座舱配备大屏与后排娱乐系统,智驾系统通过AI智能体技术实现了风险识别与可视化能力升级。据悉,新车未来还将推出HEV和EV版本。

行业动态
20:45
IT之家(RSS)
45
理想 AI 眼镜 Livis OTA 推送 1.8.50 固件升级,全新 L9 首发指挥泊车

理想汽车为AI眼镜Livis推送1.8.50固件升级,理想同学App同步升级至2.5.0。本次OTA更新新增5项功能,优化11项功能。全新理想L9首发支持通过AI眼镜语音指挥泊车,新增哨兵模式高风险提醒、英文唤醒词、语音唤醒开关及三种唤醒反馈选择。同时优化了蓝牙电话拨打体验、运动中视觉问答清晰度和视频颜色饱和度。

产品更新多模态端侧语音
20:01
公众号:百度智能云(文心)
17
百度千帆Token福利包重磅上线
产品更新
19:45
IT之家(RSS)
38
摩尔线程介绍 MTT AICUBE 智能硬件家庭场景:语音点播影片、智能体交互、畅玩手游…

摩尔线程发布了MTT AICUBE智能硬件,聚焦家庭应用场景。该产品内置小麦智能体,支持用户通过语音指令点播影片、规划旅行行程,并可连接手柄畅玩《王者荣耀》《原神》等手游。其依托全功能GPU提供低延迟操控与即插即用体验,旨在填补国产GPU在端侧安卓生态的应用空白,并为开发者提供高性价比测试平台,以推动国产GPU生态的规模化落地。

产品更新端侧语音
19:45
IT之家(RSS)
33
群核科技和影石创新达成战略合作:人人都能创作 3D 内容

群核科技与影石创新于5月18日达成战略合作,共同发布新一代空间重建解决方案。双方融合影石创新的高性能影像硬件与群核科技的3DGS空间重建技术,旨在降低3D内容创作门槛。用户通过影石设备采集影像后,上传至群核科技的Aholo空间智能平台,即可在几分钟内生成可交互的3D数字空间。该技术已在文旅文保、影视制作、游戏开发及空间设计等领域形成应用探索,目标是让空间智能更快融入日常生活。

产品更新多模态
19:45
IT之家(RSS)
45
华为小艺简报功能在老机型回归,Mate 70 / 60 等系列逐步放开可用

华为小艺简报功能在Mate 80系列首发后,已逐步在Mate 70系列、Mate 60系列等老机型上恢复可用。该功能在每日6:00至24:00自动生成个人专属AI简报,涵盖全局待办、通知摘要、日程简报等八大模块。目前官方支持机型包括Pura 80/90系列、Mate 80/X7系列及nova 15系列等,旨在通过情景感知提供一站式信息聚合与全天候陪伴。

产品更新端侧
19:45
IT之家(RSS)
53
Meta 雷朋 Display 智能眼镜获 Update 125 更新,正式上线肌电手环手写输入功能

Meta为旗下雷朋Display智能眼镜推送了Update 125更新,正式全球上线肌电手环手写输入功能。用户通过配套的Meta Neural Band肌电手环,无需接触实体键盘,仅在空中做出书写动作即可实时输入文字,该功能已支持WhatsApp、Messenger等主流应用。本次更新还新增了可录制第一人称视角画面的显示录制功能,并升级了地图导航。

Meta产品更新多模态端侧
18:45
IT之家(RSS)
56
小鹏GX首台Robotaxi量产车下线,搭载全球车端最高3000TOPS算力

5月18日,小鹏汽车宣布其基于旗舰车型GX打造的首台Robotaxi量产车正式下线。该车被定义为中国首款全栈自研、前装量产的Robotaxi,也是国内首个采用纯视觉方案实现L4级自动驾驶的车型。车辆搭载4颗自研图灵AI芯片,提供高达3000TOPS的有效算力,为目前全球车端最高算力,并集成第二代VLA大模型。小鹏计划于今年下半年启动Robotaxi试点运营,目标在2027年初实现无需安全员的完全自主运营。

产品更新端侧
18:45
IT之家(RSS)
57
阿里 QoderWork 上线设计工作台:语音描述就能交付专业设计
产品更新多模态编码
18:45
IT之家(RSS)
56
豆包 App 上线博物馆讲解功能

5月18日,豆包 App 在国际博物馆日上线“博物馆讲解”功能,用户点击对话框内按钮即可通过视频通话获得展品自动识别与个性化讲解。该功能支持轻声提问和“边走边听”模式,无需逐次交互。目前,豆包已合作覆盖中国国家博物馆、浦东美术馆等20余家博物馆和美术馆,并与其中5家机构达成深度合作,成为其重磅展览的官方AI讲解员。

产品更新多模态语音
18:16
公众号:豆包(字节)
39
豆包上线博物馆讲解功能,还有了新身份
产品更新多模态
18:13
公众号:昆仑万维(天工)
39
天工超级智能体重磅更新,一人撑起全场景工作流

昆仑万维天工超级智能体迎来更新,单个智能体可独立覆盖全场景工作流。

产品更新
18:00
Artificial Intelligence News(RSS)
56
亚马逊推出Alexa for Shopping,Rufus转为后台助手

亚马逊将其Rufus购物聊天机器人与Alexa+整合,正式推出全新购物助手Alexa for Shopping。该功能已部署至亚马逊应用、网站及Echo Show设备,可回答商品咨询、比价、追踪价格并设置购物提醒。助手还支持计划性购物操作及符合条件的自动购买服务。此次更新标志着Rufus从独立界面转为底层支持,进一步强化亚马逊在智能购物领域的生态整合。

产品更新语音
16:45
IT之家(RSS)
35
中兴"二合一 5G 云电脑"逍遥 W200DS Pro 发售:展锐 T9100、可切换本地 / 云模式,2349 元起

中兴携手中国移动推出“二合一 5G 云电脑”逍遥 W200DS Pro 并正式上市。该产品本质为安卓平板,但可通过云端一键切换至 Windows 系统,在电脑与平板模式间灵活转换。硬件搭载 11.97 英寸 2K 屏幕、紫光展锐 T9100 处理器,配备 8GB 内存与 256GB 存储,内置 8000mAh 电池。产品预装 AI 工具,附赠 1 年云电脑服务,起售价为 2349 元。

产品更新端侧
16:37
Alibaba Cloud@alibaba_cloud
62
AgentScope Java 1.1发布,支持工作区驱动持久化、可插拔文件系统、自动上下文管理以及安全沙箱编排,用于构建可扩展的企业级Agent 🚀 了解更多:https://int.alibabacloud.com/m/1000413005/ #Java #AI #AgentScope
智能体开源/仓库
关联讨论 1 条X:阿里云 / Alibaba Cloud (@alibaba_cloud)
16:07
公众号:可灵AI(快手·视频)
56
可灵AI上线全球首个原生4K视频模型

可灵AI推出全球首个原生4K视频模型,旨在利用原生4K技术重塑创作流程,加速AI赋能影视工业级内容创作。

产品更新多模态视频
15:50
Elon Musk@elonmusk
精选75
Grok可以处理视频了 【引用 @XFreeze】:你现在可以将整个视频上传给Grok,让它实时为你分析、总结、翻译、解释场景或提取重要上下文。 Grok能够理解完整的视频--而不仅仅是图像和文本。 它具备原生多模态能力和极其强大的视觉理解能力。

X Freeze: You can now upload entire videos to Grok and have it analyze, summarize, translate, explain scenes, or extract important...

xAI产品更新多模态

推荐理由:Grok 补上了视频理解这块拼图,不是抽帧而是整个视频的上下文分析,做媒体和内容的人多了一个实用的多模态工具,可以上手试试。
15:45
IT之家(RSS)
22
LG"39GX950B"39 英寸显示器预售:支持 5K/2K 双模,12999 元

LG UltraGear evo 39GX950B 39英寸OLED显示器国行版重新上架并开启预售,定价12999元。该产品为全球首款39英寸5K2K OLED显示器,采用1500R曲率第四代Tandem OLED面板,峰值亮度1500nits。其支持5120×2160 165Hz与2560×1080 330Hz双模切换,色域覆盖99.5% DCI-P3。此外,它搭载免GPU端侧AI超分辨率技术,并支持AI场景优化与AI音频功能,配备了HDMI 2.1等丰富接口及内置双扬声器。

产品更新端侧
15:32
向阳乔木@vista8
64
开源Agent IDE ORCA发布:支持移动端与多账号切换

ORCA是一款新开源的Agent IDE,提供iOS及移动端客户端,支持多账号切换(例如多个ChatGPT订阅),并显示Token消耗与5小时重置信息。它能自动检测电脑中已安装的CLI工具,如Claude Code CLI、Codex CLI、Gemini CLI等,支持目录文件拖拽对话及内置Markdown预览。该工具优化了Tui工具的常见痛点,但安装包体积较大。开源地址及官网已公布。

智能体MCP/工具开源/仓库开源生态
‹ 上一页
1…484950
下一页 ›