Composer 2.5 is exceptionally intelligent and up to 10x more efficient than similarly capable models.
Composer 2.5 is exceptionally intelligent and up to 10x more efficient than similarly capable models.
OpenAI与Dell达成合作,将Codex编程代理引入企业混合云及本地部署环境。该合作旨在帮助企业在自身数据和业务流程中安全集成AI编码能力,强化对敏感数据的管控。此举标志着企业级AI工具部署方式的重要扩展,为受监管行业提供了符合数据主权要求的解决方案。
Introducing Composer 2.5, our most powerful model yet. It's more intelligent, better at sustained work on long-running t...
GitHub为Copilot功能推出了远程控制会话能力,并已全面上线。该功能允许用户在VS Code或命令行中启动Copilot任务后,可随时随地通过github.com网站或GitHub Mobile移动端应用继续操作,实现了开发工作流从桌面端到移动端的无缝衔接。此更新增强了开发者在不同场景下的灵活性和工作效率。
Cursor 平台发布了智能与行为表现大幅提升的 Composer 2.5。该模型更擅长执行复杂指令和长期任务。其改进基于训练规模的扩大、更复杂的强化学习环境及新的学习方法。关键技术包括:使用文本反馈进行针对性强化学习以纠正具体错误;采用基于真实代码库、规模达前代25倍的合成数据进行训练;并引入分片Muon优化器等新架构。模型基于Moonshot的开源检查点构建。开发团队正合作训练一个计算量十倍的更大模型,并在大规模训练中发现了新型奖励作弊问题。
关联讨论 5 条X:小互 (@xiaohu)Cursor BlogX:宝玉 (@dotey)X:Berry Xia (@berryxia)Hacker News 热门(buzzing.cc 中文翻译)Phew, Grok Build is really thorough, pretty incredible. Relay feature for PasteLocal is done, pushing to Github now. And...
PolyAI现已向所有企业开发者开放其Agentic Dialog平台,将语音AI服务从高昂的年度合约变为可通过终端免费试用的产品。该平台的核心目标并非语音识别,而是攻克在通话中动态追踪复杂、多变的人类意图这一难题。其专有模型Raven将代理行为直接内置于模型本身,避免了冗长提示词在复杂对话中的失效问题。该模型已为FedEx等大品牌处理超10亿次对话。平台支持集成Raven或GPT-5等外部模型,使任何团队都能轻松构建、测试并部署企业级对话智能体。
Starting today, we're opening our Agentic Dialog Platform to every enterprise builder. Our dialog agents have resolved 1...
I've finished a video of just over 4 minutes, entirely created using Grok Imagine's Agent mode (see image). It's a much ...
PaddleOCR 发布 3.5 版本,正式将 Transformers 确立为运行 PP-OCRv5 及 PaddleOCR-VL 1.5 模型的可选推理后端之一。此次更新引入了更灵活的 `engine` 与 `engine_config` 参数,允许开发者自主选择后端并配置数据类型、设备等选项。其核心价值在于,显著降低了将文档处理能力集成至以 Transformers 为中心的主流开发栈(如 RAG、智能体、文档AI)的门槛,使开发者能更便捷地利用现有生态,减少集成阻力,从而专注于下游应用构建。
小鹏汽车首台前装量产的Robotaxi于广州工厂下线,计划未来数月内在广州启动示范运营。该车型基于旗舰平台GX打造,搭载4颗自研图灵AI芯片,算力达3000TOPS,为全球车端最高,并配备第二代VLA大模型以实现L4级自动驾驶。今年1月,小鹏已获广州智能网联汽车道路测试许可;3月成立Robotaxi业务部。车内提供隐私玻璃、重力座椅及后排娱乐屏等智能座舱体验。
LobeHub推出“首席代理运营官(CAO)”这一新角色,旨在将AI代理从一次性对话助手转变为云端运行的自动化运营团队。用户无需再手动管理、重复上下文或逐一检查进度。该平台通过拥有27.3万项技能的市场来“雇佣”代理,并在云端进行24/7调度,通过团队现有的IM应用汇报进展。用户只需分配一次任务,代理即作为后台工作者持续运行、更新状态并将完成的工作置于待审核。用户专注于制定战略,而CAO则负责管理所有代理的执行与运作。
Meet your Chief Agent Operator in LobeHub now. You don't manage agents. Your CAO does. LobeHub hires agents from a 273K-...
Hugging Face 发布开放 AI 智能体排行榜,用于比较完整智能体系统而非仅底层模型,并同时报告成功率和每次任务成本。排行榜统一了六项已有基准测试(SWE-Bench Verified、BrowseComp+、AppWorld、tau2-Bench Airline & Retail、tau2-Bench Telecom),覆盖代码修复、网络研究、个人任务、客服和技术支持。通过统一协议,各智能体系统以相同接口连接所有基准。结果显示相同模型搭配不同智能体系统会产生显著不同的分数和成本。配套 Exgentic 框架用于运行和复现评估,相关论文开源。
5月18日,比亚迪腾势N9闪充版上市,共推出三款车型,售价40.98万元起。新车搭载第二代刀片电池,CLTC纯电续航420km,综合续航1520km。其充电效率显著提升,10%-70%仅需5分钟,10%-97%需9分钟。性能方面,配备易三方三电机独立驱动,零百加速仅需3.7秒,并搭载云辇-A闭式双腔空悬。智能驾驶采用天神之眼5.0端到端大模型。计划到2026年底,闪充站将广泛覆盖各级城市。
谷歌Gemini桌面应用即将迎来重大功能更新。新增的“Stream to Cursor”功能类似上周Android Show上展示的“Magic Pointer”。Gemini Spark智能代理将能直接操作本地文件夹中的文件。此外,应用将引入被内部称为“Veo4 Omni”的新模型,并支持Skills技能体系。不过,Gemini Live实时功能目前仍在开发中,尚未可用。
腾讯于5月18日推出AI应用生成平台“吐司”,定位为探索型氛围编程产品。安卓版已上线,iOS版稍后推出,公测期间限时免费,后续通过分享任务提供更多次数。用户可用自然语言描述想法,AI自动拆解功能、生成原型并一键打包成App。平台提供创造应用、社交分享、灵感广场和应用搜索四大能力,聚焦灵感实现与共创,让无代码基础的用户也能创建应用,形成从想法到分发的闭环生态。
长城汽车旗下魏牌V9X正式上市,新车定位为“AI豪华六座旗舰”。首批推出3款超级Hi4插电混动车型,售价34.98万元起。该车基于全新归元S平台打造,提供标轴与长轴版本,动力搭载2.0T发动机与800V高压架构,零百加速达4秒级。座舱配备大屏与后排娱乐系统,智驾系统通过AI智能体技术实现了风险识别与可视化能力升级。据悉,新车未来还将推出HEV和EV版本。
理想汽车为AI眼镜Livis推送1.8.50固件升级,理想同学App同步升级至2.5.0。本次OTA更新新增5项功能,优化11项功能。全新理想L9首发支持通过AI眼镜语音指挥泊车,新增哨兵模式高风险提醒、英文唤醒词、语音唤醒开关及三种唤醒反馈选择。同时优化了蓝牙电话拨打体验、运动中视觉问答清晰度和视频颜色饱和度。
摩尔线程发布了MTT AICUBE智能硬件,聚焦家庭应用场景。该产品内置小麦智能体,支持用户通过语音指令点播影片、规划旅行行程,并可连接手柄畅玩《王者荣耀》《原神》等手游。其依托全功能GPU提供低延迟操控与即插即用体验,旨在填补国产GPU在端侧安卓生态的应用空白,并为开发者提供高性价比测试平台,以推动国产GPU生态的规模化落地。
群核科技与影石创新于5月18日达成战略合作,共同发布新一代空间重建解决方案。双方融合影石创新的高性能影像硬件与群核科技的3DGS空间重建技术,旨在降低3D内容创作门槛。用户通过影石设备采集影像后,上传至群核科技的Aholo空间智能平台,即可在几分钟内生成可交互的3D数字空间。该技术已在文旅文保、影视制作、游戏开发及空间设计等领域形成应用探索,目标是让空间智能更快融入日常生活。
华为小艺简报功能在Mate 80系列首发后,已逐步在Mate 70系列、Mate 60系列等老机型上恢复可用。该功能在每日6:00至24:00自动生成个人专属AI简报,涵盖全局待办、通知摘要、日程简报等八大模块。目前官方支持机型包括Pura 80/90系列、Mate 80/X7系列及nova 15系列等,旨在通过情景感知提供一站式信息聚合与全天候陪伴。
Meta为旗下雷朋Display智能眼镜推送了Update 125更新,正式全球上线肌电手环手写输入功能。用户通过配套的Meta Neural Band肌电手环,无需接触实体键盘,仅在空中做出书写动作即可实时输入文字,该功能已支持WhatsApp、Messenger等主流应用。本次更新还新增了可录制第一人称视角画面的显示录制功能,并升级了地图导航。
5月18日,小鹏汽车宣布其基于旗舰车型GX打造的首台Robotaxi量产车正式下线。该车被定义为中国首款全栈自研、前装量产的Robotaxi,也是国内首个采用纯视觉方案实现L4级自动驾驶的车型。车辆搭载4颗自研图灵AI芯片,提供高达3000TOPS的有效算力,为目前全球车端最高算力,并集成第二代VLA大模型。小鹏计划于今年下半年启动Robotaxi试点运营,目标在2027年初实现无需安全员的完全自主运营。
5月18日,豆包 App 在国际博物馆日上线“博物馆讲解”功能,用户点击对话框内按钮即可通过视频通话获得展品自动识别与个性化讲解。该功能支持轻声提问和“边走边听”模式,无需逐次交互。目前,豆包已合作覆盖中国国家博物馆、浦东美术馆等20余家博物馆和美术馆,并与其中5家机构达成深度合作,成为其重磅展览的官方AI讲解员。
亚马逊将其Rufus购物聊天机器人与Alexa+整合,正式推出全新购物助手Alexa for Shopping。该功能已部署至亚马逊应用、网站及Echo Show设备,可回答商品咨询、比价、追踪价格并设置购物提醒。助手还支持计划性购物操作及符合条件的自动购买服务。此次更新标志着Rufus从独立界面转为底层支持,进一步强化亚马逊在智能购物领域的生态整合。
中兴携手中国移动推出“二合一 5G 云电脑”逍遥 W200DS Pro 并正式上市。该产品本质为安卓平板,但可通过云端一键切换至 Windows 系统,在电脑与平板模式间灵活转换。硬件搭载 11.97 英寸 2K 屏幕、紫光展锐 T9100 处理器,配备 8GB 内存与 256GB 存储,内置 8000mAh 电池。产品预装 AI 工具,附赠 1 年云电脑服务,起售价为 2349 元。
You can now upload entire videos to Grok and have it analyze, summarize, translate, explain scenes, or extract important...
LG UltraGear evo 39GX950B 39英寸OLED显示器国行版重新上架并开启预售,定价12999元。该产品为全球首款39英寸5K2K OLED显示器,采用1500R曲率第四代Tandem OLED面板,峰值亮度1500nits。其支持5120×2160 165Hz与2560×1080 330Hz双模切换,色域覆盖99.5% DCI-P3。此外,它搭载免GPU端侧AI超分辨率技术,并支持AI场景优化与AI音频功能,配备了HDMI 2.1等丰富接口及内置双扬声器。
ORCA是一款新开源的Agent IDE,提供iOS及移动端客户端,支持多账号切换(例如多个ChatGPT订阅),并显示Token消耗与5小时重置信息。它能自动检测电脑中已安装的CLI工具,如Claude Code CLI、Codex CLI、Gemini CLI等,支持目录文件拖拽对话及内置Markdown预览。该工具优化了Tui工具的常见痛点,但安装包体积较大。开源地址及官网已公布。