AIHOT

全部动态

全部一手资讯 X 论文

5月19日周二

5月18日周一

5月19日

02:45

Emad@EMostaque

这个图表布局真有意思，非常喜欢！祝贺 @cursor_ai 团队发布 2.5 版本 🚀

Cursor: Composer 2.5 is exceptionally intelligent and up to 10x more efficient than similarly capable models.

产品更新编码

02:13

ClaudeDevs@ClaudeDevs

精选70

提示缓存诊断现已在Claude控制台上线。当请求未命中缓存时，您现在可以准确查看提示的哪一部分发生了变化，以及这消耗了多少令牌。

Anthropic产品更新编码

推荐理由：以前缓存失效只能瞎猜，现在能精确看到哪个 prompt 片段变了、浪费了多少 token，对重度依赖 Claude API 节省成本的开发者很实用。

01:26

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选65

OpenAI与Dell合作将Codex引入混合及本地企业环境

OpenAI与Dell达成合作，将Codex编程代理引入企业混合云及本地部署环境。该合作旨在帮助企业在自身数据和业务流程中安全集成AI编码能力，强化对敏感数据的管控。此举标志着企业级AI工具部署方式的重要扩展，为受监管行业提供了符合数据主权要求的解决方案。

OpenAI产品更新编码部署/工程

推荐理由：Codex 进企业本地部署这步棋走得稳，但不算惊喜，对数据安全有硬要求的团队可以跟进下 Dell 的硬件方案。

01:19

🚨 AI News | TestingCatalog@testingcatalog

Cursor发布了其迄今最强大的模型Composer 2.5。官方强调，该模型在性能上可与Opus 4.7比肩，并实现了高达10倍的成本效率提升。Composer 2.5在智能性、处理长时任务的持续工作能力以及遵循复杂指令的可靠性方面均有显著改进。作为发布福利，该模型在未来一周内的使用额度将加倍。

Cursor: Introducing Composer 2.5, our most powerful model yet. It's more intelligent, better at sustained work on long-running t...

Anthropic产品更新推理编码

00:59

GitHub Blog

精选69

将你的本地GitHub会话带到任何地方

GitHub为Copilot功能推出了远程控制会话能力，并已全面上线。该功能允许用户在VS Code或命令行中启动Copilot任务后，可随时随地通过github.com网站或GitHub Mobile移动端应用继续操作，实现了开发工作流从桌面端到移动端的无缝衔接。此更新增强了开发者在不同场景下的灵活性和工作效率。

GitHub产品更新编码

推荐理由：Copilot跨设备会话看起来是个小功能，但它解决了开发者切换设备时的心流中断问题，这种对工作连续性的打磨比单纯堆性能更聪明。

00:51

Cursor Blog

精选74

Composer 2.5 发布与技术解析

Cursor 平台发布了智能与行为表现大幅提升的 Composer 2.5。该模型更擅长执行复杂指令和长期任务。其改进基于训练规模的扩大、更复杂的强化学习环境及新的学习方法。关键技术包括：使用文本反馈进行针对性强化学习以纠正具体错误；采用基于真实代码库、规模达前代25倍的合成数据进行训练；并引入分片Muon优化器等新架构。模型基于Moonshot的开源检查点构建。开发团队正合作训练一个计算量十倍的更大模型，并在大规模训练中发现了新型奖励作弊问题。

智能体产品更新编码

关联讨论 5 条

推荐理由：Cursor的Composer 2.5不只是换个模型，它在长任务上的耐性和指令跟随的准确性提升肉眼可见，训练细节里藏的’文本反馈修正‘方法，对做AI产品的应该会有所启发。

00:50

Elon Musk@elonmusk

精选71

马斯克在推文中请求帮助提升 Grok Build。用户 @morganlinton 分享了使用 Grok Build 完成 PasteLocal 项目中 relay 功能开发的体验，称赞其全面性令人惊叹。该功能实现周期短，且包含了端到端加密、数据持久化、自动同步、双向命令行交互等关键技术特性，并经过了多轮严格的代码审查与修复。马斯克此举意在收集更广泛的反馈，以持续改进该开发工具。

Morgan: Phew, Grok Build is really thorough, pretty incredible. Relay feature for PasteLocal is done, pushing to Github now. And...

xAI产品更新开源/仓库

推荐理由：below_threshold:T2 推文门槛 75,当前 finalScore=71

00:42

Rohan Paul@rohanpaul_ai

语音AI可能是提升几乎所有办公室岗位生产力的最大助力

PolyAI现已向所有企业开发者开放其Agentic Dialog平台，将语音AI服务从高昂的年度合约变为可通过终端免费试用的产品。该平台的核心目标并非语音识别，而是攻克在通话中动态追踪复杂、多变的人类意图这一难题。其专有模型Raven将代理行为直接内置于模型本身，避免了冗长提示词在复杂对话中的失效问题。该模型已为FedEx等大品牌处理超10亿次对话。平台支持集成Raven或GPT-5等外部模型，使任何团队都能轻松构建、测试并部署企业级对话智能体。

PolyAI: Starting today, we're opening our Agentic Dialog Platform to every enterprise builder. Our dialog agents have resolved 1...

智能体产品更新语音

00:20

Elon Musk@elonmusk

xAI更新了Grok的Agent模式，这被视为其能力的一次重大提升。该模式显著简化了AI视频创作流程。基于Grok Imagine，创作者能更流畅地制作视频，并借助Grok的理解能力完成素材生成与对话，无需额外配音，极大节省了时间成本。据早期测试，生成视频的写实效果良好，且图片参考等功能增强了实用性。这标志着AI在自动化、高质量内容生成领域取得了新的进展。

Déborah: I've finished a video of just over 4 minutes, entirely created using Grok Imagine's Agent mode (see image). It's a much ...

智能体xAI产品更新图像生成

5月18日

23:52

Hugging Face：Blog（RSS）

精选68

PaddleOCR 3.5：使用Transformers后端运行OCR和文档解析任务

PaddleOCR 发布 3.5 版本，正式将 Transformers 确立为运行 PP-OCRv5 及 PaddleOCR-VL 1.5 模型的可选推理后端之一。此次更新引入了更灵活的 `engine` 与 `engine_config` 参数，允许开发者自主选择后端并配置数据类型、设备等选项。其核心价值在于，显著降低了将文档处理能力集成至以 Transformers 为中心的主流开发栈（如 RAG、智能体、文档AI）的门槛，使开发者能更便捷地利用现有生态，减少集成阻力，从而专注于下游应用构建。

Hugging Face检索增强产品更新多模态

推荐理由：PaddleOCR 3.5 最大的变化不是新模型，而是终于能跑在 Transformers 上了，做 RAG 和文档智能的开发者可以少写一堆胶水代码。