AIHOT

全部动态一手 · 2416 条

全部一手资讯 X 论文

4月23日周四

4月22日周三

4月21日周二

4月20日周一

4月23日

18:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选63

如何使用Codex进行日常工作

该内容探索了10个实用的ChatGPT Codex用例，旨在自动化任务、创建交付物，并将真实的输入转化为跨工具、文件和工作流的输出。

OpenAI教程/实践编码

推荐理由：虽然发布一月有余，但官方整理的十个 Codex 日常自动化用例依然是最佳上手模板，从邮件整理到数据报表，产品人和运营可以直接抄作业。

17:50

公众号：腾讯混元

精选67

Hy3 preview发布并开源：混元重建后首个模型，Agent能力大幅提升

智能体开源/仓库模型发布

关联讨论 1 条

推荐理由：混元重建后的第一枪，Agent能力大幅提升且直接开源，虽然已过首发热度，但对关注国产模型Agent能力的人还是个值得拉下来跑的repo。

12:06

公众号：MiniMax（稀宇科技）

想象力也是生产力：MiniMax 在戛纳见证一种新的生产关系

MiniMax 在戛纳电影节展示了其 AI 技术与内容生成能力，强调“想象力也是生产力”的理念。活动聚焦于 AI 如何改变创意生产的工作流，并探索人机协作下新型生产关系的形成。

行业动态

10:00

公众号：阶跃星辰（Step）

官宣！阶跃和千里科技，达成全面战略合作！

多模态端侧行业动态

08:00

Google Developers Blog（RSS）

精选59

使用 LiteRT 与 NPU 构建现实世界中的设备端人工智能

LiteRT 是一个生产就绪的框架，旨在帮助移动开发者充分发挥神经处理单元（NPU）的效能，以突破传统 CPU 或 GPU 在性能与电池续航上的瓶颈。该框架通过提供统一的 API 来屏蔽底层硬件复杂性，已成功助力 Google Meet、Epic Games 等行业领先者高效部署复杂的 AI 模型，实现实时视频处理、动画生成与语音识别等高级功能。此外，平台还提供基准测试工具并具备跨平台兼容性，能够支持 AI 应用无缝部署于移动设备、AI PC 及工业物联网硬件等多种终端。

Google产品更新端侧部署/工程

推荐理由：Google 把 LiteRT 从实验品推到生产级，统一 NPU 调用 API，做端侧 AI 的开发者终于不用逐家适配芯片了。虽然不是新概念，但 Google Meet 和 Epic Games 已经在用，说明不是 PPT。

08:00

Hugging Face：Blog（RSS）

精选57

如何在 Chrome 扩展中使用 Transformers.js

本文介绍在 Chrome 扩展中集成 Transformers.js 库的具体方法，涵盖从环境配置、模型加载到前后端通信的关键步骤。通过示例代码演示了如何利用该库在扩展中实现本地机器学习推理，同时处理扩展权限限制与安全策略。文中还对比了 Web Worker 与 Service Worker 两种部署方案，并提供了性能优化建议，帮助开发者在浏览器扩展环境中高效运行 Transformer 模型。

开源生态教程/实践端侧

推荐理由：Hugging Face 官方出的 Transformers.js 浏览器插件教程，想在 Chrome 里跑端侧推理的前端开发者可以直接抄，省掉自己踩坑的时间。

08:00

蚂蚁百灵：Developer Blog（网页）

精选67

Ling-2.6-flash 发布：更快响应、更强执行、更高 Token Efficiency

针对智能体任务中Token消耗快速增长的问题，Ling-2.6-flash模型正式发布。该模型采用混合线性架构等技术进行系统性优化，旨在实现更高推理效率和更低使用成本。其推理速度在4卡H20条件下最快可达340 tokens/s，在Artificial Analysis评测中仅消耗约对比模型1/10的Tokens。模型在多个Agent相关基准测试中达到同尺寸SOTA水平，保持了强大的任务执行与工具调用能力。

智能体模型发布部署/工程

关联讨论 5 条

推荐理由：蚂蚁百灵这次打的是「省 token」这张牌，104B 总参但只激活 7.4B，Agent 场景评测对齐同尺寸 SOTA，输出 token 消耗只有竞品的 1/10。做 Agent 产品、被推理成本卡脖子的团队值得认真看看这个路线。