AIHOT

全部动态资讯 · 9010 条

6月11日周四

6月11日

22:59

HuggingFace Daily Papers（社区热门论文）

视觉语言模型（VLM）将图像投影为大量视觉token，导致推理时注意力计算与KV缓存开销高昂。现有方法遵循“排序‑移除”范式，但token重要性随解码器深度变化，早期丢弃的token可能在后续层变得关键。Reroute是一种无需训练的可插拔模块，将永久移除替换为可恢复路由：被延迟的token绕过当前解码阶段，在下一路由决策时重新进入候选池。在LLaVA‑1.5与Qwen骨干上对FastV、PDrop和Nüwa变体的实验表明，Reroute在激进token压缩下提升了grounding能力，同时保持通用VQA性能。

多模态推理论文/研究

22:52

TechCrunch：AI（RSS）

DoorDash 新 AI 聊天机器人 Ask DoorDash 支持通过提示词和照片下单

DoorDash 推出名为 Ask DoorDash 的 AI 聊天机器人，用户可以用自己的话搜索应用，或通过提示词和照片直接下单，无需逐页浏览餐厅和商店来构建购物车。

产品更新多模态搜索

22:32

IT之家（RSS）

Anthropic 调整 Claude Fable 5 面向研究员的"降智"措施

Anthropic 发布 Claude Fable 5 后，因在用户不知情下限制竞争对手使用该模型开发 AI 模型而遭社区反对。Anthropic 致歉并调整措施：将安全防护改为对用户可见。此前，用户询问网络安全、生物学或化学问题会被转给较弱模型；面向前沿 AI 研究人员原本会在不知情时被降低性能。新措施下，若怀疑用户试图用 Claude 构建高能力 AI，将明确提醒系统会拒绝请求或转到较弱模型。服务条款仍禁止使用 Claude 训练竞争性 AI 模型。

Anthropic安全/对齐行业动态

22:31

Runway：News（网页）

精选72

Runway与Lionsgate扩大战略合作

全球内容巨头Lionsgate与生成式AI研究公司Runway今日宣布扩大战略合作。Lionsgate已取得Runway股权，双方将启动联合开发项目，共同创作并制作新IP，首推一部基于Lionsgate现有IP和Runway生成模型的短剧系列。此外，Lionsgate将作为主持伙伴参与6月举行的Runway AI电影节。这是双方继2024年9月首次合作后的深化，Lionsgate此前已在预可视化、故事板及最终帧制作中应用Runway工具。

行业动态视频

关联讨论 1 条

推荐理由：好莱坞第一次有片厂拿股权绑定 AI 公司，不是工具采购而是共创 IP，影视行业的 AI 态度正在从「用一下」变成「绑一起」，值得关注。

22:17

Hacker News 热门（buzzing.cc 中文翻译）

为什么人工智能没有取代软件工程师，而且将来也不会

Hacker News 上一则观点认为，人工智能并未取代软件工程师，并且将来也不会。该帖子获得了 103 个 HN Points。

现象/趋势编码

21:59

HuggingFace Daily Papers（社区热门论文）

SKIM：面向大语言模型的自适应多分辨率程序性技能压缩框架

可复用的自然语言技能被频繁调用时，将完整文本放入每个上下文会显著增加预填充成本和延迟。SKIM（SKIll coMpression）是一种自适应多分辨率软token压缩框架，专为程序性技能设计。它根据每项技能的复杂度生成不同数量的软token，在提升LLM推理效率的同时保留技能使用效果。实验表明，SKIM将技能压缩至原始token长度的30%到60%，且在任务性能上优于现有压缩方法。代码已开源。

推理论文/研究部署/工程

21:45

Gary Marcus：The Road to AI We Can Trust（RSS）

精选58

OpenAI 正酝酿"大幅"降价，Gary Marcus 视其为示弱信号

OpenAI 正考虑大幅降价，Gary Marcus 认为这暴露了公司的疲软竞争力。

OpenAI大佬观点

关联讨论 3 条

推荐理由：Gary Marcus 独家爆料 OpenAI 考虑大幅降价，仅一句话定调“这是疲软迹象”。没有细节但切中最大悬念，降价是对竞争压力的妥协还是战略主动，值得点开保持怀疑地看。