AIHOT

全部动态今日 246 条

6月10日周三

6月9日周二

6月10日

00:35

Microsoft Research@MSFTResearch

在《Nature Methods》上发表的最新研究来自Project Ex Vivo，表明AI模型从多样化的细胞状态中学到的知识，比仅从规模化数据集中学到的更多，这一发现可能重塑疗法与患者的匹配方式。https：//msft.it/6013vgE8l

Microsoft数据/训练论文/研究

00:35

OpenRouter@OpenRouter

精选73

想要在Cursor中使用OpenRouter吗？这里有一份集成指南：https：//openrouter.ai/docs/cookbook/coding-agents/cursor-integration

教程/实践编码

推荐理由：用 Cursor 又想用 OpenRouter 上 Claude 4.6 或 Llama 4 的开发者，这篇指南帮你打通关键配置，不是大新闻但值得收藏

00:35

Google Gemini@GeminiApp

Gemini 3.5 Flash 能处理复杂视觉数据，并将其转化为功能性的交互式代码。观看 Gemini 分析参考图像中的光照，并构建一个交互式 3D 可视化器来预览该设置。

Google产品更新多模态编码

00:33

jason@jxnlco

你在使用Codex创建PDF时遇到了哪些问题？

OpenAI其他编码

00:26

IT之家（RSS）

微软 AI CEO 苏莱曼改口，收回"AI 将于 18 个月内取代大部分白领工作"言论

微软 AI 部门 CEO 穆斯塔法·苏莱曼在昨天的播客节目中收回其此前“白领工作将在 12-18 个月内被 AI 完全自动化”的言论，改口称 AI 将帮助白领完成发邮件、与同事沟通、制作 PPT 等重复性任务，而非直接取代职业。他表示这些工作本身依赖人工且耗时，技术发展的方向是让生活更轻松、更高效，白领职位不会因此消失。

Microsoft大佬观点现象/趋势

00:26

IT之家（RSS）

谷歌发布实时语音互译模型 Gemini 3.5 Live Translate，谷歌翻译 App 即用

谷歌发布实时语音互译音频模型 Gemini 3.5 Live Translate，可自动识别 70 多种语言并保留说话者的语调、语速和音高。该模型连续生成语音，在提升翻译质量与跟上说话者节奏间取得平衡，全程仅慢几秒。开发者即日起可通过 Gemini Live API 和 Google AI Studio 使用公开预览版；企业客户本月起可在 Google Meet 中使用私有预览版；普通用户通过 Android 和 iOS 版谷歌翻译即可使用。Android 用户还将获得“聆听模式”，可将手机贴耳通过听筒收听翻译音频。

Google多模态模型发布语音

关联讨论 4 条

00:20

The Verge：订阅版科技（RSS）

Apple 正在接受 AI 照片编辑的设想

Apple 正在接受 AI 照片编辑的设想，并对“什么是照片”这一概念提出新想法。

产品更新图像生成

00:20

Artificial Analysis@ArtificialAnlys

Cohere发布North Mini Code：30B总参数（3B活跃）开源编码模型

Cohere近日发布North Mini Code，一款30B总参数（3B活跃参数）的开放权重编码模型，采用Apache 2.0开源协议。该模型在Artificial Analysis Intelligence Index上得分27.6，高于gpt-oss-20B (high)的24.5，略低于Mistral Small 4（119B参数，6.5B活跃）的27.8。在Coding Index（Terminal-Bench Hard和SciCode加权平均）上得分33.4，显著高于GLM-4.7-Flash的25.9，低于Qwen3.6 35B A3B的35.2。非编码智能体任务表现较弱：GDPval-AA 14%、τ²-Bench Telecom 37%。在Cohere API上推理速度约199 output tokens/s，快于同类模型。距Cohere上次发布Command A+不到一个月。

开源生态模型发布编码

00:19

elvis@omarsar0

Elvis Saravia（DAIR.AI）宣布推出一个以AI智能体为核心的新技能提升平台。首批上线四个动手实验：Agent Skills、Agentic Image Generation、30 Days of Hermes Agents、Prompt Engineering with Agents。Saravia指出，Hermes Agent与Nemotron 3 Ultra搭配使用效果强劲，称其为"强大的组合"。更多内容将在未来数周陆续上线。

elvis: Excited to launch a new way to upskill with AI agents. This is how we are making it possible for anyone to learn to buil...

智能体产品更新教程/实践

00:18

GitHub Blog

精选68

GitHub Copilot CLI 推出自定义 AI 智能体，将一次性终端提示转化为可重复工作流

GitHub Copilot CLI 新增自定义 AI 智能体功能，使 CLI 能够理解开发者的技术栈和团队工作流，将一次性终端提示转变为可重复、可审查的流程。

智能体GitHub教程/实践编码

推荐理由：GitHub Copilot CLI 的自定义代理把一次性提示变成可重复工作流，相当于给命令行配了个 AI 副驾驶，做自动化的朋友值得一试。

00:17

Bloomberg：Technology（RSS）

Magnetar Capital 新基金将用 AI 机器人取代人类分析师

管理 180 亿美元资产的对冲基金 Magnetar Capital 将在其最新基金中弃用人类分析师，转而部署数百个 AI 机器人来研究股票。

智能体行业动态

00:17

Bloomberg：Technology（RSS）

精选87

OpenAI 秘密提交 IPO 申请，科技巨头争相上市融资

OpenAI 已秘密提交首次公开募股（IPO）申请，科技巨头纷纷竞逐资本市场。2026 年将成为大型科技公司集中上市之年。

OpenAI行业动态

关联讨论 11 条

推荐理由：OpenAI秘密提交IPO，意味着AI竞赛正式进入资本市场。这对行业格局的冲击可能比任何一次模型发布都大，钱袋子永远是终极杠杆。

00:16

AK@_akhaliq

SpatialWorld 评测多模态智能体在真实世界任务中的交互式空间推理能力

智能体Hugging Face多模态论文/研究

00:15

Rohan Paul@rohanpaul_ai

Google 发布 Gemini 3.5 Live Translate 实时语音翻译模型

Google 推出 Gemini 3.5 Live Translate，一款实时语音转语音翻译模型。它在原说话者尚未说完时即开始翻译，无需等待完整句子。模型采用流式翻译，边听边更新结果，支持 70 多种语言，延迟仅数秒，并能保持语速、音高和语调。该功能通过 Gemini Live API、Google Meet 预览版以及 iOS/Android 版 Google Translate 应用推出。

Google AI: Today, we released Gemini 3.5 Live Translate, our latest audio model for live speech-to-speech translation. It supports ...

Google多模态模型发布语音

关联讨论 4 条

00:15

Rohan Paul@rohanpaul_ai

Anthropic 今日发布 Mythos 公开版"Fable"，定价为 Opus 两倍

Anthropic 今日发布 Mythos 的公开版本，代号“Fable”。其成本约为 Opus 的两倍，低于此前预览版 5 倍 Opus 的定价。Fable 配备严格安全限制，在网络安全方面比 Project Glasswing 合作伙伴的受限预览版更保守，且在长时间、多步骤任务及智能体式工作流上表现更强。Mythos 预览版于 2026 年 4 月推出，是当时最强前沿模型，尤其擅长编程、推理和网络安全（含发现零日漏洞）；因安全问题未公开，仅限 Project Glasswing 合作伙伴用于防御性网络安全，目前已报告发现数千个重大漏洞。

智能体Anthropic安全/对齐推理

00:15

The Decoder：AI News（RSS）

精选77

里程碑式德国裁决：Google AI Overviews 被视为谷歌自身言论，需为错误回答承担责任

德国地方法院裁定，Google 对其 AI 概览生成的内容直接承担法律责任，不能援引搜索引擎运营商原有的有限责任保护。涉案 AI 概览错误地将两家出版商与欺诈行为关联，且相关声明未出现在任何链接来源中。该裁决可能为全球 AI 生成内容责任认定树立先例。

Google搜索政策/监管

关联讨论 2 条

推荐理由：德国法院这一刀砍得精准，直接把 AI Overviews 定性为 Google 自己的话而非第三方内容，虚假回答就得自己扛。这对全球 AI 生成内容的责任认定都是个风向标。

00:15

The Decoder：AI News（RSS）

SpaceX 计划将数据中心送入轨道，马斯克称这只是个小工程问题

SpaceX 计划将数据中心发射到太空，埃隆·马斯克在公司 IPO 前将其描述为一个近乎简单的工程问题。首颗 AI 卫星的性能将相当于单个 Nvidia GB300 机架。然而，谷歌的研究指出，真正的 AI 训练需要大约 10000 颗紧密联动的卫星。

行业动态部署/工程

00:14

Ethan Mollick@emollick

这值得一读。

Noam Brown: http://x.com/i/article/2057694226981257216

其他大佬观点

00:12

TechCrunch：AI（RSS）

不再是 FAANG 了，现在是 MANGOS

SpaceX、Anthropic 和 OpenAI 均筹备大规模公开上市，科技行业或将诞生新的企业巨头缩写。告别 FAANG，迎来 MANGOS。

AnthropicOpenAI现象/趋势

00:12

向阳乔木@vista8

推荐《被讨厌的勇气》并分享口播录制工具与技巧

作者首次录制口播脚本推荐书籍《被讨厌的勇气》，使用Pocket3相机与免费提词器teleprompter，脚本由自制的书籍口播解读Skill生成（计划稍后开源），剪辑用剪映添加片头片尾，调色采用LUT文件CELLULOID_01_FU_LOW.cube。

开源/仓库教程/实践

00:09

Suno@suno

我们自豪地分享，我们的 CEO Mikey 已被评为 2026 Tech Power Player！！！阅读 @bostonglobe 文章：http：//Globe.com/tech50

行业动态

00:05

Logan Kilpatrick@OfficialLoganK

Introducing Gemini 3.5 Flash Live Translate，我们的实时语音到语音翻译模型，支持超过 70 种语言（输入和输出），并且非常自然。现在已在 Gemini API、AI Studio 和 Google 翻译中可用，并即将登陆 Google Meet！

Google多模态模型发布语音

关联讨论 4 条

00:05

fofr@fofrAI

我让我的 foffee 智能体帮忙加速 Gemma。我感觉自己像个骄傲的家长。 https：//huggingface.co/spaces/gemma-challenge/gemma-dashboard

Google Gemma: Introducing the Fast Gemma Challenge with Hugging Face Over the next few days, dozens of agents will collaborate to make...

智能体GoogleHugging Face开源生态

00:00

OpenRouter：Announcements（RSS）

精选72

Gemini 2.5 Flash API：定价、快速入门与提供商对比

Gemini 2.5 Flash API 的定价与快速入门指南，指导用户配置 thinking budgets、比较不同提供商，并在 5 分钟内完成首次 API 调用。

Google教程/实践部署/工程

关联讨论 1 条

推荐理由：OpenRouter 这篇把 Gemini 2.5 Flash 的 quickstart 和供应商价格表打包了，5 分钟跑通，价格对比部分尤其实在，想省钱的可以对着选。

6月9日

23:49

elvis@omarsar0

DAIR.AI推出4个AI智能体实践实验室

Elvis Saravia宣布DAIR.AI平台推出新型AI智能体技能提升方式，同步发布4个动手实验室：Agent Skills、Agentic Image Generation、30 Days of Hermes Agents、Prompt Engineering with Agents。旨在让任何人通过构建和获取高需求AI技能成为顶尖AI构建者，未来几周还将有更多内容上线。

智能体教程/实践

23:47

Google AI Developers@googleaidevs

Google 发布 Gemini 3.5 Live Translate 实时语音翻译模型

Google AI 推出音频模型 Gemini 3.5 Live Translate，为开发者提供低延迟实时语音翻译，支持 70+ 种语言。模型具备多语言输入（同会话无需切换）、自动语言检测、原生音频处理（保留说话者语调、语速和音高）以及噪声鲁棒性（过滤环境噪音），可直接处理流式语音。

Google多模态模型发布语音

关联讨论 4 条

23:47

Bloomberg：Technology（RSS）

欧盟命令Meta暂停WhatsApp限制AI竞争对手的政策

欧盟要求Meta Platforms Inc. 暂时停止其涉嫌阻止竞争对手AI公司在WhatsApp商业服务上运营的政策。该命令针对Meta被指利用平台规则限制其他AI服务提供商接入企业版WhatsApp的行为。

Meta政策/监管

23:47

Bloomberg：Technology（RSS）

精选71

塔塔咨询服务将因AI智能体应用放缓招聘，亚洲外包业迎来转折

亚洲最大外包商塔塔咨询服务（Tata Consultancy Services）将减少未来招聘规模，同时加大对AI智能体的使用。这一变化标志着印度劳动密集型外包产业正经历关键性转变。

智能体现象/趋势行业动态

推荐理由：TCS作为亚洲最大外包商宣布减缓招聘，转向AI agents，这基本宣告了印度IT外包的人力时代开始落幕，所有外包从业者都该看看。

23:47

Bloomberg：Technology（RSS）

AI抛售是投资者"警钟"，富国银行称

富国银行认为，周五由科技股引发的抛售对投资者是一记“警钟”，凸显了涌入AI交易的风险。该机构警告，市场对人工智能相关股票的过度追捧可能带来隐患。

现象/趋势行业动态

23:45

Rohan Paul@rohanpaul_ai

Crowdreply 推出 Searchmaxxing，一种让品牌在所有 AI 搜索平台都可见的新策略。Rohan Paul 称这基本上是营销领域的 Claude。

CrowdReply: Introducing Searchmaxxing. The new discipline for being visible everywhere AI looks. Across all platforms. This is how b...

其他大佬观点

23:38

Noam Brown@polynoamial

自 @OpenAI o1 以来，我们就知道 LLM 测试时计算缩放。然而两年后，实验室仍在报告模型的标量评测；安全组织仍对某个脚手架通过 100 倍推理表现更好感到惊讶；而 RSP 在决定关键阈值时仍忽略推理预算。

Noam Brown: http://x.com/i/article/2057694226981257216

OpenAI大佬观点安全/对齐评测/基准

23:37

Google AI@GoogleAI

Google AI 发布 Gemini 3.5 Live Translate 实时语音翻译模型

Google AI 推出 Gemini 3.5 Live Translate，一款面向实时语音到语音翻译的音频模型。该模型支持 70 多种语言，可在用户说话的同时开始翻译并流式输出译文，避免尴尬停顿或断续。模型通过毫秒级决策平衡速度与翻译质量，使对话流畅自然。它可边接收输入边输出翻译语音，延迟仅比说话者慢几秒，并能在长对话中维持语速、音高和语调。目前已在 iOS 和 Android 版 Google Translate 应用中上线。

Google多模态模型发布语音

关联讨论 4 条

23:37

Hacker News 热门（buzzing.cc 中文翻译）

苹果在 WWDC 2026 推出折叠屏设备

苹果在 WWDC 2026 大会上发布了折叠屏设备，该消息来自 Hacker News 的一篇热门文章，原文标题为“WWDC 2026: Apple is Folding”。

其他

23:35

Google DeepMind@GoogleDeepMind

精选69

说 hello， hola，你好--欢迎 Gemini 3.5 Live Translate：我们最新的音频模型，专为快速跨语言交流而构建。🌐

Google模型发布语音

关联讨论 4 条

推荐理由：Google 这个实时翻译模型把语音+翻译+大模型拧成了一股绳，虽然具体怎么用还不清楚，但做跨境、做语音助手的同学可以把它当个方向标。

23:34

Google DeepMind：Blog（RSS）

Fluid， natural voice translation with Gemini 3.5 Live Translate

23:26

IT之家（RSS）

WWDC26 苹果推出全面改造的 Siri AI，IDC 称其为 AI 可信度测试

彭博社记者古尔曼报道，苹果在 WWDC26 推出全面改造的 Siri AI，覆盖 iOS 27、macOS 27、watchOS 27 和 visionOS 27。IDC 分析师称 WWDC26 是苹果的 AI 可信度测试，需让 AI 在生态中可信、有用且不打扰用户。发布会期间苹果股价下跌 1.9%。Siri AI 初期仅支持英语，秋季以测试版面向消费者，中国和欧盟用户暂无法使用。IDC 分析师表示这些功能将推动 iPhone 14 及更早机型用户升级。

现象/趋势语音

23:21