微软 AI 部门 CEO 穆斯塔法·苏莱曼在昨天的播客节目中收回其此前“白领工作将在 12-18 个月内被 AI 完全自动化”的言论,改口称 AI 将帮助白领完成发邮件、与同事沟通、制作 PPT 等重复性任务,而非直接取代职业。他表示这些工作本身依赖人工且耗时,技术发展的方向是让生活更轻松、更高效,白领职位不会因此消失。
谷歌发布实时语音互译音频模型 Gemini 3.5 Live Translate,可自动识别 70 多种语言并保留说话者的语调、语速和音高。该模型连续生成语音,在提升翻译质量与跟上说话者节奏间取得平衡,全程仅慢几秒。开发者即日起可通过 Gemini Live API 和 Google AI Studio 使用公开预览版;企业客户本月起可在 Google Meet 中使用私有预览版;普通用户通过 Android 和 iOS 版谷歌翻译即可使用。Android 用户还将获得“聆听模式”,可将手机贴耳通过听筒收听翻译音频。
关联讨论 4 条Ars Technica:AI(RSS)X:Jeff Dean (@JeffDean)The Decoder:AI News(RSS)X:Berry Xia (@berryxia)Cohere近日发布North Mini Code,一款30B总参数(3B活跃参数)的开放权重编码模型,采用Apache 2.0开源协议。该模型在Artificial Analysis Intelligence Index上得分27.6,高于gpt-oss-20B (high)的24.5,略低于Mistral Small 4(119B参数,6.5B活跃)的27.8。在Coding Index(Terminal-Bench Hard和SciCode加权平均)上得分33.4,显著高于GLM-4.7-Flash的25.9,低于Qwen3.6 35B A3B的35.2。非编码智能体任务表现较弱:GDPval-AA 14%、τ²-Bench Telecom 37%。在Cohere API上推理速度约199 output tokens/s,快于同类模型。距Cohere上次发布Command A+不到一个月。
Excited to launch a new way to upskill with AI agents. This is how we are making it possible for anyone to learn to buil...
GitHub Copilot CLI 新增自定义 AI 智能体功能,使 CLI 能够理解开发者的技术栈和团队工作流,将一次性终端提示转变为可重复、可审查的流程。
管理 180 亿美元资产的对冲基金 Magnetar Capital 将在其最新基金中弃用人类分析师,转而部署数百个 AI 机器人来研究股票。
OpenAI 已秘密提交首次公开募股(IPO)申请,科技巨头纷纷竞逐资本市场。2026 年将成为大型科技公司集中上市之年。
关联讨论 11 条X:歸藏 (@op7418)OpenAI:官网动态(RSS · 排除企业/客户案例)IT之家(RSS)X:Testing Catalog (@testingcatalog)Bloomberg:Technology(RSS)X:Rohan Paul (@rohanpaul_ai)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)TechCrunch:AI(RSS)The Verge:AI(RSS)The Decoder:AI News(RSS)Google 推出 Gemini 3.5 Live Translate,一款实时语音转语音翻译模型。它在原说话者尚未说完时即开始翻译,无需等待完整句子。模型采用流式翻译,边听边更新结果,支持 70 多种语言,延迟仅数秒,并能保持语速、音高和语调。该功能通过 Gemini Live API、Google Meet 预览版以及 iOS/Android 版 Google Translate 应用推出。
Today, we released Gemini 3.5 Live Translate, our latest audio model for live speech-to-speech translation. It supports ...
关联讨论 4 条Ars Technica:AI(RSS)X:Jeff Dean (@JeffDean)The Decoder:AI News(RSS)X:Berry Xia (@berryxia)Anthropic 今日发布 Mythos 的公开版本,代号“Fable”。其成本约为 Opus 的两倍,低于此前预览版 5 倍 Opus 的定价。Fable 配备严格安全限制,在网络安全方面比 Project Glasswing 合作伙伴的受限预览版更保守,且在长时间、多步骤任务及智能体式工作流上表现更强。Mythos 预览版于 2026 年 4 月推出,是当时最强前沿模型,尤其擅长编程、推理和网络安全(含发现零日漏洞);因安全问题未公开,仅限 Project Glasswing 合作伙伴用于防御性网络安全,目前已报告发现数千个重大漏洞。
德国地方法院裁定,Google 对其 AI 概览生成的内容直接承担法律责任,不能援引搜索引擎运营商原有的有限责任保护。涉案 AI 概览错误地将两家出版商与欺诈行为关联,且相关声明未出现在任何链接来源中。该裁决可能为全球 AI 生成内容责任认定树立先例。
关联讨论 2 条Gary Marcus:The Road to AI We Can Trust(RSS)Hacker News 热门(buzzing.cc 中文翻译)SpaceX 计划将数据中心发射到太空,埃隆·马斯克在公司 IPO 前将其描述为一个近乎简单的工程问题。首颗 AI 卫星的性能将相当于单个 Nvidia GB300 机架。然而,谷歌的研究指出,真正的 AI 训练需要大约 10000 颗紧密联动的卫星。
SpaceX、Anthropic 和 OpenAI 均筹备大规模公开上市,科技行业或将诞生新的企业巨头缩写。告别 FAANG,迎来 MANGOS。
作者首次录制口播脚本推荐书籍《被讨厌的勇气》,使用Pocket3相机与免费提词器teleprompter,脚本由自制的书籍口播解读Skill生成(计划稍后开源),剪辑用剪映添加片头片尾,调色采用LUT文件CELLULOID_01_FU_LOW.cube。
Introducing the Fast Gemma Challenge with Hugging Face Over the next few days, dozens of agents will collaborate to make...
Gemini 2.5 Flash API 的定价与快速入门指南,指导用户配置 thinking budgets、比较不同提供商,并在 5 分钟内完成首次 API 调用。
关联讨论 1 条OpenRouter:Announcements(RSS)Elvis Saravia宣布DAIR.AI平台推出新型AI智能体技能提升方式,同步发布4个动手实验室:Agent Skills、Agentic Image Generation、30 Days of Hermes Agents、Prompt Engineering with Agents。旨在让任何人通过构建和获取高需求AI技能成为顶尖AI构建者,未来几周还将有更多内容上线。
Google AI 推出音频模型 Gemini 3.5 Live Translate,为开发者提供低延迟实时语音翻译,支持 70+ 种语言。模型具备多语言输入(同会话无需切换)、自动语言检测、原生音频处理(保留说话者语调、语速和音高)以及噪声鲁棒性(过滤环境噪音),可直接处理流式语音。
关联讨论 4 条Ars Technica:AI(RSS)X:Jeff Dean (@JeffDean)The Decoder:AI News(RSS)X:Berry Xia (@berryxia)欧盟要求Meta Platforms Inc. 暂时停止其涉嫌阻止竞争对手AI公司在WhatsApp商业服务上运营的政策。该命令针对Meta被指利用平台规则限制其他AI服务提供商接入企业版WhatsApp的行为。
亚洲最大外包商塔塔咨询服务(Tata Consultancy Services)将减少未来招聘规模,同时加大对AI智能体的使用。这一变化标志着印度劳动密集型外包产业正经历关键性转变。
富国银行认为,周五由科技股引发的抛售对投资者是一记“警钟”,凸显了涌入AI交易的风险。该机构警告,市场对人工智能相关股票的过度追捧可能带来隐患。
Introducing Searchmaxxing. The new discipline for being visible everywhere AI looks. Across all platforms. This is how b...
http://x.com/i/article/2057694226981257216
Google AI 推出 Gemini 3.5 Live Translate,一款面向实时语音到语音翻译的音频模型。该模型支持 70 多种语言,可在用户说话的同时开始翻译并流式输出译文,避免尴尬停顿或断续。模型通过毫秒级决策平衡速度与翻译质量,使对话流畅自然。它可边接收输入边输出翻译语音,延迟仅比说话者慢几秒,并能在长对话中维持语速、音高和语调。目前已在 iOS 和 Android 版 Google Translate 应用中上线。
关联讨论 4 条Ars Technica:AI(RSS)X:Jeff Dean (@JeffDean)The Decoder:AI News(RSS)X:Berry Xia (@berryxia)苹果在 WWDC 2026 大会上发布了折叠屏设备,该消息来自 Hacker News 的一篇热门文章,原文标题为“WWDC 2026: Apple is Folding”。
彭博社记者古尔曼报道,苹果在 WWDC26 推出全面改造的 Siri AI,覆盖 iOS 27、macOS 27、watchOS 27 和 visionOS 27。IDC 分析师称 WWDC26 是苹果的 AI 可信度测试,需让 AI 在生态中可信、有用且不打扰用户。发布会期间苹果股价下跌 1.9%。Siri AI 初期仅支持英语,秋季以测试版面向消费者,中国和欧盟用户暂无法使用。IDC 分析师表示这些功能将推动 iPhone 14 及更早机型用户升级。
Scoop: A neutered version of Mythos called Claude Fable is coming today. It's expensive-2x the price of Opus-but perhaps...
Mustafa Suleyman收回了此前关于AI将取代白领工作的评论,改口称AI将帮助这些工人完成任务,而非直接替代他们的岗位。
关联讨论 2 条The Verge:AI(RSS)The Verge:订阅版科技(RSS)Synopsys CEO Sassine Ghazi 在纽约 Mizuho 科技会议上表示,如今没有 Synopsys 的技术就无法设计任何芯片。他同时谈到人工智能的增长以及去年收购的工程软件公司 Ansys 的整合情况。
微软 AI 负责人 Mustafa Suleyman 在 Decoder 节目中澄清此前关于 AI 将取代白领工作的言论。他表示,AI 会帮助完成发邮件、与同事对话、制作 PPT 等子任务,使工作更快更高效,但并不意味着整个岗位消失。