GPT-Rosalind 在生命科学研究领域推出新功能,增强了生物推理、药物化学专业知识、基因组学分析以及实验工作流处理能力。
关联讨论 3 条OpenAI:官网动态(RSS · 排除企业/客户案例)X:Sam Altman (@sama)X:OpenAI (@OpenAI)Diameter Capital Partners联合创始人兼管理合伙人Scott Goodwin周三在彭博全球信用论坛上表示,由AI驱动的繁荣终将放缓,但目前尚未到转折点。市场压力正积聚泡沫,但资本支出热潮仍将持续。
Gemma 4 12B 是 Google DeepMind 推出的开源模型,原生支持处理文本、图像和音频,仅需 16GB RAM 即可在笔记本上运行。在基准测试中几乎追平两倍参数规模的 26B 模型,采用 Apache 2.0 许可证,可用于商业用途。
关联讨论 4 条Google Developers Blog(RSS)X:Google AI for Developers (@googleaidevs)X:Jeff Dean (@JeffDean)Hacker News 热门(buzzing.cc 中文翻译)Cursor Enterprise 正式推出 Organizations 结构,允许企业在统一面板中管理多个团队。每个团队可独立设置预算、安全策略、模型访问和功能控制。新增 Groups 作为跨团队或团队内的轻量级用户集合,用于分段管理模型访问、花销上限和智能体权限,不同设置取最宽松权限生效。管理员可创建沙箱团队预先测试新功能,再向全公司推送;也可按部门划分模型访问和预算。组织级仪表盘汇总所有团队的 token 用量与花费,支持按团队、用户等维度筛选。身份提供商和 SCIM 目录在组织层面一次配置,成员自动同步。该功能现已全面开放给所有 Enterprise 客户。
Nvidia CEO 谈及芯片路线图时表示,规划中的 N2X 和 N3X 芯片旨在实现《星际迷航》计算机级别的能力,并援引剧中工程师 Scotty 与计算机对话的场景作比。目前尚未公布具体参数或发布时间。
Nvidia 与 Microsoft 合作推出 RTX Spark,再次试图打造笔记本电脑的核心组件,并承诺为 Windows PC 带来数十年来最大的变革。
Google 首次在 Search Console 中为网站运营者提供关闭 AI Overviews 和 AI Mode 等 AI 搜索功能的开关,这两项功能已覆盖超过 35 亿月活用户。新的表现报告将展示次数单独列出。此举由英国竞争与市场管理局(CMA)推动,该机构认为网站运营者在当前局面下处于严重劣势。
Alphabet 通过股票发行筹集 850 亿美元,用于其 Google AI 业务,这是公司史上最大规模的融资。这一举动暗示投资者对 AI 相关投资具有强烈需求。
关联讨论 4 条Bloomberg:Technology(RSS)TechCrunch:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Rohan Paul (@rohanpaul_ai)DoubleLine全球发达信用债主管Robert Cohen在纽约彭博全球信贷论坛上警告,AI债务几乎必然将达到泡沫水平。
Gemma 4 12B 采用新的编码方案与 token 预测,实现了超越自身参数规模的性能表现。该模型专为在 16GB RAM 的笔记本电脑上本地运行而设计。
一篇教程介绍如何通过注册模块化函数,并在Workers、Functions和Cron Triggers等多个触发器间复用这些函数,使用iii构建文档智能后端。该文章展示了模块化注册与跨触发器复用的核心方法。
Google 推出 Dreambeans,这是一个从用户 Google 账户个人数据中筛选出的 AI 插图“故事”合集。
优步将 AI 工具每月使用上限定为 1500 美元,这一做法为行业 AI 工具定价提供了有价值的参考信号。
DoubleLine 投资组合经理 Robert Cohen 指出,参照铁路和互联网等重投资领域的历史,AI 债务几乎必然会最终达到泡沫水平。
GoldenTree Asset Management创始人兼首席投资官Steven Tananbaum在彭博全球信贷论坛上表示,信贷市场将继续低迷,但仍存在一些机会。他还指出,AI融资正演变为一场军备竞赛。
Alphabet(谷歌母公司)将股权融资规模从两日前宣布的800亿美元上调至847.5亿美元,以资助不断增长的AI支出计划。
关联讨论 4 条Bloomberg:Technology(RSS)TechCrunch:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Rohan Paul (@rohanpaul_ai)Google Research 在 GitHub 开源了其水文建模框架,这是一个基于 PyTorch 的 Python 包,采用与 Flood Hub 河段洪水预报相同的模型架构和训练数据。该框架允许研究者和预报员训练 AI 洪水预报模型、添加新模型与数据,并已与捷克水文气象研究所(CHMI)等合作测试。开放模型架构和训练管线旨在让各国气象水文部门在保留数据完全控制权的同时,整合基于 AI 的洪水预报。
Gemma 4 12B 是 Google DeepMind 发布的无需编码器的多模态模型,直接将视觉和音频输入大语言模型骨干,支持原生音频,可在 16 GB 笔记本电脑上本地运行,采用 Apache 2.0 开源许可。
Ideogram 发布 4.0 版本文本到图像模型,采用开放权重,支持原生2K分辨率、边界框控制和改进的文本渲染。在 DesignArena 排行榜上,该模型位列所有开放模型之首;仅 OpenAI 和 Google 的闭源系统得分更高。商业使用需购买付费许可证。
计算社会科学的核心目标是发现语言在不同结果中的可解释差异。现有基于LLM的假设生成方法仅选取全局判别模式,忽略研究者领域知识中的协变量,导致所选模式可能反映混淆而非实质差异。本文提出条件假设生成框架,通过纳入研究者指定的协变量,引导假设发现聚焦于相关子群内成立的差异。针对子群代表性不足(层不平衡)和差异方向可能逆转(符号反转)两个挑战,提出两种方法:引入特征-协变量交互检测符号反转,以及应用层内去均值和逆频率重加权平衡欠代表层。实验表明,协变量感知的生成方法能在相关子群内产出更有用的假设。
美国参议员伯尼·桑德斯(Bernie Sanders)在其官网发布的专栏文章中提出,大型人工智能公司的一半股份应归公众所有。
Anthropic 增长营销负责人 Austin Lau 介绍了非技术知识工作者使用 Claude Cowork 的最佳实践。Claude Cowork 是面向文档、电子表格等多步骤任务的 AI 助手,用户无需编程技能,将其指向文件夹或连接已有应用即可委托任务。与用于快速问答和头脑风暴的 Chat 以及面向开发者的 Claude Code 不同,Claude Cowork 适用于需要产出交付物、涉及多个文件或应用、可重复执行的场景。Lau 给出了判断任务是否适合的五项检查清单,并预告将于6月4日分享具体营销用例。
关联讨论 1 条Claude:Blog(网页)OpenAI CEO Sam Altman 计划于周三访问华盛顿,推动其关于人工智能领域公私合作的愿景。他还将提出一项更广泛的政策议程,包括创建一种机制,将人工智能可能带来的巨大财务收益传递给消费者。
特朗普政府计划对AI模型进行安全测试,但批评者认为该计划短视且流于形式。问题在于,负责AI安全审查的美国网络安全团队此前已被政府效率部(DOGE)大幅裁撤,导致测试缺乏专业执行能力。
Google 发布 Gemini AI 智能体 Spark,同事 David Pierce 和 Jay Peters 分别进行了体验。Spark 能够自动获取用户未明确输入的信息,例如 David 的狗名 Frida 和 Jay 妻子的名字。尽管功能强大,但文章指出,这种对“生产力”的追逐忽略了真正需要解决的问题。
白宫发布行政令,要求五角大楼和CISA等机构在30日内使用AI工具加强网络防御。AI开发者可自愿提交模型供安全测试,但行政令明确排除强制批准。鉴于近期政府对AI公司的施压,这种合作的真正自愿程度仍存疑问。
Gemma 4 12B 是 Google 发布的一款统一架构、无需独立视觉编码器的多模态大语言模型(LLM)。该模型直接处理图像与文本输入,无需传统视觉编码器,简化了多模态推理流程。基于 12B 参数规模,Gemma 4 12B 面向开发者工具生态开放。目前其具体 benchmark 分数、上下文窗口、价格及开源/API 可用性等细节尚未披露。
关联讨论 4 条Google Developers Blog(RSS)X:Google AI for Developers (@googleaidevs)X:Jeff Dean (@JeffDean)Hacker News 热门(buzzing.cc 中文翻译)莱顿人工智能与数学宣言(Leiden Declaration on Artificial Intelligence and Mathematics)在 leidendeclaration.ai 上线发布。
Anthropic 分享了内部使用 Claude Code 的 Skills(技能)功能的经验。Skills 是指令、脚本和资源的文件夹,智能体可发现并调用它们以提升准确性和效率。Anthropic 内部已有数百个活跃使用的技能,它们可归为九类,包括库和 API 参考、产品验证、数据获取与分析、业务流程与团队自动化、代码脚手架与模板、代码质量与审查等。最佳技能专注于单一类别,涵盖过多功能会混淆智能体。团队发现,投入时间优化验证类技能对 Claude 输出质量的提升最显著。
关联讨论 4 条Claude:Blog(网页)X:小北 (@frxiaobei)X:Claude Devs (@ClaudeDevs)Hacker News 热门(buzzing.cc 中文翻译)Anthropic 使用 Claude 自动化了 95% 的业务分析查询,整体准确率约 95%。其关键在于构建智能体分析栈(agentic analytics stack),通过数据基础层、维护验证流程和技能(skills)分别解决概念-实体歧义、数据过时和检索失败三大错误来源。相比编码场景,数据分析的难点在于将用户问题映射到正确的数据实体,而执行 SQL 反而是简单的。Anthropic 的数据科学团队因此得以专注于因果建模、预测和机器学习等战略工作。
关联讨论 1 条X:Claude Devs (@ClaudeDevs)高盛集团全球另类资产发起部门主管Christina Minnis表示,人工智能投资热潮是一个“根本性、代际性”的现象,正在驱动市场并向整体经济扩散。
Anthropic 已选定摩根士丹利和高盛牵头其首次公开募股(IPO)承销工作,这家 AI 公司正与竞争对手 OpenAI 竞争,争取率先上市。
OpenAI 公布其 AI 公共政策议程,涵盖安全、青少年保护、劳动力转型和全球标准四大领域,旨在确保 AI 技术造福全社会。
关联讨论 1 条OpenAI:官网动态(RSS · 排除企业/客户案例)OpenAI 发布了一份针对美国前沿 AI 治理的蓝图,提出建立联邦层面的框架,以保障安全性、韧性和国家安全。该蓝图聚焦于前沿 AI 的民主治理,强调通过政府监管与行业协作来应对潜在风险。
关联讨论 1 条OpenAI:官网动态(RSS · 排除企业/客户案例)亚马逊的搜索栏将根据用户描述自动生成AI虚构的服装和家居用品图片,但这些商品并非真实存在,无法购买。用户看到的只是由生成式AI创建的“幻影”产品。
人工智能研究公司 Lila Sciences Inc. 正进行融资谈判,计划筹集约 20 亿美元,投前估值约 85 亿美元。知情人士透露了该信息。
亿万富翁投资者 Ray Dalio 表示,所有伟大的技术变革都会产生泡沫,他在蓬勃发展的 AI 市场中看到了泡沫迹象,并认为这个泡沫最终会随着财富转化为货币而破裂。
Ultralytics YOLO26 采用双头设计实现原生无 NMS 的端到端推理,彻底移除 DFL,获得更轻检测头与无约束回归范围。训练结合混合 Muon-SGD 优化器 MuSGD、转向推理头的 Progressive Loss 及保证小物体正样本的 STAL 标签分配。支持检测、实例分割、姿态估计、定向检测和分类,提供 5 种尺度(n/s/m/l/x)及开放词汇扩展 YOLOE-26。全部尺度在 COCO 上达 40.9–57.5 mAP,T4 TensorRT 延迟 1.7–11.8 ms;YOLOE-26x 在 LVIS minival 文本提示下达 40.6 AP。代码已开源。
Amazon 更新了应用内搜索功能。用户输入衣物或家居用品的描述后,搜索栏会直接显示 AI 生成的对应商品图像,但这些图像对应的产品是虚构的,无法直接购买。用户点击最匹配的 AI 图像后,系统会搜索外观相似的真实商品。该功能旨在帮助记不清纹理或风格名称(如“荡领”)的用户进行更直观的搜索。