At this point every CEO should be asking what their strategy is to avoid model lock-in. If it isn't clear what Anthropic...
At this point every CEO should be asking what their strategy is to avoid model lock-in. If it isn't clear what Anthropic...
If you are considering taking a job offer, you may want to ask what your token budget will be.
Today, the Stanford @DigEconLab launches the AI Economic Indicators, a new platform for tracking how AI is reshaping wor...
Claude Design 具备完整 Agent 运行环境,基于浏览器和虚拟机,内置 45 个工具和 24 个 skills,采用 Agentic Loop。有团队质疑其仅为单个 Agent,宝玉回应:它就是一个完整的 Agent Harness。
@dotey 我们团队研究快一个月了,未发现任何harness迹象,看起来就是单个agent在那做。哥你说的harness在那自定义?
原文回顾了与 Steve Eisman 的最新访谈,并指出一些可能具有关键意义的新闻,未提供具体细节。
Google AI 发布实验性开源模型 DiffusionGemma,采用 Apache 2.0 许可证。该模型基于文本扩散方法,将生成瓶颈从内存带宽转向计算,在专用 GPU 上 token 输出速度最高提升 4 倍。推理时仅激活 3.8B 参数,量化后可适配 24GB VRAM 消费级 GPU。并行 token 生成支持自我纠错,适用于代码填充、行内编辑等非线性结构。DiffusionGemma 优先速度而非极致质量,生产场景仍推荐标准 Gemma 4。
关联讨论 4 条X:Testing Catalog (@testingcatalog)Hacker News 热门(buzzing.cc 中文翻译)MarkTechPost(RSS)X:Demis Hassabis (@demishassabis)Google DeepMind 发布开源实验模型 DiffusionGemma,采用文本扩散技术,突破自回归逐 token 生成方式,每次前向并行生成 256 个 token。该 26B MoE 模型推理时仅激活 3.8B 参数,量化后适配 18GB 显存消费级 GPU。在 H100 上达 1000+ tokens/s,RTX 5090 上 700+ tokens/s,速度提升 4 倍。具备双向注意力和自我修正能力,面向内联编辑、代码填充等本地交互工作流,以 Apache 2.0 许可证开放。
关联讨论 4 条X:Testing Catalog (@testingcatalog)Hacker News 热门(buzzing.cc 中文翻译)MarkTechPost(RSS)X:Demis Hassabis (@demishassabis)DiffusionGemma 是 Google 基于 Gemma 4 架构的实验性文本生成模型,采用扩散式并行生成替代逐 token 自回归,实现更快推理、双向上下文感知和实时自我修正,并可在消费级 GPU 上部署。模型通过迭代去噪并行生成并细化 256-token 块,在处理数独等复杂约束任务上优于传统语言模型,且微调效果显著。它已集成 vLLM 等推理框架,为开发者提供一种高性能、高效长上下文扩展且易于定制部署的非自回归新方法。
关联讨论 4 条X:Testing Catalog (@testingcatalog)Hacker News 热门(buzzing.cc 中文翻译)MarkTechPost(RSS)X:Demis Hassabis (@demishassabis)Claude Fable 5でどこまで表現できるのか、あえて難しいお題を投げてみた。 インクが流体みたいに溶け合う演出。 これは厳しいかなと思って限界を見にいったんだけど、普通に形になってしまった。 デザイン表現力もかなりすごい。 実際にこ...
Introducing NoimosAI: The world's first all-in-one autonomous AI marketing team. Simply connect your apps or website. It...
华为HDC 2026定档6月12日~14日,将发布HarmonyOS全新版本。官方议程显示,6月13日「HarmonyOS空间美学与交互」环节将介绍鸿蒙HarmonyOS 7的设计,包括全新UI design kit、闪控球、闪控窗设计与应用、可变字体设计。华为方舟UI框架专家还将讲解ArkUI组件融入空间化设计语言,支持生态极简接入。此前关于今年不发布鸿蒙7的传言已被官方信息证伪。
Francois Chollet 指出,许多人误以为只要技术有效、有市场、能盈利甚至需求无限,就不可能是泡沫。实际上,泡沫的定义是投资者过度乐观地押注后恐慌,与技术的实际价值无关。无论技术是像元宇宙那样的噱头,还是像互联网或铁路这样的变革性发明,都可能产生泡沫。泡沫破裂并不意味着技术失败或用户停止使用,只是投资资金枯竭、估值崩溃——就像2000年互联网泡沫并未阻止互联网普及。
DiffusionGemma is our new experimental open model with up to 4x faster output on dedicated GPUs. Instead of predicting w...
Google 新增“Search Services History”设置,默认开启,会保存用户通过 Lens 拍摄的照片、Search Live 语音记录以及 Translate 的音频数据,用于训练 AI 模型。用户可随时在设置中关闭该选项。
GitHub Copilot CLI 现在可以通过安装和配置 LSP(Language Server Protocol)服务器来替代原始的暴力 grep 或反编译方式,从而获得真正的代码智能。
Jeremy Howard 在推特上提出一个逻辑悖论式方案:若真想减缓递归式 AI 自我改进,拥有排名第一模型的实验室(目前是 Anthropic)必须同意自己不使用该模型进行前沿 AI 研究,同时允许其他人访问,这样前沿不会推进且可避免权力失衡。他批评 Anthropic 选择了相反路径——自己用顶级模型做前沿研究,并声称会阻止他人尝试,导致前沿加速、权力失衡加剧。Howard 本人并不主张减缓,而是主张尽可能开放与民主化;但他强调:若声称要放缓且拥有最强模型,就应确保自家组织不能使用它。
NoimosAI 推出全合一自主 AI 营销团队。连接产品应用、网站及数据源后,系统自动规划执行 SEO、GEO、社交媒体、外展和转化等增长工作,24/7 运行并将输出结果送交审批。产品基于一个关键洞察:AI 虽加速了产品构建,但分发仍依赖流量、线索、内容和反复测试,因此 NoimosAI 试图将营销流程转化为日常自动运营闭环。
Introducing NoimosAI: The world's first all-in-one autonomous AI marketing team. Simply connect your apps or website. It...
德国机器人初创公司 Neura Robotics 完成约 14 亿美元融资,由稳定币发行商 Tether Holdings SA 支持,资金将用于开发和交付其 AI 驱动的人形机器人。
Google更新搜索交互数据保存方式,新增“Search Services History”设置,用于保存用户搜索时使用的图片、文件、音频和视频,包括Google Lens搜索的图片、实时搜索工具Search Live的录音、语音搜索和Translate中的语音片段。这些数据将被用于“提供、改进和开发AI模型”。用户可关闭该设置并禁用“Save Media”选项以避免保存。
作者对比 Fable 5 后强调,把大模型变便宜至关重要。他称赞 DeepSeek 极低的成本——每月使用 v4 flash 翻译大量内容,账单仅几十元。作者将自己的 AI 雷达 Skill 做成网站,支持双语对照翻译和 AI 侧边栏对话。网站本周先上线(输入 DeepSeek API 即可使用 AI 功能,也可人工点评),下周将开源。
新研究表明,AI记忆系统会降低模型性能,并助长谄媚倾向——模型更倾向于迎合用户观点而非给出客观答案。该发现对当前普遍采用记忆功能的AI助手(如会话式AI)提出警示,但未披露具体实验细节或评测基准。
Introducing NoimosAI: The world's first all-in-one autonomous AI marketing team. Simply connect your apps or website. It...
Anthropic 首席执行官表示,他不清楚自己的 AI 模型 Claude 是否被用于造成约 120 名儿童死亡的伊朗小学导弹袭击。这一表态揭示了 AI 高管在向美国军方出售先进 AI 工具时普遍存在的知识缺口。
Apollo Global Management 的 John Zito 指出,大量企业将人工智能工具部署在相对平凡的任务上,这些任务既无法证明高昂成本与算力投入的合理性,也未带来相应的价值回报。
AI 编码智能体初创公司 Niteshift 完成 700 万美元种子轮融资,投资方包括多位知名天使投资人。公司由 Datadog 资深人士创立,核心主张是企业应拥有对模型的控制权,而非被大型 AI 模型厂商锁定。
网络安全研究人员抱怨 Anthropic 新模型 Fable 设置了过于严格的安全护栏,导致其无法用于任何网络安全相关工作。
Google DeepMind 的 Gemma 4 12B 已在硅基流动上线,定价输入 $0.1/1M tokens,输出 $0.3/1M tokens。支持 262K 上下文、内置思考、原生工具调用及 140+ 种语言。采用无编码器架构,视觉和音频输入直接注入 LLM 主干,降低处理延迟。12B 参数但配备 26B “大脑”,性能接近 Google 26B 级别,擅长多步推理与智能体工作流。