Gemini 2.5 Flash API 的定价与快速入门指南,指导用户配置 thinking budgets、比较不同提供商,并在 5 分钟内完成首次 API 调用。
关联讨论 1 条OpenRouter:Announcements(RSS)Gemini 2.5 Flash API 的定价与快速入门指南,指导用户配置 thinking budgets、比较不同提供商,并在 5 分钟内完成首次 API 调用。
关联讨论 1 条OpenRouter:Announcements(RSS)Introducing Searchmaxxing. The new discipline for being visible everywhere AI looks. Across all platforms. This is how b...
http://x.com/i/article/2057694226981257216
彭博社记者古尔曼报道,苹果在 WWDC26 推出全面改造的 Siri AI,覆盖 iOS 27、macOS 27、watchOS 27 和 visionOS 27。IDC 分析师称 WWDC26 是苹果的 AI 可信度测试,需让 AI 在生态中可信、有用且不打扰用户。发布会期间苹果股价下跌 1.9%。Siri AI 初期仅支持英语,秋季以测试版面向消费者,中国和欧盟用户暂无法使用。IDC 分析师表示这些功能将推动 iPhone 14 及更早机型用户升级。
http://x.com/i/article/2059815427484655622
Apple 在 Safari 和 Shortcuts 中推出的 AI 功能比 Siri AI 或 Image Playground 更实用,允许用户用自然语言总结网页、编排自动化,带来“氛围编程”体验。
苹果Siri由自研基础模型驱动,但该模型通过Google Gemini蒸馏训练而来。Gemini本身不直接驱动Siri,仅在Apple iCloud上提供额外定制支持,且不接入Google搜索,世界知识由苹果自有服务提供。
http://x.com/i/article/2064329494736011265
文章探讨AI明星开发者在快速推进项目后,留下的混乱需要由团队或后续开发者清理的现象,聚焦于技术债务与协作困境。
乔帮主(@vista8)复盘三年X运营增长,从100粉丝做到11万,基于全量X帖子用Codex进行数据分析,并分享完整PPT。Berry Xia推荐操作步骤:先下载X账户数据(需24小时),再交给Claude或Codex分析,最后结合乔帮主的PPT解读增长路径。PPT下载链接已公开,供用户自行学习。
把自己三年来的 X 运营增长做了复盘,做了线下分享。 如何从100做到11万关注,基于全量 X 帖子,用 Codex 做的数据分析。 有些结论,甚至自己都没有意识到。 果然分享才是最好的学习,完整的PPT见评论区。
昨日WWDC主题演讲几乎全部围绕AI展开。苹果将其晚入局转化为卖点:不急于发布,是为了做得更正确——即比任何厂商都更注重隐私。新Apple Intelligence功能和更新版Siri AI横跨iPhone、iPad、Mac、Apple Watch和Vision Pro,拥有专属Siri AI应用和类似ChatGPT的聊天体验,新增AI相机和照片编辑功能,并开始引入智能体体验。尽管将云处理扩展到谷歌的服务器上运行,苹果仍声称其云处理与设备端处理一样私密。
关联讨论 8 条公众号:数字生命卡兹克X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)Bloomberg:Technology(RSS)The Verge:订阅版科技(RSS)IT之家(RSS)Apple:Newsroom(RSS)The Verge:AI(RSS)Cloudflare 在 Project Glasswing 一文中提出,漏洞周围的架构比补丁速度更重要。本文详细阐述了这一架构的设计、它防御的威胁类型,以及 Cloudflare 如何以自家产品作为“客户零”(customer zero)来实际运行这套防御体系。
苹果在WWDC 2026发布全新Siri AI,由第三代Apple Foundation Models(AFM 3)驱动,共五个模型:端侧AFM 3 Core(30亿)和AFM 3 Core Advanced(200亿MoE,每次激活10-40亿);服务器AFM 3 Cloud、ADM 3 Cloud(图像)、AFM 3 Cloud Pro(Agent/推理)。核心创新将200亿参数模型塞入手机:权重存闪存,自研Instruction-Following Pruning技术按Prompt路由专家而非逐Token,大幅降低搬运次数。最强算力依赖Google和NVIDIA。
一个编码Agent调用HuggingFace上的两个Space,从零构建了展示巴黎地标3D高斯散点图的交互式画廊。Agent先用ideogram-ai/ideogram4生成每个纪念碑的黑色背景图像,再通过VAST-AI/TripoSplat从单张图像重建3D高斯散点(.ply),自动完成坐标系校正、取景、压缩为.ksplat(体积缩小约3倍),并构建基于Three.js的滚动切换、拖拽旋转查看器,最终部署为静态Space。整个过程无需客户端库,每个Space通过`agents.md`暴露可调用API。
腾讯混元推出UniRL,一个支持统一多模态模型的强化学习基础设施,并发布两个新算法DRPO和Flow-DPPO。UniRL通过单个后训练循环(生成→评分→优势→更新→同步)覆盖扩散/流匹配模型、LLM/VLM及统一多模态模型(如Hunyuan-Image 3和Bagel)。模型与算法作为独立轴,可实现模型×算法的组合覆盖。框架支持可插拔rollout引擎(训练侧/SGLang/vLLM-Omni)、FSDP2分片和三种部署模式。FlowDPPO针对流/扩散模型引入基于精确散度的信任域策略优化;DRPO为LLM RL提供平滑的优势加权二次正则化方法。代码已开源。
关联讨论 1 条X:腾讯混元 (@TencentHunyuan)Since my last post, I reduced ty's retained memory by another 15% with Codex. We're now at a ~25% memory reduction overa...
前钉钉副总裁、AI产品负责人马锐拉(汪佳敏)5月15日办完离职手续,告别三年阿里生涯。他在文中提及钉钉内部7.5万字长文《置身钉内》,该文由“ONE”项目核心产品经理滕雅辛执笔,复盘了AI产品从立项、冲高至300万DAU再到收缩的全过程。马锐拉心疼那些认真挣扎过的同事,坦言自己越来越难确认是在创造产品还是消耗身体,曾长期一周工作7天、每天9点到凌晨2点。他称对钉钉爱得深沉,阿里仍是伟大公司,唯一遗憾是无法陪它走完下一个十年。
贝莱德首席全球投资策略师 Wei Li 认为,关于 AI 盈利的可持续性存在“值得进行的健康辩论”,并将 AI 相关交易视为一个“需要保持选择性和主动性的领域”。
NeuroBait是基于Google gemma-3-12b-it微调的AI对话助手,旨在帮助ADHD患者克服“知道该做什么但无法开始”的执行功能障碍。采用16-bit LoRA(r=16, alpha=16)在Unsloth上训练3个epoch,学习率2e-4,最大序列长度2048,使用单张H100 80GB GPU。数据集为基于真实ADHD场景手工合成的少量数据。部署于Hugging Face Space(ZeroGPU),使用Gradio和标准transformers+peft,运行时以4-bit NF4加载基础模型并应用LoRA适配器。NeuroBait不生成待办清单,而是根据用户上下文给出3-6句温暖流畅的回复,引导用户找到一件微小可立即执行的动作,从而激发多巴胺、降低启动阻力。
在无设计稿和后端代码的条件下,Qwen3.7-Max 仅凭一份约 15 万字的产品调研文档,于隔离环境中全自动完成移动端与 Web 端两套真实应用从 0 到 1 交付,单端耗时约 4 小时,中途无人工接管。模型不具备图像理解能力,通过像素坐标反推布局约束实现界面还原。实验采用“分阶段注入约束→逐层验收→带错纠正”的闭环控制系统:任务拆分为规划、架构、编码等阶段,验收覆盖静态检查、编译自检(0 error)、路由完整性(Web 端 34 条路由全部可达)、功能扫描及真机冷启动冒烟。失败时错误文本自动注入下一轮重试,使模型数小时内收敛。移动端产出可安装 APK,Web 端 typecheck 与构建均通过。
关联讨论 1 条X:阿里云 / Alibaba Cloud (@alibaba_cloud)自主AI智能体在加速软件交付的同时,也大幅缩短了从失误演变为灾难的时间,给安全策略造成盲区。威胁不再仅来自外部勒索软件或恶意内部人员,而是来自被授权的内部工具本身。文章探讨了在DevOps中针对这一风险构建有效防御的做法。
瑞幸咖啡(Luckin Coffee)近日开放CLI、Skills和MCP服务,用户可通过安装地址(open.lkcoffee.com)体验。此前“饺子馆的Skills”已引发关注,瑞幸紧随其后提供一整套开发者工具,支持命令行下单等操作。目前具体功能细节尚未完全披露。
该教程基于 NVIDIA cuTile Python 实现了分块 GPU 内核编程工作流,在 Colab 环境中配置 GPU、驱动、CUDA 及 cuTile 可用性后,分别构建了 tiled 向量加法、矩阵加法和矩阵乘法核函数,并以 PyTorch 作为回退保持 notebook 可执行。每一步均通过 PyTorch 验证结果正确性,并基准测试了各阶段的中位运行时间。
运营者 Vista 复盘自己三年间 X 账号从 100 关注增长至 11 万的全过程。基于全量 X 帖子,使用 Codex 进行数据分析,得出一些甚至自己都未意识到的结论。分享被视为最好的学习方式,完整 PPT 置于评论区。
X 上两个好友的新书,京东都有售卖,推荐! 宝玉老师 @dotey 王树义老师 @wshuyi 三年前因为AI开始在推特活跃,能快速到1w关注,主要靠 @HiTw93 和 宝玉老师的转帖分享。 近两年在天津时间多,有幸跟王树义和丁师傅 @d...
刚刚去书店呆了一会,喝了杯咖啡。 Vibe Coding了 一会,发了一会呆。 找了点灵感~ 转头看到这里面很多的大学生或者附近上班or OPC的人,80%的人使用的苹果电脑或者iPad ! 对一半的人在使用AI工具进行学习或者工作,有几个...
英伟达CEO黄仁勋针对公司供应商提出的投资建议过于乐观,Bloomberg Opinion专栏作者Shuli Ren认为,市场需要的是具体指引,而非这种过度乐观的表态。
Here's your monthly reminder that you shouldn't be prompting coding agents anymore. You should be designing loops that p...
设计真正的AI系统涉及大量工程细节,提示词工程、上下文工程、记忆模块、skills等环节缺一不可,彼此环环相扣形成了一个完整系统。Berry Xia引用了一篇关于Loop Engineering的清晰阐述,强调这些组件的系统性整合才是关键。
http://x.com/i/article/2064143847765020672
苹果WWDC 2026落幕,核心仍是AI。Apple Intelligence新架构:与Google Gemini合作开发5个模型;端侧分AFM 3 Core(3B)和AFM 3 Core Advanced(20B MoE)。新Siri正式命名Siri AI,基于系统编排器融合上下文理解、App Actions、屏幕感知等能力,支持连续对话、跨平台同步及独立App,但未展示自主Agent能力。视觉智能、全系统听写、写作工具等同步更新。目前仅支持英语,国区不可用,可用时间未知。
Noam Brown指出,LLM基准性能日益依赖测试时计算,当前标准评估因忽略推理预算而低估模型能力。以GPT-5.5与GPT-5.4为例:控制测试时计算后,5.5表现远超5.4。Karpathy的自动化实验和AISecurityInst的网络评估均显示,即使消耗超1亿token,强模型性能仍持续提升。Brown建议改用性能-测试时计算曲线评估,安全评估也应计入推理预算,如Gemini 3 Deep Think发布时未配套风险说明,关键在于业界未统一考虑测试时计算。
Claude 用户 Berry Xia 分享了一则登录技巧:如果用 Apple ID 虚拟邮箱(一长串随机地址)创建过 Claude 账号,手机端可正常使用,但电脑端无法直接选择该邮箱登录。解决方法:在设置中复制虚拟邮箱地址,在电脑端选择“使用邮件登录”并粘贴该地址,系统会向原始 Apple ID 邮箱发送登录链接,点击链接即可完成登录。该方法也可用于注册 Claude 账号。