Hacker News 用户发起讨论,询问大家自 AI 兴起以来为自己开发了哪些个人工具。该提问来自 HN(news.ycombinator.com),获得 100 个点赞,标签为 #Ask HN。
Hacker News 用户发起讨论,询问大家自 AI 兴起以来为自己开发了哪些个人工具。该提问来自 HN(news.ycombinator.com),获得 100 个点赞,标签为 #Ask HN。
苹果在2026年WWDC主题演讲中未推出全新产品,主要介绍Apple Intelligence优化及全面革新的Siri。不同于2024年宣传片式演示,本次多数AI功能通过工作人员操作真机实时展示,证明功能已实际可用。苹果曾因2024年虚假宣传被起诉,上月达成和解赔付2.5亿美元。新版Siri随iOS 27推送,适配iPhone 15 Pro系列、iPhone 16及以上、M1及以上iPad和Mac等设备,无需换最新款手机。
OpenAI 发布计划,阐述让 AGI 造福所有人的愿景。该计划聚焦于 AI 的可及性、安全性和共享繁荣,确保技术进步惠及每个人。
关联讨论 1 条X:Sam Altman (@sama)Siri联合创始人Dag Kittlaus在Bloomberg The Close节目中对苹果的AI雄心作出反应,认为新发布的Apple Intelligence系统是在公司全球开发者大会(WWDC)主题演讲中推出的关键一步。
Gary Marcus 在博文中引用“幻想之地”的比喻,指出整个 AI 行业建立在不合理的数学基础之上。
作者发帖抱怨大语言模型对自身职业生涯的冲击后,在Hacker News上收到了大量评论。本文是对这些评论的集中回复与讨论,原帖获得103个点赞。
一场关于 Apple Intelligence 的公开技术座谈,对话者为苹果高管 Craig Federighi。
该教程使用ClawHub Security Signals数据集分析扫描器如何评估AI技能。从Hugging Face Parquet格式加载数据,检查判定结果、扫描输出和严重性标签,通过Jaccard分数和Cohen's kappa衡量VirusTotal、静态分析和SkillSpector之间的重叠与分歧,最后将SKILL.md文本与扫描信号结合,训练逻辑回归模型预测ClawScan判定。
一篇题为“AI Is Slowing Down”的文章在 Hacker News 获得 102 个点赞,发布于 06-08,原文链接为 www.wheresyoured.at。
xAI在资产结构和运营模式上被比作数据中心REIT,而非传统的前沿AI实验室,这一观点来自martinalderson.com的分析文章。
在 2026 年全球开发者大会上,苹果软件工程高级副总裁 Craig Federighi 抨击企业急于将 AI 塞进生活各个方面而不顾及最终服务对象的现象,强调真正有用的 AI 必须以用户和用户的需求为中心。他透露新一代 Apple Intelligence 技术将使苹果产品更加个性化和实用。
将AI比作一个闪耀着能力的星系,其核心存在一个肉眼不可见的巨大黑洞——数据。这个比喻揭示了AI模型惊人能力背后对海量数据的依赖,样本效率的瓶颈如同引力中心,将各色能力凝聚在一起。
Creative Strategies总裁兼首席分析师Carolina Milanesi与彭博社的Ed Ludlow在加州库比蒂诺讨论苹果推出改版后的Siri数字助手后的后续发展,以及将AI嵌入消费者设备的重要性。
软件开发者和Hacking with Swift平台创建者Paul Hudson在Bloomberg Tech节目中表示,他期待苹果AI能推出“great APIs”。
三大力量重塑 AI 成本:前沿闭源模型持续涨价,开源模型在多数场景已足够好,买家开始替代。Coinbase 将提示词路由至更便宜模型,成本持平但 token 用量指数增长。Lindy 全切至 DeepSeek v4,节省数百万美元且多项核心性能提升。Harvey 在 Legal Agent Benchmark 上通过 SFT 使 Kimi 2.6 all-pass 率达 15%,超越 Opus 的 14%,同一 100 任务成本 $84 vs $954(约 11 倍价差)。Cursor 后训练 Kimi K2.5 得到 Composer 2.5,称其“性能优异且效率高达同类模型 10 倍”。闭源越来越贵,开源平价且性能接近,选择决定企业单位经济学的斜率。
苹果 WWDC 2026 临近,Siri 备受期待的改造、Apple Intelligence 和 iOS 27 是本次大会的主要看点。
微软 AI 负责人 Mustafa Suleyman 表示超级智能即将到来,但不会夺走人类的工作岗位。他同时讨论了自动化、OpenAI 相关话题,并认为将 AI 称为“活着的”是危险的。
关联讨论 1 条The Verge:订阅版科技(RSS)生成式AI商业模式正从月订阅制转向按token消耗计费。智能体工作流消耗数倍于传统对话的token,可自主运行数小时,使固定费率不可持续。token价格因响应速度、专业化程度及结果经济价值而异。本期报告梳理订阅制向消费制迁移、看似低廉的token单价背后的实际成本,以及为何仅凭token消耗量衡量AI价值创造是片面的。
微软AI CEO Mustafa Suleyman在Decoder访谈中表示,超级智能即将到来,但不会导致大规模失业。他透露微软与OpenAI于去年10月签署新合同,巩固合作关系的同时,微软获准独立追求超级智能。微软已组建超级智能团队、训练前沿模型,并于本周Build大会上发布7个全模态新模型。他批评Anthropic将Claude描述为有意识的做法,认为消费者产品需要足够好才能克服公众对AI的负面情绪。
关联讨论 1 条The Verge:订阅版科技(RSS)用五个不同实验室的AI模型(OpenAI、NVIDIA、OpenBMB及一个自微调的5亿参数模型)各自驱动一个智能体构建经济市场,试图复现此前单一模型下出现的银行挤兑式价格崩溃。结果同一场景下模型不仅不抛售反而囤积,导致价格不跌反涨。通过纯谣言、库存泛滥、加大做空三种方式均无法重现崩溃。最终在结算环节直接覆盖价格,使崩溃成为设计事实。实验表明,AI智能体的涌现行为是偶然的而非稳健的,有效系统需在涌现纹理与确定性控制之间找到精确接缝。
天风国际分析师郭明錤指出,苹果当前核心叙事是“即使AI进度暂时落后,最终仍能后来居上”。供应链调查显示苹果业绩将好到今年年底,强化了“没有AI都这么好,有了AI还得了”的看法。WWDC26不会改变股票下半年正向趋势,但真正值得观察的是:在同样使用Gemini的情况下,苹果能否做出比谷歌更好的AI应用、Agentic workflow和端侧/云端混合体验。若肯定,可延长核心叙事;若否定,则意味着Gemini决定了苹果AI体验上限,更多人将重新审视后来居上的叙事。
在Bloomberg《The Pulse》节目中,Nvidia CEO表示当前科技股抛售提供了买入机会。节目嘉宾包括高盛资产管理多行业投资主管Lindsay Rosner、Multiverse创始人兼CEO Euan Blair,以及英国AI与在线安全部长Kanishka Narayan。
OpenRouter 的 Agent SDK 新增人类参与循环(HITL)工具,用于 AI 智能体的合规监督。该工具可帮助 AI 智能体满足欧盟 AI 法案、科罗拉多州自动化决策技术法(SB26-189)以及 NIST AI 风险框架(NIST AI RMF)的监管要求。
关联讨论 1 条OpenRouter:Announcements(RSS)Pakistan Notice Helper 是一款安全工具,帮助巴基斯坦用户在点击链接、拨打电话、分享 OTP 或支付前识别可疑消息。它接受文本或截图输入,返回风险等级、简短解释、可见警示标志和安全下一步建议。工具支持英文和乌尔都语,乌尔都模式采用从右向左布局并全界面翻译。最终部署选用 Qwen3.5 4B Q8 模型(通过 llama.cpp + CUDA),在 10 个测试用例中通过了所有高风险诈骗和截图场景。此前曾测试 Qwen3.6 27B(质量高但成本高)和 MiniCPM-V 4.6 Q8(速度慢且不稳定),最终选择了精度、速度和成本平衡的 4B 模型。项目受限于 hackathon 的 32B 模型上限规则。
苹果对Siri进行重塑,将其作为AI长期布局的一部分,但在PC和手机市场持续下行的背景下,短期内难以刺激iPhone和Mac的销量增长。
一篇来自 algorithmichiring.github.io 的文章指出招聘行业正面临算法单一化风险——多数企业采用少数几种相同的算法模型评估候选人,可能导致系统性偏差和同质化。该文在 Hacker News 获得 102 个点赞。
信息行业在利润扩张中占据主导地位,却成为就业环境最糟糕的行业之一。AI热潮推高了企业盈利,但并未带来相应的工作岗位增长,科技工作者反而面临更严峻的就业困境。
通义实验室教程演示了如何用 Agent(Qoder)辅助完成 Qwen3-VL-2B 模型在 Android 端侧的全流程部署。操作包括:检查 JDK 21、NDK 27、CMake 3.18.1 等环境;创建 arm64-v8a 的 Native C++ 工程(minSdk 29、compileSdk 35);通过 ModelScope CLI 下载约 1.4GB 的 MNN/Qwen3-VL-2B-Instruct-MNN 模型;编译开启 LLM 视觉支持(MNN_BUILD_LLM、LLM_SUPPORT_VISION)的 libMNN.so;构建 APK 并推送模型至手机私有目录。最终 App 提供图文推理页面,输出 MNN 版本(v3.5.0)、ABI 及推理指标。所有繁琐步骤均可由 Agent 自动执行。
腾讯正测试嵌入微信的AI Agent,用户右滑唤出对话窗口,通过自然语言指令调用数百万小程序完成点咖啡等任务。微信还与华为、荣耀、小米、OPPO、vivo合作推出A2A助手能力,可通过手机语音助理发起微信音视频通话或发送消息。6月8日,微信官方发布《关于开发者接入微信AI生态的指引》,提供自动接入模式,利用微信沙箱全自动改造小程序,使其可被AI直接调用。这一布局被视为Agentic Commerce(代理式交易)的雏形。
关联讨论 1 条公众号:数字生命卡兹克小米 17T Pro 是 T 系列首次面向国内市场发布的机型,定位“全能影像旗舰”。搭载天玑 9500,后置徕卡三摄:5000 万像素主摄、5000 万像素 5× 潜望长焦(支持 Ultra Zoom 超级变焦至 120 倍,AI 大模型算法辅助)及 1200 万像素超广角。配备 6.83 英寸 144Hz 1.5K 屏幕,峰值亮度 3500nit;7000mAh 金沙江电池。游戏实测《原神》60FPS、《崩坏:星穹铁道》58.1FPS,机身最高温度 42.3℃。支持 Leica Live 动态照片与实况运镜功能。
CoreWeave 对当前计算市场进行了分析,指出推动增长的因素和限制增长的因素。该公司的市场看法即围绕这两个维度展开。
英伟达CEO黄仁勋将上周开始的全球科技股抛售视为买入良机,称人工智能基础设施建设仍处于初期阶段。他强调AI终将成为全球基础设施,如同当年的互联网。英伟达已与SK海力士达成多年合作协议,联合研发新一代AI专用存储芯片。韩国总统李在明认为本国股市估值偏低,受此影响SK海力士等个股跌幅有所收窄。
猎豹移动董事长兼CEO傅盛今日接受访谈,总结了用AI改造组织体系的四个步骤:一把手自己得懂;全员思想变革;所有人都要用AI写代码,包括行政;建立以年轻人为核心的“特区”。傅盛早在2019年就表示人工智能业务走在正确道路上,并相信未来10到20年AI会把人从繁重工作中解放出来,让人有时间阅读、提升、寻找自我。
一篇关于用 Python 构建最简单人工神经网络——感知器(Perceptron)的文章在 Hacker News 上获得 108 个用户点赞。
Claude Opus 4.8、GPT-5.5等12款旗舰模型参加今年高考语文数学(全国一卷部分试题)测试,采用API调用、禁用代码推理和网页搜索。总分第一MiMo v2.5 Pro(256.3分),第二名Kimi k2.6(256.29分)差0.01分,第三至第九名分差仅2分。语文最高分由GLM5.1和Gemini 3.1 Pro并列,数学最高分由DeepSeek V4 Pro、MiMo、ERNIE 5.1并列。DeepSeek作文得分偏低拉低总分。语文卷基于101分版本折算至150分制。
13个顶级AI模型参加2026年数学全国一卷测试,GPT 5.5 Thinking、Deepseek-v4 Pro、Gemini 3.1 Pro Thinking和Claude Opus 4.8 Max并列第一,Kimi 2.6 Thinking以微小分差位居第二梯队。测试采用LaTeX格式统一输入,禁用联网。多数模型在长解答题和多选题上容易失分,如第11题(多选题,正确答案ABD)所有模型均未完全答对。Claude Opus 4.8 Max因额度不足未完成所有题目,Claude Sonnet 4.6 Thinking尝试直接搜答案,Deepseek-v4 Pro曾拒绝完成。模型在上下文记忆、题目理解和符号识别方面仍有明显短板。
DeepSeek V4 Pro 在准确率(precision)指标上击败 GPT-5.5 Pro,具体分数和参数量未透露。该结果来自 runtimewire.com 的评测,在 Hacker News 获得 110 个点赞。
Palantir CEO 亚历克斯·卡普在人工智能平台十周年大会场外接受采访,将行业无节制消耗 token 的行为比作“精神沉溺式滥用”和“自慰成瘾”。CTO 沙亚姆·桑卡在财报电话会议上表示,词元用量越多产出越粗劣,企业需依靠 Palantir AI 平台(AIP)才能规避低价值陷阱。Uber COO 安德鲁·麦克唐纳坦言看不出攀升的 AI 成本与效率提升之间存在关联。卡普认为,AI 可完成“撰写 GDP 增长报告”等简单任务,但优化油气开采、重塑供应链等复杂业务需依靠严谨的流程,大语言模型无法取代。