Hacker News 上一则标题为“Tailwind and slop apps”的帖子于 06-12 发布,获得 100 点热度,引发社区对 Tailwind 与 Slop 应用的讨论。
Hacker News 上一则标题为“Tailwind and slop apps”的帖子于 06-12 发布,获得 100 点热度,引发社区对 Tailwind 与 Slop 应用的讨论。
在OpenRouter上追加`:floor`可获取最便宜提供商,通过`max_price`设定花费上限,并可免费使用20多个零成本模型。同时需注意避免计费陷阱。
Google Research 于 2026 年 6 月 12 日发布 Gemini-SQL2,基于 Gemini 3.1 Pro 驱动的文本转 SQL(Text-to-SQL)能力,在 BIRD 单模型排行榜上达到 80.04% 的执行准确率。
谷歌起诉名为“Outsider Enterprise”的中国网络犯罪团伙,指控其利用人工智能技术实施诈骗,受害者达数十万人。该团伙在两周内发送了约 250 万条诈骗短信。
来自ikyle.me的教程,指导在macOS上搭建本地编码代理,获Hacker News社区104个点赞。
Hacker News 上一则帖子的标题为“你直接上传到ChatGPT不就行了?”,获得了101个HN点。该帖子引用了用户常被询问的一句话,暗示直接向ChatGPT上传文件以完成任务的普遍做法。
特斯拉全自动驾驶功能(Full Self Driving)在丹麦官方认证视频中被发现使用了自行车道。该视频由丹麦媒体politiken.dk报道,时长01:49,在Hacker News上获得100个点赞。
一篇来自 Miguel Grinberg 的博客文章,标题为《我不是反向半人马》,在 Hacker News 上获得 100 点热度。文章内容可能涉及人与 AI 关系的讨论,但原文仅包含标题与来源,无进一步技术细节。
Jeff Bezos 创立的新公司 Prometheus 瞄准物理 AI 领域。尽管并非唯一涉足该赛道的初创企业,Prometheus 是资金最充足的公司之一。
交互式LLM智能体的用户偏好修正常被遗忘,Mem0记忆仍有57.5%相关偏好检查被违反。研究提出TRACE,一种即插即用的技能层管道,从用户聊天修正中挖掘原子规则并编译为运行时检查。在ClawArena上,分布内违规从100.0%降至37.6%,分布外从100.0%降至2.0%;在MemoryArena上,分布内从100.0%降至60.5%,任务通过率匹配或超越最强记忆基线。实验代码已开源。
多智能体系统通常依赖文本通信,解码-重编码代价高且信息有损。KV-cache通信是低开销替代方案,但现有方法多限于同构模型。本文提出稠密对齐方法,通过轻量级跨模型缓存变换和两阶段训练(重构→生成)实现异构智能体间KV-cache直接传输。在Qwen3-4B、8B、14B三个模型组成的六个方向和六个基准上,上下文感知设置中性能匹配或超越文本通信,计算量降低2–3倍;上下文无关传输中仍有效,而先前方法完全失效。
SpaceX 决定将位于孟菲斯的 Colossus 1 数据中心全部容量租给 Anthropic。此举源于 SpaceX 团队在利用该设施开发并运行其 Grok AI 模型时遇到技术困难。据知情人士透露,SpaceX 是在自家团队用起来有麻烦之后才做出这一决定的。
Anthropic对近5.2万美国人进行的调查显示,64%的受访者担心AI会导致失业,56%担心会丧失独立思考能力。日常AI用户的担忧程度远低于非用户。尽管如此,大多数人仍拒绝在工作中使用AI,即使他们认为AI能够处理相关任务。
本文介绍如何减少AI生成前端界面的粗糙度,发表于envs.net。文章针对AI产出的前端代码常出现的草率、不细致问题,提出改进方法,旨在提升生成结果的质量和可用性。
Jenny 经营一座火葬场,John 的丙烷公司以 200 亿美元投资换取其 5% 股份。Jenny 将 100 亿美元投入焚化炉,再付给 John 100 亿美元购买丙烷烧掉这些钱。John 向外界报告其 AI 投资本季度产生 100 亿美元收入,并持有价值 1000 亿美元企业的 5% 股权。福布斯记者在撰写人物报道时与二人陷入混乱的三人恋情,最终结成多角婚姻,其报道赞誉有加但缺乏财务细节。
Google 起诉一个名为“Outsider Enterprise”的组织,指控其利用人工智能在两周内发送了 250 万条诈骗短信,导致数十万受害者上当。该组织被描述为中国网络犯罪团伙。
Anthropic宣布与塔塔咨询服务(TCS)合作。TCS将向56个国家的5万名员工提供Claude,并为金融、医疗等受监管行业客户构建基于Claude的产品,同时加入Claude Partner Network。作为“客户零号”,TCS将在自身工程、财务、法律、营销和销售团队中率先使用Claude,并组建专门团队为客户设计和运维Claude系统。具体用例包括:Diligenta用Claude改善2200万保单持有人的体验;银行产品团队用Claude Code提升软件工程效率;工程团队贡献可复用技能和插件;TCS iON提供Claude培训与认证。
完全自主的无人机仍属罕见,但乌克兰正为无人机和机器人加装AI模块,提升自主作战能力。此前一次测试中,乌军首次使用完全自主无人机击杀俄军士兵。
OpenAI 现在允许 Codex 用户存储速率限制重置次数并手动触发,而非按固定时间到期。用户在使用中达到上限时可立即使用已保存的重置而无需等待。Go、Plus、Pro 和 Business 订阅计划用户各获得一次免费重置。Plus 和 Pro 用户还可通过邀请好友解锁额外重置。
苹果发布了新版Siri AI,The Verge编辑David和Nilay在The Vergecast中分享了初期体验。过去十几年Siri在"部分功能勉强可用"和"彻底翻车"之间摇摆,而新版Siri AI在多数任务上表现足够出色,尽管没有带来突破性创新,但相比过往已发生质变。
Mistral 正进行新一轮融资,传闻金额为 30 亿欧元,投后估值约 200 亿欧元(约 231.5 亿美元),较其 C 轮估值 117 亿欧元接近翻倍。
6月12日,名为 Maxproof 的论文在 arXiv 上发布,并在 Hacker News 上获得 100 点热度。
Google Research 在《JAMA Dermatology》发表两项研究,探索 AI 帮助普通人理解自身皮肤问题。一项涉及 2345 名参与者的定量研究显示,AI 辅助显著提升了用户识别皮肤疾病名称的能力,并影响了其就医或自我护理的下一步决策。另一项混合方法研究对比了用户通过 AI 工具与医生对话获取的认知。这些工作基于此前开发的 AI 鉴别诊断模型和 SCIN 数据集,旨在通过高质量信息支持皮肤健康决策。
截至今年,抗议活动已成功阻止价值约1300亿美元的AI数据中心项目。反对者通过组织行动阻碍了多地的开发计划,称这一胜利让参与者“尝到了政治权力的滋味”。抗议主要针对数据中心带来的能源消耗、水资源占用和环境影响,部分项目已被政府暂停或重新审查。
Claude Fable 5 在 Artificial Analysis Intelligence Index 中取得 64.9 分,在十项基准测试中有五项创下纪录。相比 Opus 4.8,性能提升仅 5.7%,但 token 价格翻倍。安全过滤与回退路由功能进一步推高了成本。
The Vergecast 播客首次体验了 Siri AI,并讨论了社交网络的下一阶段,同时指出特朗普手机(Trump Phone)是个骗局。
谷歌对一中国网络犯罪网络提起诉讼。该团伙涉嫌利用 Gemini 创建并运营诈骗网站,目标达数十万人。
OpenAI 发布三门 Academy 课程,帮助用户掌握实用 AI 技能、创建可重复工作流,并在日常工作中应用 AI 智能体。
苹果在 WWDC26 发布 Core Image RAW 9 处理管线及 API,为 2017 年 RAW 8 以来首次重大更新。去马赛克与降噪通过新 CoreML 模型同步进行,处理相机 RAW 文件时效果显著优于 RAW 8。目前已支持 784 款相机 RAW 文件,针对富士 X-Trans CMOS 传感器改进了伪色与细节问题。新 API 利用神经网络引擎提升图像锐度与色彩;CIRAWFilter API 可调整曝光、降噪等参数;CIImageProcessor API 通过精细控制图块与缓冲区优化性能。
IPO 市场回暖,新缩写 MANGOS 取代 FAANG 成为领头羊——涵盖 Meta(或 Microsoft)、Anthropic、Nvidia、Google、OpenAI 和 SpaceX。其中半数公司将在同一窗口期上市,这对投资者、估值和市场承受力构成压力测试。
Anthropic对近5.2万美国人调查显示:48%将治愈癌症等疾病列为首要期望,36%希望AI帮助残障人士。64%担忧AI导致失业,56%担忧认知依赖,52%担忧信息误导。超70%支持政府监管,最关注隐私(56%)、儿童安全(52%)和责任归属(49%)。仅15%信任AI公司决策。多数议题上观点不因党派或地域严重分裂。调查于2025年11-12月由YouGov线上执行并加权至人口普查基准。
olmo-eval 是基于 OLMES 标准构建的评估工作台,专为 LLM 持续开发中的反复评测场景设计。相比 OLMES,它减少了新增评测的实现工作量,支持 agentic 和多轮评测作为一等用例,并允许根据基准需求选择轻量直接运行或容器化隔离运行。采用模块化架构,模型、工具、容器环境、辅助模型均可独立替换。评测结果同时报告分数、标准误差和最小可检测效应。与 Harbor 侧重于发布不同,olmo-eval 聚焦开发阶段快速迭代,可逐问题对比检查点输出以区分真实改进与噪声。
SpaceX上市首日高开29%,募资750亿美元创全球最大IPO纪录,跻身全球第6大上市公司,马斯克成首位万亿富豪。高盛总裁沃尔德伦称,这表明投资者愿为AI和太空基建买单,预示IPO浪潮,Anthropic和OpenAI均可能今年上市。他还预计2026年并购交易将创纪录,全球并购规模达3.1万亿美元,同比增35.2%。
苹果在 WWDC 26 发布 iOS 27 等系统,深度集成 Apple Intelligence 的 Siri AI 仅限较新设备。iPhone 需 15 Pro/Pro Max 及 16 全系,iPad 需 M1 或更新芯片或 A17 Pro,Mac 需 M1 及以上,Apple Watch 需 Series 9/Ultra 2 等且搭配兼容 iPhone。高阶端侧 AI 模型(个性化语音语速、情感、语调)要求 12GB 统一内存,仅限 iPhone 17 Pro/Pro Max/Air、M4 12GB iPad、M3 12GB Mac、M5 Vision Pro;iPhone 17 标准版因 8GB 被排除。Siri AI 形成三级准入门槛。
Meta CEO 扎克伯格称,推动AI进步不需要成百上千名研究人员,一个十几至二十几人的团队即可取得进展。他谈及与妻子创办的非营利医学研究组织Biohub时表示,该组织结合AI与生物学,目标在21世纪末前治愈、预防或管理所有疾病。AI研究人员虽抢手,但Biohub的前沿生物学与AI结合的工作独特且难以替代。AI进展让扎克伯格对Biohub提早完成使命感到乐观,但算力获取仍受限。
6月12日,字节跳动旗下AI应用豆包大范围上线“任务模式”,支持定时执行、零代码网页生成、一键PPT生成、数据可视化分析等全链路Agent执行。原“思考模式”升级为“专家模式”,调用豆包大模型2.0 Pro版本,强化深度推理能力。App顶部模式切换改为“快速、专家、任务”。基础功能免费,高阶服务付费,专业版三档:标准版68元/月或688元/年,加强版200元/月或2048元/年,专业版500元/月或5088元/年。
Coinbase for Agents 将 AI 连接到金融执行通道,实现从用户投资组合自动进行交易和支付。大语言模型虽能处理海量数据,但缺乏与活跃金融投资组合的直接集成。个人常利用这些模型评估市场动向或研究投资机会,而这些软件工具具备处理复杂任务的能力。
SpaceX 于周五进行首次公开募股(IPO),公众首次可以购买这家融合火箭、AI 和社交媒体业务的公司股票。此次融资规模巨大,可能使埃隆·马斯克成为首位万亿富翁,其估值基于将 AI 数据中心发射到太空的业务前景。此外,SpaceX 还获得了一份价值 40 亿美元的合同,用于建造导弹追踪卫星“金穹”。