HuggingFace Daily Papers(社区热门论文)
55
安全还是无能?重新思考手机使用智能体的安全评估
AI 摘要
研究团队推出PhoneSafety基准测试,包含从130多个应用的真实交互中提取的700个安全关键时刻,以评估智能体在风险决策中的表现。测试区分三种行为:采取安全行动、不安全行动或无法执行任何有效操作。对八个代表性智能体的评估发现,更强的通用手机操作能力并不总意味着在风险时刻能做出更安全的选择;而“无法行动”更多反映的是能力限制(尤其在视觉和操作复杂度高的界面中),而非安全意图。结果表明,无害的结果不足以证明安全性,必须将不安全判断与行动无能区分开来。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文arxiv.org