蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/HeartBench

2025-12-19 14:35·178天前·inclusionAI

AI 摘要

HeartBench是一个面向心理学与社会科学领域的评估基准，旨在超越传统的知识与推理评测。该基准专注于衡量大语言模型在人机交互中拟人化的能力，覆盖了人格、情绪、社交技能及道德伦理等多个维度。它通过系统化的评估框架，为衡量模型是否具备更接近人类的心理与社会属性提供了量化标准。

该来源未收录可展示正文，站内仅提供摘要。

安全/对齐论文/研究评测/基准

蚂蚁 inclusionAI：GitHub 新仓库

2025-12-19 14:35·178天前·inclusionAI

AI 摘要

该来源未收录可展示正文，站内仅提供摘要。

安全/对齐论文/研究评测/基准