Soohak:一个用于评估大语言模型研究级数学能力的数学家编写基准 · AI HOT