FrontierMath评测发现致命错误,将更新修正后分数 · AI HOT