自动准则即奖励:从隐式偏好到显式多模态生成准则 · AI HOT