BalCapRL: 基于强化学习的MLLM图像描述平衡框架 · AI HOT