用于学习语义丰富视觉表征的文本条件JEPA · AI HOT