【新智元导读】在大模型训练中,高质量数据的不足已成为限制其持续进化的瓶颈。Meta最新提出的语言自我博弈(Language Self-Play, LSP) 方法,或许为这一难题带来突破。
2 个赞
【新智元导读】在大模型训练中,高质量数据的不足已成为限制其持续进化的瓶颈。Meta最新提出的语言自我博弈(Language Self-Play, LSP) 方法,或许为这一难题带来突破。