GPT-NeoX:让大规模语言模型训练更高效GPT-NeoX 是一个基于 Megatron 和 DeepSpeed 的 GPU 并行训练框架,专为大规模语言模型设计。2023/6/22Read More