標準コードに記載のOSSについては内容を把握できているとスムーズ
Megatron-DeepSpeed
大規模言語モデル(LLM)の作り方 Megatron-DeepSpeed編 Part1
大規模言語モデル(LLM)の作り方 Megatron-DeepSpeed編 Part2
GitHub - microsoft/Megatron-DeepSpeed: Ongoing research training transformer language models at scale, including: BERT & GPT-2
Megatron-LM