※ v0.1の内容です(2024/03/04時点)

大規模言語モデルをフルスクラッチする練習 (環境構築ー事前学習まで)|Kan Hatakeyama

メモ

理解したこと、気になったことをメモ

気づいたこと:

1件バグで,以下のフィルタリング部分

!python -m preprocessing.filtering --input_dir=input --output_dir=output