コレクション関連
- フルスクラッチで開発する場合,データがそもそも足らない可能性がある.
- 英語データを混ぜるのは必然
キュレーション関連
- 一般的な手法は一旦網羅したほうがいい.
- 日本特有のフィルターは意外と高品質化に役にたった.
学習関連
- フルスクラッチはきついで.覚悟しいや.
- 学習は止まるから,チェックポイントを逐次つけておくべき
- GPUは壊れるので,与えらたGPUリソースから一部を残して別のタスク用に使ったほうがよい.
- 学習用のノード数が2のべき乗になるように残すのがおすすめ.
- ex.40与えられたら32ノードを使って8ノード残すみたいな.