話し合うべきこと

Output:

  1. ビジネス向け & コンペでの優勝のために目指すべき評価指標の決定
  2. 評価指標における精度向上のため使用すべき事前学習データセットの重要度決定

補足:

  1. 今回のコンペでは、LLM-jp-eval + JMTBench + α (こちらが重くなるかも)
  2. wandbのベストプラクティスを確認し、私たちのLLMが目指すべき目標(評価指標)を決定

https://site.wandb.ai/wp-content/uploads/2024/04/LLM-Evaluation-Whitepaper.pdf

4/27 議事録

方針

そもそも既存の大規模言語モデルではなく、今回開発するローカルLLMを使ってもらう利点と用途は?