今回の最終課題では、最終的に以下の成績を取り、優秀賞をいただくことが出来ました。
本レポートではこのモデルの開発に関してまとめます。
初めまして、Aratakoと申します。普段は通信関連企業でエンジニアをやっております。 業務においてもLLMを扱っていますが、基本的にGPTやClaude等のAPI経由でアクセスするものを扱っており、いわゆるローカルLLMについては現在のところほぼ個人の興味として触っております。
SNSアカウント等はこちら https://lit.link/aratako
今回のレポートでは、最終課題公開からの開発方針決定、ベースモデルの選定、学習、量子化と推論という流れでまとめます。
最終コンペの内容公開を受け、まず初めにルールの熟読とタスクの目視確認を行いました。それぞれ以下のような部分を特に見ていました。
コンペルールについては、以下のように主に制約事項を確認しました。