はじめに

今回の最終課題では、最終的に以下の成績を取り、優秀賞をいただくことが出来ました。

本レポートではこのモデルの開発に関してまとめます。

簡単な自己紹介

初めまして、Aratakoと申します。普段は通信関連企業でエンジニアをやっております。 業務においてもLLMを扱っていますが、基本的にGPTやClaude等のAPI経由でアクセスするものを扱っており、いわゆるローカルLLMについては現在のところほぼ個人の興味として触っております。

SNSアカウント等はこちら https://lit.link/aratako

今回のレポートでは、最終課題公開からの開発方針決定、ベースモデルの選定、学習、量子化と推論という流れでまとめます。

開発方針について

最終コンペの内容公開を受け、まず初めにルールの熟読とタスクの目視確認を行いました。それぞれ以下のような部分を特に見ていました。

コンペルールについては、以下のように主に制約事項を確認しました。