本最終課題では、以下の成績を収め、優秀賞をいただくことができました。
本レポートでは、モデルの開発における方針や工夫についてまとめます。
はじめまして、Rikuto Nakamoto (slack名) と申します。本LLM講座から松尾研のコミュニティに参加いたしました。
これまでは独学で AI の勉強を続けてきましたが、限界を感じることも多くありました。このようなオープンで活発なコミュニティに参加できたことで、多くのことを学ぶことができ、非常に貴重な経験となりました。
このような素晴らしい機会を提供してくださった運営の皆様に、心より感謝申し上げます。🙇
現在、LLMATCHの研究員として、LLM拡張プロジェクトに携わっています。麻雀のゲーム分析をテーマに研究を進めています。
関心をお持ちの方や、関連分野(ゲームAI、強化学習など)にご知見のある方がいらっしゃいましたら、ぜひご協力いただけますと幸いです。一緒に研究を深める機会をいただけることを楽しみにしております。
本最終課題は「ELYZA-tasks-100」という日本語能力を測るベンチマークの改変版である「ELYZA-tasks-100-TV」で高スコアを獲得することを目標とします。
最終課題の規約で「予選リーダーボードを用いたチューニングは禁止」とあったため、今回は「ELYZA-tasks-100」のスコア向上を目標として開発を行いました。
最終課題で利用可能なベースモデルとして、以下の2つが提供されていました