by abe_tetsuya(Slack名 )
あけましておめでとうございます。本年もよろしくお願いいたします<(_ _)>
昨年末の決勝の余韻が冷めず、何も手に付かないので先にアウトプットしてしまおうと思います。
申し遅れました。abe_tetsuya です。 とてもありがたいことに、本選に選出された上に、最終結果12位となりました。 本当にありがとうございます。
皆さん、人力評価時に「ん?」と思うモデルは無かったでしょうか?
【思考の過程】
~~~
【回答】
~~~
ってやつです。
あれの作り方を以下に記載します。
AI初心者なので、最初以下ルールで進めていた。
・サンプルソース(llm-jp-3-13b)を踏襲(大きく変更しない)
・dataset、学習パラメータを小変更してスコアの変異を観察。一番良い設定を探る
・可能ならMoE、CoT、自己検証等を試す
しかしながら全く成果が無く、サンプルソースを超えられないまま残り4日となった。
諦めモードで、遊びでgemma-2-9bを試したところ
llm-jpでは解けなかった数式や論理的タスクが解けることに気付く
(ただしスコアは2.0程度)