説明
cyberagent/chatbot-arena-ja-calm2-7b-chat-experimental
(ORPO用のPreferenceデータ)の質を高める
Todo
[x]
cyberagent/chatbot-arena-ja-calm2-7b-chat-experimental
の重複データを削除
[x] promptが一致するデータを削除して
GENIAC-Team-Ozaki/chatbot-arena-ja-calm2-7b-chat-experimental_deduped
にup
[ ] 質問文について、「1: そのまま使用可能、
2: 修正が必要
、3: 削除するべき」の3段階にアノテーション
[ ]
「修正が必要」と判断された質問文を修正する
[ ] 回答文(chosen)を作成する(人手 or LLM?)
質問文のアノテーション
作業手順
質問文の修正
LLMで回答生成
karakuri-ai/karakuri-lm-8x7b-chat-v0.1
を使ってchosenの回答を生成する