OpenAssistant とは、 LAION が主導して行われた大規模なオープンなインストラクションデータセット収集プロジェクト、また、それによって作成されたデータセットのことである。データセットの方は oasst と呼ばれることが多いかもしれない。
最終的に 13,500 人のボランティアが参加し、35 の言語に渡って 66,497 の会話、161,443 のメッセージ、461,292 のレビューが集まった。
OpenAssistant/oasst2 · Datasets at Hugging Face
OpenAssistant Conversations -- Democratizing Large Language Model Alignment
概要や流れは以下のサイト参照。
誰でも参加できるオープンソースの大規模言語処理モデル「Open Assistant」開発プロジェクトをLAION AIがスタート