松尾研LLM開発プロジェクト*1 たぬきチームの週次報告です。

8チームに分かれ、各チームで大規模言語モデルをフルスクラッチで作りその性能を競います。最終的には500億パラメータサイズの大規模言語モデル開発することを目的としています。LLM開発プロジェクトの裾野を広げるという教育的要素もあるプロジェクトです。

録画

https://zoom.us/rec/share/9zsJ4hbOodgTJ5TJ0d4FpDFT2amdxjsTkhKMX-SiunoFk0fBmIW0_p7ioXbU9EJ5.Z0eZkfrR0B74tWd5

パスコード: H*D5MVeq

開発テーマ・概要

チーム全体の開発状況

サブチームからの情報共有:

  1. 指示データセット
  2. 事前学習データセット
  3. Code

ディスカッション: