
Musenet (ミューズネット)とは
MuseNetは、OpenAIが作成した深層ニューラルネットワークで、最大10の異なる楽器で4分間の音楽作品を生成することができます。
これは、カントリー、モーツァルト、ビートルズなど、異なるジャンルのスタイルを組み合わせたものです。
このモデルは、GPT-2と同じ汎用の教師なし技術に基づいており、音声またはテキストの次のトークンを予測するためにトレーニングされた大規模なトランスフォーマーモデルです。
モデルは連続したデータでトレーニングされ、一連の音符が与えられた場合に次の音符を予測するように求められます。
それはコードワイズエンコーディングを使用し、1回に鳴るすべてのノートの組み合わせを個別の「コード」として考慮し、各コードにトークンを割り当てます。
さらに、作曲家と楽器トークンは、MuseNetが生成するサンプルの種類をより制御するために使用されます。
このモデルは、異なるスタイルや楽器をブレンドした音楽を生成し、また、作品の長期的な構造を記憶することができます。
これは、Classical ArchivesやBitMidi、MAESTROデータセットなど、さまざまなソースから収集されたデータセットを使用してトレーニングされています。