NVIDIAの新AI:驚異の音声生成システム!

1,946 文字

YouTube
作成した動画を友だち、家族、世界中の人たちと共有

これはフガットというNVIDIAの新しいAIシステムで、まるでサウンドのスイスアーミーナイフやと言われてます。でもなんでやろ?ほんまにそんなすごいんかな?今までにも効果音や曲を生成できるAIシステムはあったわけですが、これの何が新しいんでしょう?ほな、見てみましょか。あかん、これはすごいわ。
確かに今までのシステムもいろんなことができましたけど、全部をこなせるシステムはなかったんです。でもこれはできる言うてます。ほな、5つの素晴らしい例を見て確かめてみましょ。
まず一つ目は、テキストから音声への変換です。聞きたい内容を書くだけで、はいできあがり。できれば「Two Minute Papers」の原稿で試して、わたしの仕事を奪わんといてほしいですけどね。ま、見てみましょか。
二つ目はテキストから音声ですが、今度はもっと凄いです。列車が通り過ぎる音が、ストリングオーケストラの音に変わっていく。こんなん無理やろ?聞いてみましょ。
うわ、もっとすごいことをやってみましょ。えっ?人の話し声を合成する?あかん、これで失業確定や。でもちょっと待て、まだ大丈夫かもしれません。視聴者の皆さんが言うてはる通り、この動画の一番ええとこは、わたしが感情とか熱意を込めて話してるとこやし、それは残るはずや。でもこれを見てください。
あかんわ、めっちゃ説得力ある。まだ完璧やないけど、ペーパーの第一法則を当てはめたら、あと数本の論文で間違いなく素晴らしいものになるでしょう。
三つ目は、ミュージシャン向けです。ちょっとしたメロディーはあるけど、まだ曲になってない、そんな時にドラムを追加できます。でもこれがもっとすごなります。
「親愛なる研究者の皆様、カーロイ・ゾルナイ=フェヘール博士のTwo Minute Papersへようこそ」
四つ目、これはまるでSFみたいですけど:ピアノで何か弾くだけで、それを女性の歌声に変換できます。こんなツールがあれば、高価な機材や楽器がなくても、誰でもミュージシャンになれるわけです。めっちゃクールですよね。
五つ目は私の特にお気に入りなんですが、彼らが約束した「創発的な特性」を覚えてますか?つまり、今まで聞いたことのない組み合わせを作り出せるってことです。これこそが、ある種の知能の定義やと思うんで、めっちゃ興奮してます。例えば、予想外の方法で楽器を組み合わせることができます。これがほぼ瞬時に出てくるんです。
研究者の皆さん、しっかり持っててくださいよ。想像力を働かせて、サックスのハウリングとか…もちろん、ミーム的なものも作れます。電子音楽に犬の鳴き声を重ねるとか。
また、声の分離もできて、曲全体を入れると、歌声だけを抽出したり、カラオケ用に伴奏だけを取り出したりできます。
YouTubeの規約の関係で、ここではお見せできませんが、リンクを動画の説明欄に置いておきます。
そして、これはまだ始まりに過ぎません。研究論文には予想外の発見が述べられています。見てください。これはすごい。新システムのフガットは、他の汎用システム、つまり複数のことができるシステムと同じくらい優れています。でも、専用システムはどうでしょう?一つのことだけしかできないけど、それを非常に上手くこなすAIです。そっちの方が優れてるはずですよね?
でも研究者の皆さん、しっかり持っててくださいよ。なんと、このシステムは時々、専用システムさえも打ち負かすことができるんです。これは本当に驚異的です。汎用システムが専門家に勝つなんて。正気の沙汰じゃありません。
これらのシステムは一つのことに超最適化されてるのに、汎用システムが勝ってしまう。オリンピックの水泳選手が突然レスリングに出場してメダルを取るようなもんです。そんなん絶対無理やろ、でもそれに近いことが起こってるんです。なんて素晴らしい時代に生きてるんでしょう!
そして、おそらく最高の部分がこれです。うわー、見てください。これらはスーパーコンピュータを必要としません。めっちゃ小さなモデルなんです。3つのAIシステムのうち2つは、スマートフォンでも動く可能性があるくらい小さいんです。信じられへん。めっちゃクールですよね。
ChatGPTと組み合わせて歌詞を書いてもらい、ここに追加したら、自分だけの曲ができる。あるいは、NotebookLM AIと組み合わせて、技術系の研究論文についてのテキストやポッドキャストを作ることもできます。
そして聞かれる前に言っておきますが、はい、これは人間の私がマイクに向かって話して、毎回興奮して紙を持ちこたえようとしてるんです。
どう思われましたか?研究者の皆さん、これをどんなふうに使いたいですか?コメント欄で教えてください。

コメント

タイトルとURLをコピーしました