こんにちは!AIテックメディア編集部です。みなさん、普段「音楽」とどう接していますか?
「聴くのは好きだけど、作るのは難しそう…」
「子供の動画にいい感じのBGMをつけたいけど、著作権が心配」
そんなふうに思っている方に、とってもワクワクするニュースをお届けしますよ。画像生成AIで有名なStability AIから、「Stable Audio 2.0」という新しい音楽生成AIがリリースされました。
これ、何がすごいかというと、なんと「鼻歌」や「机を叩く音」をアップロードするだけで、AIがそれを元にカッコいい曲にアレンジしてくれるんです!しかも、これまでは短いフレーズしか作れなかったのが、しっかりとした構成のある「3分間の曲」が作れるようになりました。
今回は、この「Stable Audio 2.0」を使って、私たちの生活や趣味がどう楽しくなるのか、私の体験談も交えて優しくご紹介しますね。
Stable Audio 2.0って何が変わったの?
これまでの音楽生成AIは、数十秒程度の短いループ音源を作るのが精一杯なものが多かったんです。でも、今回のバージョンアップで、まさに「曲」と呼べるものが作れるようになりました。
最大3分間の「構成がある」曲作り
Stable Audio 2.0の最大の特徴は、最長3分の楽曲生成が可能になったことです。しかも、ただ長いだけではありません。
- イントロ(導入)
- 展開(盛り上がり)
- アウトロ(終わり)
といった、曲としての「構造」をAIが理解して作ってくれるんです。「ラジオから流れてくるような曲」が、ボタン一つで出来上がるイメージですよ。
魔法の機能「Audio-to-Audio」
そして、私が一番感動したのがこの機能です。テキストで「楽しいピアノの曲」と指示するだけでなく、自分が録音した音をAIに聞かせて、それを別のスタイルに変換できるんです。
例えば、私、先日子供と一緒に試してみたんです。子供が適当に「ふふ〜ん♪」と歌った鼻歌を録音して、Stable Audio 2.0にアップロード。「壮大なオーケストラ風に」とお願いしたら……なんと、映画のワンシーンのような曲に生まれ変わったんですよ!子供も「えっ、これ僕の歌!?」と大興奮でした。
このように、マルチモーダル(テキスト以外のデータも扱える)な進化は、音楽の世界でも急速に進んでいます。
💡 関連記事をチェック
マルチモーダルAIの進化は音楽だけではありません。Meta社の最新モデルも、画像と言語を組み合わせて新しい可能性を切り開いています。
【速報】Meta「Llama 3.2」発表。エッジAIとマルチモーダルの融合がもたらす日本企業の「勝ち筋」
生活や趣味でどう使う?おすすめ活用法3選
「でも、プロのミュージシャンじゃないし…」なんて思わなくて大丈夫です。むしろ、私たち一般の生活にこそ、楽しい使い道がたくさんあるんですよ。
1. 家族の思い出VlogのBGMに
スマホで撮った家族旅行の動画や、ペットの動画を編集する時、BGM選びに困りませんか?既存の曲だとYouTubeやInstagramにアップした時に著作権でミュートされてしまうことも…。
Stable Audio 2.0なら、「明るい、アコースティックギター、日曜日の朝」といったキーワードを入れるだけで、オリジナルのBGMが3分間作れます。世界に一つだけのBGMで、思い出を彩ってみましょう。
💡 関連記事をチェック
音楽ができたら、次は動画編集もAIにお任せしてみませんか?動画スキルが資産になる時代の到来です。
動画編集スキルがAIで“爆速”資産に?HeyGen活用で変わる新しいお仕事スタイル
2. 勉強や仕事の集中用BGM(Lo-Fi Hip Hop)
在宅ワークや資格勉強中、「歌詞のない落ち着いた曲が欲しいな」と思うことはありませんか?私はよく「雨の音と静かなピアノ」や「Lo-Fi Hip Hop」を作って流しています。3分間の曲をいくつか作ってプレイリストにすれば、自分だけの最強集中ゾーンの完成です。
3. 子供の創造性を育む遊びとして
先ほどの鼻歌の例のように、子供の出した音が「楽器」に変わる体験は、創造力をすごく刺激します。手を叩くリズムをドラムに変えたり、お鍋を叩く音をシンセサイザーに変えたり。「音遊び」の延長で、AIに触れる良い機会になりますよ。
旧バージョンと何が違う?わかりやすく比較!
以前の「Stable Audio 1.0」と今回の「2.0」の違いを、表にまとめてみました。
| 機能・特徴 | Stable Audio 1.0 (旧) | Stable Audio 2.0 (新) |
|---|---|---|
| 生成できる長さ | 最大90秒 | 最大3分 |
| 曲の構成 | 単調なループが多い | イントロ・展開・アウトロあり |
| 入力方法 | テキストのみ | テキスト + 音声 (Audio-to-Audio) |
| おすすめ用途 | 短い効果音、TikTok等のループ音源 | YouTube動画、歌のバックトラック |
これからのAI音楽と、ちょっとした注意点
AIで簡単に音楽が作れるようになると、「本当にこれ、使っていいの?」という不安も出てきますよね。Stable Audioは、学習データに著作権をクリアした音源(AudioSparx)を使用しているため、比較的安心して使えると言われています。
ただし、「特定のアーティストの曲をアップロードして、似た曲を作らせる」といった行為は、著作権侵害のリスクがあるため絶対にNGですよ。あくまで、自分の鼻歌やオリジナルの音を使って楽しむのがポイントです。
AI技術は日々進化し、法律もそれを追いかけている状態です。最新のコンプライアンス事情を知っておくことも、長く楽しむコツかもしれませんね。
💡 関連記事をチェック
AIを使う際のリスク管理については、企業の導入事例からも学べることが多いです。法的リスクについての記事も参考にしてみてください。
Apple「OpenELM」が示唆するエッジAIの未来と法的リスク――企業導入におけるコンプライアンスの要諦
また、こうしたAIの進化は、高性能な半導体チップの進化があってこそ。普段は見えない部分ですが、技術の土台を知るのも面白いですよ。
よくある質問 (FAQ)
- Q1. Stable Audio 2.0は無料で使えますか?
- A. はい、無料プランが用意されています。毎月一定数の曲を生成できますが、商用利用(作った曲を販売するなど)を考えている場合は、有料プランへの加入が必要になる場合があります。
- Q2. スマホでも使えますか?
- A. 基本的にはWebブラウザ上で動作するサービスなので、スマホのブラウザ(ChromeやSafariなど)からアクセスして利用可能です。鼻歌をスマホのマイクで録音してそのままアップロード、なんて使い方もできますよ!
- Q3. 日本語での指示(プロンプト)は通じますか?
- A. 公式には英語でのプロンプト入力が推奨されていますが、DeepLなどの翻訳ツールを使って「明るいポップス、ピアノ、ドラム (upbeat pop, piano, drums)」のように単語を並べるだけでも十分良い曲が作れますよ。
音楽は、聴くだけでなく「創る」楽しみも、AIのおかげで私たちの手元にやってきました。ぜひ今週末、お子さんと一緒に、あるいは一人時間の楽しみに、Stable Audio 2.0で「作曲家デビュー」してみませんか?


コメント