映像がどれだけ美しくても、BGMが合っていなければ作品としての完成度は大きく下がります。逆に、ぴったりのBGMがあるだけで、シンプルな映像でも視聴者を引き込む作品に変わります。
SUNO AIは、テキストプロンプトから音楽を生成できるツールです。音楽制作の専門知識がなくても、ムードや楽器、テンポを指定するだけで、映像に合ったBGMを作れます。この記事では、SUNOの基本から、GeminiやChatGPTを使ったプロンプト自動生成のワークフローまで、実践的なテクニックを解説します。
なぜBGMが重要なのか
BGMは動画の「感情のレール」です。視聴者がどんな気持ちでシーンを見るかは、映像と同じくらいBGMに左右されます。
- テンポが動画のリズム感を決める
- キー(調)が明るさや暗さの印象を決める
- 楽器の選択が世界観を決める(ピアノ=上品、ギター=カジュアル、オーケストラ=壮大)
- 音量の変化がシーンの緩急を作る
フリー素材のBGMを使う方法もありますが、AI動画制作では映像ごとに最適化されたオリジナルBGMを作ることで、作品の独自性と品質を大幅に高められます。
SUNO AIの基本
SUNOは「Styles」フィールドにテキストプロンプトを入力するだけで音楽を生成します。音楽理論の知識は不要です。
基本的な使い方
- SUNOにアクセスする
- 「Create」を選択する
- 「Styles」フィールドにプロンプトを入力する
- 生成ボタンを押す(複数のバリエーションが生成される)
- 気に入ったものを選んでダウンロードする
ポイントは、プロンプトは英語で書くということです。SUNOは英語のスタイル記述子に最も良く反応します。日本語でも動作しますが、英語の方が意図通りの結果が得やすいです。
プロンプトに含めるべき要素
効果的なSUNOプロンプトには、以下の要素を含めます。
| 要素 | 説明 | 記述例 |
|---|---|---|
| ムード/雰囲気 | 音楽の感情的な方向性 | melancholic, uplifting, mysterious, playful, dramatic |
| 楽器 | 使用する楽器の指定 | piano, acoustic guitar, strings, celesta, synthesizer |
| テンポ | 速さの指定 | slow, medium-tempo, upbeat, fast-paced |
| スタイル/ジャンル | 音楽のジャンル | cinematic, lo-fi, orchestral, jazz, ambient, pop |
| ボーカルの有無 | BGMなのでボーカルなし指定が基本 | no vocals, instrumental |
| ループ性 | ループさせたい場合に指定 | loopable, seamless loop |
BGM用のプロンプトには必ず「no vocals」と「instrumental」の両方を含めてください。片方だけだとボーカルが入ることがあります。
Geminiを使ったプロンプト自動生成ワークフロー
SUNOのプロンプトを自分でゼロから書くのは、音楽の語彙がないと難しいです。そこで、GeminiやChatGPTにプロンプトを生成してもらうワークフローが非常に有効です。
ワークフローの流れ
- 動画のコンテキストを記述する — どんなシーンか、どんな感情か、どんな雰囲気か
- GeminiまたはChatGPTに「SUNOプロンプトを作って」と依頼する
- 生成されたプロンプトをSUNOの「Styles」フィールドにペーストする
- 生成結果を聴いて、必要に応じてプロンプトを微調整する
Geminiへの依頼テンプレート
以下の動画シーンに合うBGMのSUNOプロンプトを英語で作ってください。
【シーンの説明】
カフェで女性が窓の外の雨を見ながら、
過去の楽しかった思い出を振り返っている。
少し切ないが、前向きな気持ちも感じられる場面。
【要件】
- ボーカルなし(instrumental)
- 60秒程度
- ループ可能だと嬉しい
SUNOの「Styles」フィールドに直接ペーストできる形式で、
カンマ区切りのキーワード形式でお願いします。
Geminiの出力例
melancholic yet hopeful, soft piano, gentle strings,
raindrop-like celesta notes, medium-slow tempo,
cinematic, warm, nostalgic, bittersweet,
instrumental, no vocals, loopable
この出力をそのままSUNOにペーストするだけです。Geminiは映像のコンテキストを理解して、適切な音楽用語に変換してくれるので、音楽の知識がなくても高品質なプロンプトが作れます。
Geminiに動画の映像を渡す方法
テキストで説明するだけでなく、Geminiに実際の動画映像や画像をアップロードして「この映像に合うBGMのSUNOプロンプトを作って」と依頼することも可能です。映像のトーンや雰囲気をAIが直接分析するため、より正確なプロンプトが生成されます。
AI動画制作をもっと深く学びたい方へ
Algentio AI Professional Academyでは、AI動画制作を含むAI活用スキルを体系的に学べるプログラムを準備中です。
LINEで開講情報を受け取るシーン別プロンプト実例集
以下は、動画制作でよく使うシーンタイプ別のSUNOプロンプト例です。そのままコピーして使えます。
クリスマス/ファンタジー系
whimsical, orchestral pop, pizzicato strings, celesta,
magical, christmas, cute, playful, marching rhythm,
bright, instrumental, no vocals
壮大な神話/ファンタジー系
Grand hall of the Norse gods in a stone palace in Asgard,
Heroic but calm introduction of Odin, Thor and Loki,
Orchestral soundtrack with noble horns, deep strings
and subtle choir, medium-slow tempo,
Add occasional deep male Viking-style shouts
and wordless chanting, more mystical and ancient atmosphere,
echoing hall reverb, dignified and warm,
no clear sung lyrics, soundtrack style
日常Vlog/カフェシーン
lo-fi, chill, acoustic guitar, soft piano,
warm, cozy, cafe atmosphere, medium tempo,
gentle, relaxing, everyday life feel,
instrumental, no vocals, loopable
緊張/サスペンス
tense, suspenseful, dark ambient, low drone,
sparse piano notes, building tension,
slow tempo, cinematic, thriller,
unsettling, atmospheric,
instrumental, no vocals
感動的なエンディング
emotional, uplifting, piano and strings,
building crescendo, hopeful, cinematic,
warm, inspiring, bittersweet,
medium tempo, soundtrack style,
instrumental, no vocals
POV アトラクション/アクション
exciting, adrenaline, fast-paced,
electronic beats, synth bass, driving rhythm,
action movie soundtrack, energetic,
building intensity, heart-pounding,
instrumental, no vocals
実践テクニック
「no vocals」と「instrumental」は必ず両方指定
SUNOはデフォルトでボーカルを入れようとする傾向があります。no vocalsとinstrumentalの両方をプロンプトに含めることで、ボーカルなしの純粋なBGMが生成される確率が大幅に上がります。
「loopable」でシームレスなループを作る
BGMは動画の長さに合わせてループさせることが多いです。プロンプトにloopableを含めると、始まりと終わりがスムーズにつながる音楽が生成されやすくなります。待機画面や背景音楽に最適です。
複数バリエーションから選ぶ
SUNOは同じプロンプトでも毎回異なる結果を生成します。最低3〜4回生成して、ベストなものを選んでください。同じプロンプトでも、テンポや楽器のバランスが微妙に異なるバリエーションが出てきます。
長さの調整
SUNOで生成される楽曲の長さはプロンプトでは直接制御できないことが多いです。必要な長さより長めに生成して、編集ソフトでトリミングするのが確実です。
映像とのタイミング合わせ
生成されたBGMのテンポが映像のカットのリズムと合っていない場合は、テンポの指定を変えて再生成するか、動画編集ソフトで微調整します。映像のカットポイントとBGMのビートが合うと、作品の完成度が格段に上がります。
制作ワークフローまとめ
AI動画のBGM制作ワークフローを整理します。
1. 動画のシーンを把握する
→ どんな感情?どんな雰囲気?何秒くらい必要?
2. GeminiまたはChatGPTにプロンプト生成を依頼
→ シーンの説明 + 要件を伝える
→ カンマ区切りのSUNOプロンプトを受け取る
3. SUNOで生成
→ 「Styles」フィールドにプロンプトをペースト
→ 3〜4バリエーション生成
4. ベストを選んでダウンロード
→ 映像に合わせて試聴
→ 合わなければプロンプトを微調整して再生成
5. 編集ソフトで最終調整
→ 長さのトリミング
→ 音量バランスの調整(ナレーションとの干渉に注意)
→ フェードイン/フェードアウトの追加
BGM制作は「音楽の知識がないからできない」と思われがちですが、GeminiやChatGPTをプロンプト翻訳者として使うことで、映像の雰囲気を言葉で伝えるだけで適切な音楽が作れます。まずはシンプルなシーンから試してみてください。