最近 Gemini 推出了新的音樂創作功能,只需要簡單的文字指令、圖片或是影片提示,就能夠生成出 30 秒的音樂內容,還附帶有歌詞!在 Google 所展示的示範音樂似乎很完整,而且這項功能並不只限於付費用戶,就連免費用戶也可以生成,本篇塔塔就來告訴大家指令該怎麼下才能產出完整的音樂內容!
Gemini 音樂生成功能怎麼用?
▉ 步驟(一)、選擇圖片、音樂風格
如果是想從無到有生成音樂,但又不知道該如何表達音樂效果的話,可以考慮上傳一張能夠表示歌曲情緒的圖片讓 Gemini 做為參考,後續這張圖片也會自動透過 Nano Banana 來做成音樂封面;目前 Gemini 也提供了 16 種音樂風格給用戶做參考,讓用戶在生成音樂的時候更有靈感提供指令給模型。
接下來塔塔會選擇音樂風格參考來給模型參考,來進行音樂生成的測試與教學。
▼ Gemini 提供 16 種音樂參考風格

▉ 步驟(二)、輸入音樂生成指令
這一個步驟會影響到生成出來的音樂品質,塔塔建議大家盡量將指令打的完整一點,目前 Gemini 生成音樂的指令如果越詳盡的話,生成出來的品質也會比較好,在生成歌曲的指令當中,有幾個要素有關生成品質,分別是「音樂的速度(BPM)」、「音樂配器」、「樂曲風格 / 要素」等,下方提供大家生成指令:
- 音樂創作指令:請創作出拉丁結合些微古巴音樂要素的西洋流行音樂,加入小喇叭、重鼓點,以吉他作為主旋律樂器,使用慵懶但不模糊的 bass 加入根音與和弦,營造出曖昧、拉扯的場景感,請使用微沙啞的古巴女孩歌聲與清爽的美國男孩歌聲進行合唱。
請依照下方詳細的樂曲創作條件進行生成:
1.音樂 BPM:60-80之間
2.配器:吉他、重低音鼓、Bass、彈指聲、爵士小鼓
3.樂曲旋律走向:
主歌:和諧、帶點曖昧不明的模糊感,使用吉他作為旋律走向的主樂器,並搭配上些許彈指聲作為節拍
副歌:前半段加入Bass和弦,加強樂曲的衝突感以及曖昧感,後半段加入鼓點配合彈指聲強調節拍,但不可搶過主旋律以及人聲大小。
▼ Gemini 生成結果
如果與塔塔一樣單純提供文字指令沒有提供圖片的話,Gemini 也會自己生成一個封面,上方的生成結果就是由 Gemini 自己生成出了簡單的動態影片內容,如果想要修改音樂的話,可以直接下指令,不過現在的 Gemini 想要維持一致性,僅修改部分細節的話,目前暫時還沒有辦法做的非常細緻。
塔塔嘗試修改音樂的 BPM,若沒明確說明不可修改哪些部分的狀況下,修改出來的結果與先前生成結果有蠻大不同的;若是下了固定不可改的指令,音樂旋律還是有機率會被修改,沒有辦法像是圖片一樣維持高度相同。
▼ 修改後的音樂效果
▉ 步驟(三)、下載音檔
生成完音樂想要保存的話,Gemini 提供了兩種檔案類型可以保存,點選音樂影片右上角的下載圖示,可以選擇使用 MP4 影片的方式下載或是以 MP3 檔下載,目前還沒有提供 WAV 檔這類較音質較高的檔案類型下載選項。
▼ 點選右上角的下載圖示即可下載音樂

總結、補充
以上就是如何使用 Gemini 來生成音樂的步驟啦!另外塔塔要補充一點,使用 Gemini 生成時,歌曲是不可能完全根據某首歌或是某個歌手的聲線進行複製、製作的,畢竟可能會涉及到版權以及 Deepfake 的問題,所以 Gemini 所產出的音樂只會是類似,但不可能完全一樣的喔!大家快去玩玩看!
首圖來源:AI 生成

