過去幾個月,「AI 繪圖模型」的出現在藝術界引起了不少討論。AI 繪圖模型的方便之處在於,就算是完全不懂繪畫的業餘人士,也能透過「輸入關鍵字」來讓 AI 繪圖模型產生一張繪畫,其繪畫的精細程度甚至不亞於人類專業畫家。
Google 近日在 GitHub 上介紹全新的 AI 音樂模型:MusicLM,就像 AI 繪圖模型一樣,只要輸入一段文字敘述,MusicLM 就能產生一段符合文字敘述的音樂出來。
MusicLM 簡單介紹
雖然 MusicLM 並不是第一個 AI 音樂模型,但礙於技術限制和不足的訓練數據,目前還沒有任何一個 AI 音樂模型能創作出旋律複雜或擁有高保真度的歌曲。MusicLM 透過長達 280,000 小時的音樂資料庫來進行訓練,並學習如何產生連貫的歌曲,Google 官方更直接這麼說:「不論是音樂品質或對於文字敘述的準確度,MusicLM 都比過去的 AI 音樂模型更加優秀。」
可惜的是,礙於版權因素和歌曲被盜用的風險,Google 目前還沒有發表 MusicLM 的計畫,所以我們無法親自玩玩看 MusicLM 有多厲害。不過,Google 倒是有在 GitHub 裡上傳了大量的 MusicLM 音樂樣本,因為數量太多的關係,因此 LINA 只會列出幾個音樂樣本當作範例,有興趣的人可以到 GitHub 試聽看看喔!
▉ 範例 1:透過「豐富的文字敘述」來產生音樂
首先是最基本的,給予一整段完整且豐富的文字敘述,讓 MusicLM 產生符合敘述的音樂旋律,像是:
街機遊戲的主要配樂。
節奏輕快又活潑,帶有洗腦的電吉他重複樂段。整段旋律不斷重複、讓人能輕易記住,但音樂中會有意想不到的聲音出現,像是鼓聲或鈸的撞擊聲。
▉ 範例 2:只給標題所生成的音樂
即便沒有整段的文字敘述、只給 MusicLM 一個標題,它也能產生對應的音樂旋律,像是:
輕鬆的爵士樂。
▉ 範例 3:故事模式的音樂
在故事模式中,MusicLM 的音樂旋律是透過一系列的文字提示而產生的,像是:
冥想時間(0:00~0:15)
醒來時間(0:15~0:30)
跑步時間(0:30~0:45)
100% 付出時間(0:45~0:60)
▉ 範例 4:由「繪畫文字敘述」來產生音樂
不管是美術展或維基百科,那些經典畫作都會有一段關於背景、意象的相關敘述,MusicLM 還能根據這段敘述產生音樂,像是:
《跨越阿爾卑斯山聖伯納隘道的拿破崙》。
這幅畫作展示了拿破崙和他的軍隊在發動馬倫哥戰役前,於 1800 年 5 月通過聖伯納隘道穿越阿爾卑斯山的強烈理想化景象。
▉ 範例 5:根據「類型、地點、經驗水平」產生的簡單音樂
MusicLM 另一個有趣的地方是,它還可以根據樂器種類、音樂類型、地點或音樂家經驗水平等項目,產生約 10 秒的音樂旋律,像是:
樂器種類:大提琴。
音樂類型:8 bit 音樂。
地點:加勒比海的海灘。
音樂家經驗水平:鋼琴的初學演奏者。
音樂家經驗水平:鋼琴的專業演奏家。
總結
Google 官方表示,MusicLM 的功能不僅限於產生短短的歌曲音樂,它還能以「已經存在的旋律」為基礎產生新的音樂,不管是哼歌、演唱、吹口哨還是在樂器上演奏。
雖然 Google 似乎對 MusicLM 充滿信心,但從上方的樣本音樂都能聽出來,MusicLM 在音質方面…實在還稱不上是「優秀」的程度。
不過 Google 官方畢竟還沒給出 MusicLM 的確切發表時間,搞不好 MusicLM 真正上市的那天或許會有更驚人的表現也說不定喔?
首圖來源:9to5Google