【AI】Meta 推出與 Google 類似的 Podcast 生成器!功能差別

AI、Podcast、meta、google、notebooklm、notebookllama、生成器 文字轉語音 功能 差別 好用嗎

2024-11-02
By 塔塔
開源版本的 NotebookLlma 可以自己調整模型增加了更多可玩性

Meta 近日發布了一項名為「NotebookLlama」的 AI 工具專案,並提供「開源」版本,這項 AI 工具與日前 Google 所推出的 NotebookLM 當中的「音訊總覽功能」相同,能夠將文字或文件轉換成語音,變成像是 Podcast 的對話語音檔,對文件或是文字進行總結與重點擷取。

 

Meta 的 AI Podcast 生成器

NotebookLlama 由 Meta 推出,使用的是 Meta 自家的 Llama 模型進行大部分的運算處理,NotebookLlama 會從使用者上傳到模型當中的文件(例如文章或是 PDF 檔案)建立文字,並將建立好的文字腳本輸入到文字轉語音的模型當中,並加入戲劇化的元素與停頓,讓它聽起來更像是真人製作的 Podcast。

這項功能與塔塔之前曾經介紹過 Google 所推出的 AI 筆記程式 NotebookLM 中的「音訊總覽」功能是相同的,都是將文字或文件轉換成語音檔,只不過 Meta 所推出的版本是開源版本,使用者可以自己調整模型。

 

 

▼ NotebookLlma 模型運作方式

圖片來源:NotebookLlama Github

 

NotebookLlama 成品效果如何?

塔塔實際聽了 NotebookLlama 所產生的 Podcast 範例,對話的聲音聽起來還是有很明顯的機器人聲音痕跡,且空間感聽起來是不一樣的,語速也相對 NotebookLM 快了一點,不過根據 Meta 計畫人員表示,NotebookLlama 可以透過更強大的模型來提高品質。

不過目前不管是 Google NotebookLM 還是 Meta NotebookLlama,都無法解決 AI 模型會出現幻覺的問題,也就是說無論是哪一個軟體,AI 給出的資訊都有可能是虛構、捏造出來的。

 

 

圖片來源:Unsplash

 

 

總結

Meta 所推出的 NotebookLlama 模型還有更多的進步空間,雖然目前聽起還是生硬,且機器感較重, Meta 技術人員也表示文字轉換語音的模型限制了聽覺上的自然感,但因為是開放版本,使用者可以透過調整模型來提升品質,同時也擁有更多可能性,但幻覺問題仍是使用者在使用任何一種 AI 產品的時候必須要注意分辨,也是服務商需要解決的問題。

 

首圖來源:Unsplash

資料來源:Techcrunch

AI 指南

      ◆ AI 即時資訊

標籤:
相關文章
喜歡我們的文章嗎
給一個讚吧~^^
複製成功