【AI 模型】新一代偵測模型問世!Detect-2B 讓深偽無所遁形

deepfake、ai、深偽

2024-07-09
By 塔塔
媽媽再也不用擔心我被 AI 騙啦!我(的偵測模型)很聰明的!

隨著生成式 AI 技術越來越好,出現了許多 AI 圖片騙過平台的辨別機制,被誤判是真實圖片。就連聲音也不例外,AI 的聲音經過大量的資料學習之後變得越來越像真人,人耳再也無法從失真的語調判斷是否為 AI 生成的聲音,產生越來越多的假資訊,怎麼有效辨別成了問題,不過別擔心,現在有間開發公司開發出可以分辨 AI 生成的 Deepfake 音訊,據稱準確度高達 94 %。

 

Detect-2B 是甚麼?

Detect 模型的開發公司是提供生成式 AI 語音技術和 Deepfake* 音訊偵測模型的 Resemble AI ,最近發表新一代 Deepfake 偵測模型 Detect-2B,此模型通過了測試集,其中包括看不見的說者、Deepfake 生成的音訊和不同的語言。Resemble AI 表示,該模型正確檢測了 6 種不同語言的 Deepfake 音頻,準確率至少為 93 %。 

 

(Deepfake*:深偽技術,指應用人工智慧深度學習的技術,合成某個不一定存在的人的圖像或影片、甚至聲音。)

 

 

▼ Detect-2B 檢測 6 種語言準確率

圖片來源:Resemble AI

Detect-2B 介紹

此模型核心為多個子模型的集合,子模型由停滯的音訊表現模型和插入其關鍵層的適應模組組成,適應模組會學習將模型的焦點轉移到區分真音訊和假音訊微小偽影上,而不用從頭重新訓練整個模型,保持相對快速的處理速度。

Detect-2B 的模型架構是基於狀態空間模型 Mamba-SSM,透過改進序列建模能力來增強 Deepfake 檢測模型的能力,它使用隨機或隨機機率的模型,不使用靜態資料或重複模式,可以更好的回應不同變數、分辨傳統分別器可能錯過的微小偽影,同時 Mamba-SSM 整合自我監督訓練模型,增強分辨系統。

Detect-2B 辨別音訊真假的流程簡單來說,使用者將想要分辨真假的音訊檔案上傳後,Detect-2B會將音訊切片,並針對這些切片進行虛假性評分,最後將分數匯總後與閾值比較後得出結果,推斷這段音訊是真實的還是 AI 製作出來的。

 

如何使用 Detect-2B?

Resemble AI 提供兩種方式給使用者將 Detect-2B 整合到自己的系統中使用:

  • 使用應用程式介面(API) 整合:此方法便於單獨或批量上傳音訊檔案,且可以自行調整分類閾值減少誤報或漏報的機率;可以選擇查看原始虛假分數或分數匯總預測選項。

 

  • 使用基於網路的儀表板整合:這個方法提供給喜歡視覺互動的人一個友善的使用者介面,不須透過應用程式介面,能夠輕鬆上傳音訊檔案、調整設置以及查看最終結果。

 

總結

生成式 AI 技術帶給我們很多驚喜,不過也出現了越來越多難以分辨的資訊,有時候眼見不一定為真,耳聽也不一定是真實的,在分辨網路資訊的時候都會困惑到懷疑人生,使用 Detect-2B 這類型的 Deepfake 偵測模型來協助辨別資訊真實性,就不用每次都懷疑到底我們聽到的音訊是真人創作還是 AI 生成、是真實資訊還是混淆視聽的假資訊,減少被誤導的可能性。

 

 

首圖來源:Pixabay

資料來源:VentureBeatResemble AI

相關文章
喜歡我們的文章嗎
給一個讚吧~^^
複製成功