【AI 教學】Sora OpenAI 是什麼?如何使用?與真實影像比較

缺點 怎麼使用 應用 人工智能 影片製作 何時 哪時候 開放 可以用 原理 潛在危機 問題

2024-03-11
By 瓦特
Sora 是什麼?怎麼使用?
可能衍生出哪些社會問題?

自 ChatGPT 問世後,各類 AI 生成技術彷彿雨後春筍般湧現,其中「影片生成」更是不少 AI 公司相互競爭的熱門領域,而近期 OpenAI 新發佈的影片生成式 AI 「Sora」更是引起全球熱烈關注,即使你不懂剪輯軟體、不擅拍攝,未來也可以透過指令輸入,讓 Sora 幫你製作出精緻的短影片!

那 Sora 到底是什麼呢?又該如何使用呢?以下就讓瓦特帶大家一起來了解 OpenAI 旗下的影像生成 AI -「Sora」吧!

 

目錄

  1. 什麼是 Sora?
    1. Sora 運作原理與應用
    2. Sora 生成影像與真實影像比較
    3. Sora 有哪些缺點?

  2. Sora 如何使用?

  3. 總結、Sora 未來可能帶來的風險?

 

 

什麼是 Sora OpenAI?

簡單來說,Sora 就是款由 OpenAI 新開發的影片生成式 AI,用戶只要於 Sora 中輸入指令文字,便可一次性讓其生成出長達 1 分鐘的影片內容。

聽到這裡或許有些人會覺得:「奇怪?影片生成 AI 不是早就有了嗎?Sora 難道就比較特別嗎?」

其實 Sora 相比之前任何一款影片生成 AI 來說,它真的厲害很多,不論是人物真實性、畫面流暢度、動畫特效呈現,各方表現都有明顯進步,甚至還可以製作出帶有簡易故事性的短影音。

 

▼ Sora 生成影片內容

 

 

▉ Sora 運作原理與應用

Sora 之所以能比其他影像生成式 AI 更厲害,這點可從其運作原理來理解,通常我們使用的圖像生成 AI,比如說 Midjourney、Imagen、DALL·E 3 等等,基本上都是以 Diffusion Models 這項擴散模型進行圖像訓練與生成,而 Diffusion Models 生成原理主要是先從一團雜訊開始,AI 會依據指令逐格逐格補上作畫細節;然而 Diffusion Models 並無法理解事物的前因後果,雖然可以生成出接近完美的靜態圖,但用於連續性的影片生成上,就會漏洞百出,出現像是「威爾史密斯吃麵」這類的奇怪 AI 生成影像。

 

▼ 威爾史密斯吃麵

 

不過 Sora 就不一樣了。根據 OpenAI 的描述,Sora 採用的是一種名為「Diffusion transformer」模型,不僅具備 Diffusion 可將自然語言轉換視覺表現(圖像、影像)的能力,更是兼備類似於 ChatGPT 理解力,可針對畫面與時間連續性進行演算,讓影像呈現更加合理。

 

▼Sora 可將視覺化數據進行轉換

圖源:OpenAI

 

Sora 的誕生可能會讓不少從事電影拍攝、廣告製作、YouTube 影音工作者感到畏懼,深怕其強大的影像生成技術會讓他們丟了飯碗,但其實也不一定,依照現有資訊,目前 Sora 主要以 1 分鐘左右的短影片製作為主,再加上它依舊存在些缺點(後續會詳細論述),給瓦特的感覺較偏向輔助型工具,並無法替代大多數的影音創作者,比如說 YouTuber,用戶並無法僅靠 Sora 就製作出一個邏輯架構嚴密、內容有條有理的 10 分鐘影片;但卻可以用 Sora 來生成影片中說明性或解釋用的素材,不再只有網路上免費或付費素材可用,既可豐富影片內容,還能省下部分製作時間。

除了上述 YouTuber 案例外,類似手法也可應用其他影片製作上,像是網紅社群影音、廠商短廣告、教職員教學影片等等,讓不擅於拍攝影片的創作者有其他管道可將自己的創意、想法影像化。

  • 應用(1):利用文字腳本建構 1 分鐘短片,比如廣告、預告片、教育短片等等。
  • 應用(2):更多的影片素材可供選擇,可用來製作說明素材、特效等等,增添影片豐富性。
  • 應用(3):社群媒體建構,可製作 FB、IG 等社群平台上的短影音,像是旅遊日記、搞笑影像、個性化短片等等。

 

▼Sora 可應用於各類影像製作,協助創作者(示意圖)

圖源:unsplash

 

 

▉ Sora 生成影像與真實影像比較

雖然 Sora 於影像生成上有很大的突破性,但 Sora 所生成的影像與真實影像還是略有差異性,至於差異性有哪些呢?先不談 AI 生成上可能會有的不合理或不自然動作,即使是沒有明顯瑕疵的 Sora 生成影像,相比於真實影像,兩者間依舊有肉眼可見的差異性。

依瓦特個人主觀感受來說,瓦特認為 Sora 生成影像對比真實影像有以下幾點特色:

  • 特色(1)、過於完美
    就以下方「人眼」影像來說明, Sora 生成的人眼影像雖然動作自然,並呈現臉部中的毛孔、皮紋等細節,但相對於真實影像來說,Sora 生成影缺乏油光、血絲、痘疤等正常人常有的缺陷,過於完美降低了影片的真實性。

 

▼ Sora 生成的人眼影像

影片來源:OpenAI

 

  • 特色(2)、電影感、遊戲感較為突出
    Sora 影像加入了不少電影或動畫才有的戲劇感,像是光影呈現、運鏡風格等等,再加上先前所提畫面過於完美,有時候反而讓人覺得比起真實影像,AI 生成影像更像加入特效感的短電影。
    不過這也並非全然是缺點,或許對不少人來說,影像的戲劇張力比起真實性更加重要,這反而才是他們希望 AI 能帶來的效果也說不定。

 

▼ 即使沒有刻意往電影方面生成,Sora 生成影像也會有電影的戲劇張力

 

▼ 汽車奔馳感比起真實汽車,更像是賽車遊戲中的畫面

 

 

▉ Sora 生成影像有哪些缺點?

從 OpenAI 提供的官方資訊與影像,Sora 所生成影像有不少瑕疵,其中比較顯著的有 2 點:

  • 缺點(1)、遠景容易出錯
    首先第一點,Sora 遠景呈現上相對不精細,如果你仔細挖掘的話,會發現 OpenAI 提供的 Sora 生成式影像不少遠影都有明顯瑕疵,比如說:路人走路方式不符合人體工學、看板文字不正確等等。

 

▼ Sora 遠景部分容易出現瑕疵,比如說下方影片,不僅看板文字沒有意義、左側的白衣路人走路方式也不正常

 

  • 缺點(2)、難以準確模擬複雜的物理原理
    Sora 另外一項致命的問題在於無法理解事物具體的因果關係,導致 Sora 難以正確模擬複雜的物理現象,容易生成出不符合物理法則的影片,比如說:當一個人咬了一口蘋果,蘋果卻沒有出現任何咬痕。

 

▼ 吹蠟燭後,燭火卻沒有熄滅

 

▼ 倒著跑的男人

 

 

Sora OpenAI 該如何使用?

▉ Q1、Sora 何時開放給大眾使用?

目前 Sora 尚未開放給大眾使用,僅提供給 OpenAI 招募的紅隊演練團隊成員進行測試,其中也包含些視覺藝術家、製片商、設計師、電影製作人等相關領域人士,主要評估 Sora 潛在風險與危機,並消除極端暴力、仇恨等錯誤。

至於未來推出時間?目前 OpenAI 尚未公開確切消息,或許還要等待一段時間也說不定。

 

▉ Q2、Sora 如何生成影片?

由於 Sora 尚未正式開放,具體操作方式尚無法準確得知;不過從 ChatGPT 等生成式 AI 的操作方是來看,沒意外的話應該還是要先註冊 OpenAI 帳號,之後再透過文字指令進行影像生成。(備註:待 Sora 推出後,本段會進一步更新

  • 推測步驟:註冊或登入 OpenAI 帳號 → 輸入相關指令 → 點選確認完成影片生成。

 

 

總結、Sora 未來可能帶來的風險?

Sora 之所以要進行嚴格的評估,主要與 Sora 的潛在風險有很大的關係,Sora 作為一款 AI 生成工具,方便是很方便,但它衍生的潛在危險也可能嚴重影響現代社會,尤其是以下 2 點可能最為明顯。

  • 部分產業可能受到挑戰
  • 假資訊亂象更為嚴重

 

▉ 潛在危機(1)、部分產業可能受到挑戰

雖然 Sora 所生成的影片並不完善、瑕疵也不少,像是上述提到的「遠景問題」、「物理現象不準確」等等,都是值得改進的項目。依現階段來觀察, Sora 對於電影、電視、YouTuber、新聞媒體等影視相關產業,造成的衝擊可能並不會很大;但廣告公司就不好說了。

由於 Sora 可以快速生成出 1 分鐘長度的影片,再加上普羅大眾對於廣告要求並不會像電影、電視節目那般嚴格,只要有足夠的創意發想,即使是 AI 生成的廣告也可以打動人心,這情況可能會使部分預算受限的品牌主改用 Sora 來自行製作廣告,而非請廣告商負責,不僅能節省影片製作、模特兒聘請等費用,製作上也更加沒有難度,對於中小資本的廣告商還說無疑是一大挑戰。

 

▼ 相比於電影產業,廣告產業或許受到的衝擊會更加明顯

圖源:unsplash

 

▉ 潛在危機(2)、假資訊亂象更為嚴重

另一項更大的問題則在於「假資訊亂象」,有心人士可藉由 Sora 製作假新聞、假消息,比如說刻意抹黑不喜歡的政治人物影響選情;或是挑撥族群對立製作社會對立,這些問題都是很有可能發生的。

聽到這裡,可能有些人會問瓦特:「Sora 生成影片不是與真實影片有很大的差異嗎?人真的有那麼容易被騙嗎?」

其實這還真的有可能,通常我們人類在理解資訊時會以「懶惰腦」與「認真腦」兩種不同方式來接收,其中「懶惰腦」又是我們最常、最方便接收資訊的方式,包含滑手機、瀏覽社群、閱讀網路新聞等等,基本上我們大多不會 100% 投入高專注度於上方,僅會以最簡單的方式快速理解,這就有可能導致我們無法於第一時間去區別該影像是否真實,也無法辨別內容的正確性,導致誤信的機率大幅度提高。

另外,Sora 影片製作門檻又很低,不需要會剪片、不需要會攝影,這幾乎使人人都能成為影片創作者,包含 IG、FB、X 在內,可以預期 Sora 開放後,很快各大社群就會被大量的 AI 影片佔據,進而衍生另一種 AI 詐騙模式。

 

▼ Sora 可能會使假新聞更容易生成,導致假資訊亂更嚴重

圖源:unsplash

 

 

首圖與資料來源:OpenAI

標籤:
相關文章
喜歡我們的文章嗎
給一個讚吧~^^
複製成功