目錄
近幾個月來,輸入簡單文字描述就能以 AI 人工智慧生成圖片的系統頻頻成為頭條新聞,在大家仍在鑽研人工智慧圖像生成,甚至討論 AI 作畫爭議時,Meta 的研究團隊已經將研究重心轉向下一個領域——透過人工智慧,以簡單文字描述生成影片!
文字生成圖片不稀奇,Meta 研究員轉而研究新領域!
繼 Open AI 在今(2022)年九月底宣布開放 DALL·E beta 讓所有人都能免費體驗用 AI 生成圖片的樂趣,一群來自 Meta 研究機器學習的工程師,已經能使人工智慧在輸入文字後生成「動態」的影片。他們研發出一套名為「Make-A-Video」的新系統,只需要輸入一段簡易的描述文字,AI 就可自動生成一段影片。
雖然目前生成的成果仍然比較粗糙,比方說,AI 生成的影片動作不自然、長度不超過 5 秒、畫質模糊(原本的解析度是 64 x 64px,用另一套 AI 模型處理後可以達到 768 x 768px),且不包含聲音,也能看出這些影片帶有明顯的斧鑿痕跡,比起錄製的影片更像是動畫,但對 AI 人工智慧生成技術而言,已經是一大令人矚目的里程碑。

進步的反面:人工智慧生成影片的挑戰與爭議
Meta 在宣佈 Make-A-Video 的公開文章中說:「只需幾句話或幾行文字,Make-A-Video 就可以激盪生活中的更多創意和想像力,並創造充滿鮮豔色彩和風景的獨一無二影片。」Meta CEO Mark Zuckerberg 亦盛讚這項技術是一項令人驚豔的進展。
然而,Meta 也進一步指出,雖然 AI 生成影片這項工具極具價值,但和 AI 生成圖片工具一樣存在令人擔憂的隱患。如同 AI 生成圖片工具和換臉系統 Deepfake 的爭議,這套工具也可能被拿來惡意利用,產出假的新聞或政治宣傳內容,甚至是未經雙方同意的成人內容。
為了在研發過程中保持絕對的謹慎, Meta 至今僅發表了以「Make-A-Video」AI 模型為主題的公開文章,針對有哪些對象可以獲得未來釋出的模型 demo 系統權限,Meta 也尚未給出規定細節,以避免有心人士的濫用。
Meta 表示,它們將持續公開分享這種生成式 AI 的研究成果,以徵求使用者的反饋,並將繼續使用負責且可靠的 AI 框架,來改進和發展團隊對於這項新興技術的研究。
首圖擷取至: Meta 製作視頻 (makeavideo.studio)