Thursday, August 5, 2021
更多
    Home科技新聞AI人工智慧FB 用十億張照片讓 AI「SEER」自主學習!自監督學習大躍進

    FB 用十億張照片讓 AI「SEER」自主學習!自監督學習大躍進

    FB出動IG十億張照片,訓練最強圖像識別AI「SEER」

    Facebook透過Instagram上的10億多張照片訓練SEER

    近年來自監督式學習(self-supervised learning)的研究與發展十分蓬勃,如 Google Brain 在 2020 年公開的「SimCLR」就被認為是個重要的里程碑。

    但坐擁著全球最大影像資料庫之一 Instagram 的 Facebook 也不惶多讓,透過 Instagram 上超過 10 億張的公開照片,訓練出最新的自監督式學習模型「SEER」(SElf-supERvised),並宣稱 SEER 是目前在圖像識別測試之中,表現最優秀的 AI

    何謂 AI 的自監督式學習是什麼?

    機器學習中最廣泛使用的監督式學習(supervised learning),是由人給定標記好的資料,讓 AI 學習正確答案並作為推論根據。但是,這種方法依賴於人工事先標記,不僅要耗費大量時間、人力與資源,AI 也只能針對已標記的特徵來學習、完成特定範圍內的任務,如:語音轉文字、分類圖像、物件辨識等。

    為了突破這些限制,自監督學習(Self-supervised Learning,SSL)就應運而生了。

    自監督學習是觀察現有訓練資料中的任何部份來學習,透過預測來認識世界,而無需仰賴人工事先給定的標籤。

    換而言之,自監督學習所訓練的 AI 模型,能藉由觀察過去與現在的訓練資料,來預測未來會發生的事。如 SEER 可以透過觀察未標記、未分類的 Instagram 照片,就辨識出照片中的物品或人物。

    這讓許多人相信,AI 技術若要開創新局面,利用自監督式學習是最好的方式。Facebook AI 研究團隊也認為,AI 的未來在於不需依靠人類事先準備好的「教材」來學習如何識別物件,而是能直接從任何形式──如文字、圖片、聲音、影像等──的數據資料中學習。

    奠基在 10 億張圖上的自監督 AI

    SEER 模型結構是基於 Facebook AI Research 實驗室於2020年所提出的「RegNet」模型,與在線自監督學習演算法「SwAV」,來分析總量達 10 億張的隨機圖片。

    「RegNet」模型與與在線自監督學習演算法「SwAV」的圖片
    SEER 模型結構是基於 Facebook AI Research 實驗室於2020年所提出的「RegNet」模型,與在線自監督學習演算法「SwAV」,來分析總量達 10 億張的隨機圖片。|圖片來源:Facebook AI Blog

    圖片來源:Facebook AI Blog

    SwAV 能利用聚類分析(Cluster analysis)來快速分組具有相似視覺概念的圖片,再透過同組中圖片的相似性增進學習效能,讓訓練時間大幅減少。不過,要執行這樣的運算,SwAV 需要一個運行效率很高、又不會損失精確性的模型架構。

      而能夠擴展到數十億、甚至數萬億個參數的 RegNet,正好完全符合這些需求。

    Facebook AI Research 團隊對比了 SEER 與其他自監督式學習演算法在 ImageNet 上的預訓練結果
    Facebook AI Research 團隊對比了 SEER 與其他自監督式學習演算法在 ImageNet 上的預訓練結果,表示SEER 的表現是最佳的|圖片來源:Facebook AI Blog

    圖片來源:Facebook AI Blog

    而團隊也對比了 SEER 與其他自監督式學習演算法在 ImageNet 上的預訓練結果,表示SEER 的表現是最佳的。

    FB 最強圖像辨識 AI 「SEER」 的潛力

    儘管 SEER 目前還只是一個研究項目,但  Facebook 官方表示其發展潛力相當廣泛,包括用於自動生成文字說明、對賣家於 FB  Marketplace 上傳的商品圖片增加建議標題及類別、防止違反社群規則的內容在 FB 平台傳播等等。甚至若其動態影像預測的研究成熟後,可以用在預測自駕車周遭車輛的行駛軌跡,為自駕車技術增添一大助力。

    並且,SEER 的成果也展現出,自監督式學習可以成為更加有效、準確且適應性強的電腦視覺模型。也許未來,自監督式學習能帶給 AI 領域更多爆炸性的突破。

    最新文章

    熱門文章

    - Advertisment -