目錄
用人工智慧預測疫情神準 華裔工程師獲美媒肯定
疫情大流行至今已一年有餘,許多人都迫切的想知道,究竟要到何時疫情才能趨緩?什麼時候才能恢復正常生活呢?
在沒有絕對可信預測機制的當前,一位沒有醫學背景的 27 歲資料科學家「Youyang Gu」憑一己之力,做出了精準度遠超過專業機構的預測模型,更讓美國知名新聞機構彭博社(Bloomberg Businessweek)稱他為「COVID-19 資料的超級巨星」。

在介紹這位年少有為的 Youyang Gu 之前,先讓我們話說從頭、把時間倒回 2020 年年初。
英美兩大專業機構 預測新冠疫情失準
當時新冠疫情已然爆發,在各國之間大流行,每個人都想知道冠狀病毒接下來造成的影響會有多大。當時多數人都將期望放在兩家專業機構建立的預測系統:一是倫敦帝國理工學院(Imperial College London),二是位於西雅圖的健康指標與評估研究所(IHME)。
但這兩家備受期待的機構,卻產生了截然不同的預測結果。倫敦帝國理工學院警告說:「到夏季時,美國的死亡病例可能會達到 200 萬人」;相較之下,IHME 的預測則保守許多:他們估計到 8 月時,美國死亡人數約為 6 萬人。
但後來事實證明,兩者都離實際數字頗有差距──8 月初時,美國的死亡人數約為 16 萬人。
一般民眾可能感嘆個兩句「結果居然這麼差這麼多!」就置之腦後了,但對於有專業數據分析背景的 Youyang Gu 來說,這件事成為他展開未知旅途的契機。
以機器學習來理解資料
在看到專業機構的結果後,Youyang Gu 毅然決然地選擇自己打造出一個使用人工智慧來預測疫情死亡人數的模型。2020 年 4 月中旬, Youyang Gu 僅僅耗費了一週的時間,就建構出預測模型,還架好了可以展示預測結果的網站,取名為「covid19-projections.com」。

即使他沒有任何醫療或公共衛生的專業背景,但他認為用演算法進行的資料預測分析──正也是他的專業──可以在此時大展身手。「我就是單純地認為,數學和統計知識可以應用到生活中的任何方面,那當然也可以用在預測疫情。」Youyang Gu 表示。
Youyang Gu 大學和碩士皆畢業於 MIT,擁有電腦科學與數學雙學士學位、電腦科學的碩士學位,畢業後則進入遠近馳名的 MIT 電腦科學與人工智慧實驗室(CSAIL),在 NLP 小組中進行了一年的研究,並在 NLP 領域的頂尖會議「EMNLP」上發表論文。從此他開始接觸大數據,也開始累積建立統計模型、預測數據的能力。
隨後他離開校園,進入金融行業,為銀行的高頻交易(英語:high-frequency trading,HFT,指利用電腦以快於毫秒的速度快速押注買賣股票、期貨等,從那些人們無法利用、極為短暫的市場變化中尋求獲利的自動交易系統。)系統編寫演算法,而金融交易資料講求的精準與量化,使 Youyang Gu 建造模型的能力與對資料處理的理解又更上層樓。離開金融產業後,他進入了體育界,繼續進行大數據領域的研究,這讓他除了懂得更加精準地建模,也累積了能應對全新領域的跨學科經驗。
Youyang Gu 表示,他的專長是「使用機器學習來理解數據,將資訊與雜訊分離,並做出準確的預測」。
準到怕!人工智慧預測死亡人數幾乎命中
▲ Youyang Gu 親自講解自己一手打造的 Covid-19 預測網站
重點來了,那 Youyang Gu 使用機器學習技術的預測結果如何呢?
在模型建立完成後,他預測了 5 月 9 日美國將有 8 萬人死亡──而當天的實際死亡人數總計為 79,926 人!這個極微小的誤差,與 IHME 預測的「2020 整年的死亡人數不超過 8 萬」相比,真可以說是神準至極了。
接著,他預測在 5 月 18 日死亡人數會達到 9 萬,而到5 月 27 日,人數將達到 10 萬。後來比對當天的實際人數,都相差不大、十分精準。除了數據資料外,Youyang Gu 也考量許多現實情況,例如當時有許多州從封鎖狀態轉為開放,於是預測到將出現第二波大規模的感染和死亡案例。
不求複雜繁複,只要能做出精準預測的就是好模型

談到是如何建構預測模型時,Youyang Gu 表示他原先考慮了確診人數、住院人數等等許多因素之間的相互關係。但接著,他發現各州和聯邦政府的官方報告資料居然並不一致,其中較可信的資料是每日死亡人數。「其他機構的模型採用了很多種資料,但我決定用過去的死亡人數,來預測未來的死亡人數。」
這讓 Youyang Gu 的預測模型與其他預測系統相比之下十分單純,他表示這個決定是有原因的:「我把『死亡人數』作為唯一的輸入資料,有助於讓機器學習在雜訊中過濾出有用、可靠的資訊。」他表示,如果輸入的資料與事實不符,那麼資料越多,輸出的預測結果當然就越差。
從 2020 年 4 月開始,Youyang Gu 投入了幾千小時在這個工作中,人工智慧接連精準的預測結果也逐漸吸引到許多目光,其中不乏領域專家與權威人士。
準到美國疾管中心也採用

最早注意到 Youyang Gu 的專家是華盛頓大學生物學教授 Carl Bergstrom,他在個人 Twitter 上分享了 Youyang Gu 的模型。
接著,全球最大資料科學社群平台 Kaggle 與人工智慧教學網站 fast.ai 的創始人、在資料科學領域享有盛名的 Jeremy Howard 表示:「我看了 Youyang Gu 的網站和資料後覺得太神奇了。他是唯一一個真正去查看資料、並且做得正確的人,這是他為什麽成功的原因。他是迄今為止唯一認真做這件事的人。」
最後,美國疾病管制與預防中心也也在其網站上發布了 Youyang Gu 的預測資料!這之後,他的網站達到了空前的瀏覽數,每天都有數百萬人的人造訪,來看他的預測。
疫情之下的另一種可能
儘管獲得了許多掌聲與讚美,但去年 11 月時,Youyang Gu 決定要結束他現階段的任務。
但他不是要完全結束他用心經營的計畫,而是打算休息一段時間,邁向新的階段。接下來,他打算將目標放在預測「美國有多少人口確診」、「疫苗推出的速度有多快」、「美國何時能達到群體免疫」等等。他預測今年 6 月,約有 61% 的美國人口會獲得一定程度的免疫力——無論是來自疫苗還是因為曾經感染。
Youyang Gu 表示,他過去一直希望他的工作能對社會產生巨大貢獻,並且能避開政治、偏見以及大型組織有時候不得已的負擔。他也表示,在疫情爆發的這個特殊情況下,有很多缺點可以透過和他一樣背景的人來改善。
Youyang Gu 的故事,打破了很多人對工程師或理工背景專業人士的既定印象,很多人沒有想到在對抗 COVID-19 疫情的全民戰爭中,還有這種善用人工智慧技術的方式貢獻一份力,成為了另類的抗疫英雄。