演算預測漸凍人病程 成大勇奪世界冠軍
【台南訊】漸凍人症的病況發展難預測,成功大學資訊工程學系蔣榮先教授、楊士德教授帶領成大團隊成員方文杰博士、研究生張桓瑞、楊震,參加「世界夢想挑戰賽(DREAM Challenge)」之漸凍人病況發展預測的計算生物醫學程式設計競賽,擊敗30支來自全球知名大學及醫學研究機構專業人員,勇奪世界第一,是台灣參與 DREAM Challenge以來獲得的最高榮譽,證實台灣系統生物與醫療資訊的技術能力,也期盼能利用優異的程式設計與撰寫能力造福更多罕見疾病患者。
DREAM Challenge為國際生醫領域極為重要的大數據(Big Data)演算競賽,創立於2006年,由美國哥倫比亞大學、美國國立衛生研究院、IBM,以及紐約科學院(The New York Academy of Sciences)贊助成立,每年提供3至5項不同主題競賽,由各組織提供資料與數據,參賽者提出運算程式模型來分析,每年均吸引世界各地眾多電腦科學、工程與統計等學者專家參與競賽。成大團隊參與的競賽項目為DREAM ALS Stratification Prize4Life Challenge,設計演算程式以預測漸凍人病程發展。
蔣榮先教授指出,主辦單位提供了7千多名漸凍人症病患300多萬筆臨床檢查等相關研究數據,包括(身高、體重、家族病史、血液檢測等);參賽隊伍必需先從龐大資料、數據去篩選出與漸凍人症可能有關的6項「特徵資料」,再選擇最適合的演算法,讓演算法去分析與整合「特徵資料」,建立漸凍人症病程進展的預測模型。
蔣榮先教授分析成大團隊能夠在國際勁敵環伺中脫穎而出,應與團隊成員資工背景者佔多數有關,得以跳脫生醫觀點或框架,單純以統計、演算的角度來處理海量臨床數據與資料;成大團隊將臨床檢查資料所代表的意義,全部轉成數字,從300多萬筆資料中,找出與漸凍人症最相關的20幾個特徵,再篩選出數10組不同特徵組合,經由交叉驗證找出最佳特徵組合,要找出這個最佳特徵組合難度極高,是獲勝關鍵。
成大團隊找出的六項特徵為,疾病症狀發作到試驗開始的時間長度、言語能力、切割食物與使用家庭日常用品的能力, 軀幹協調功能、 血中磷含量、小腿功能,團隊依篩選出的特徵,再用交叉驗證方式挑選出最適合競賽的預測演算法-GBRT。
團隊成員擁有優異的程式設計與撰寫能力,在密切研究、討論下,將GBRT演算法與6項特徵資料做了最有效的分析、整理與歸納,才能建立起漸凍人病程演進的預測模型。
主辦單位事先提供所有競賽隊伍漸凍人症患者確診0到3個月內的資料,請各隊依所建立的預測模型,預測患者3個月後9個月間的病況;成大團隊的預測模型所演算的預測結果,是所有競賽對手中最吻合現實資料。團隊成員之一的方文杰博士說,主辦單位針對冠軍團隊、亞軍團隊預測模型的預測結果,進一步做「勝算比」評分,重複抽樣出500組的資料集來計算,冠軍的成大團隊對上亞軍的勝算比為61.5,而主辦單位的門檻值只有3,成大團隊的優異程度由此可見。
方文杰博士表示,競賽最大的挑戰之一在於,數據除了靜態的資料外,還有多項隨時間變動的資料,大大增加了預測模型建構的難度。有效的預測演算,由於減少臨床研究需要的樣本量,能大幅減少大型臨床研究費用支出,尤其像漸凍人這類罕見疾病,患者數量較稀少,減少臨床研究的患者數量的意義極為重大;團隊提出的「特徵資料(新的預測因子)」將能提供研究人員關於漸凍人疾病更多的訊息與線索。
2015年DREAM Challenge,比賽期間自6月至10月,11月3日公布成績,美東時間11月17日於美國費城喜來登飯店頒獎,團隊成員方文杰、張桓瑞代表領獎。
DREAM Challenge為國際生醫領域極為重要的大數據(Big Data)演算競賽,創立於2006年,由美國哥倫比亞大學、美國國立衛生研究院、IBM,以及紐約科學院(The New York Academy of Sciences)贊助成立,每年提供3至5項不同主題競賽,由各組織提供資料與數據,參賽者提出運算程式模型來分析,每年均吸引世界各地眾多電腦科學、工程與統計等學者專家參與競賽。成大團隊參與的競賽項目為DREAM ALS Stratification Prize4Life Challenge,設計演算程式以預測漸凍人病程發展。
蔣榮先教授指出,主辦單位提供了7千多名漸凍人症病患300多萬筆臨床檢查等相關研究數據,包括(身高、體重、家族病史、血液檢測等);參賽隊伍必需先從龐大資料、數據去篩選出與漸凍人症可能有關的6項「特徵資料」,再選擇最適合的演算法,讓演算法去分析與整合「特徵資料」,建立漸凍人症病程進展的預測模型。
蔣榮先教授分析成大團隊能夠在國際勁敵環伺中脫穎而出,應與團隊成員資工背景者佔多數有關,得以跳脫生醫觀點或框架,單純以統計、演算的角度來處理海量臨床數據與資料;成大團隊將臨床檢查資料所代表的意義,全部轉成數字,從300多萬筆資料中,找出與漸凍人症最相關的20幾個特徵,再篩選出數10組不同特徵組合,經由交叉驗證找出最佳特徵組合,要找出這個最佳特徵組合難度極高,是獲勝關鍵。
成大團隊找出的六項特徵為,疾病症狀發作到試驗開始的時間長度、言語能力、切割食物與使用家庭日常用品的能力, 軀幹協調功能、 血中磷含量、小腿功能,團隊依篩選出的特徵,再用交叉驗證方式挑選出最適合競賽的預測演算法-GBRT。
團隊成員擁有優異的程式設計與撰寫能力,在密切研究、討論下,將GBRT演算法與6項特徵資料做了最有效的分析、整理與歸納,才能建立起漸凍人病程演進的預測模型。
主辦單位事先提供所有競賽隊伍漸凍人症患者確診0到3個月內的資料,請各隊依所建立的預測模型,預測患者3個月後9個月間的病況;成大團隊的預測模型所演算的預測結果,是所有競賽對手中最吻合現實資料。團隊成員之一的方文杰博士說,主辦單位針對冠軍團隊、亞軍團隊預測模型的預測結果,進一步做「勝算比」評分,重複抽樣出500組的資料集來計算,冠軍的成大團隊對上亞軍的勝算比為61.5,而主辦單位的門檻值只有3,成大團隊的優異程度由此可見。
方文杰博士表示,競賽最大的挑戰之一在於,數據除了靜態的資料外,還有多項隨時間變動的資料,大大增加了預測模型建構的難度。有效的預測演算,由於減少臨床研究需要的樣本量,能大幅減少大型臨床研究費用支出,尤其像漸凍人這類罕見疾病,患者數量較稀少,減少臨床研究的患者數量的意義極為重大;團隊提出的「特徵資料(新的預測因子)」將能提供研究人員關於漸凍人疾病更多的訊息與線索。
2015年DREAM Challenge,比賽期間自6月至10月,11月3日公布成績,美東時間11月17日於美國費城喜來登飯店頒獎,團隊成員方文杰、張桓瑞代表領獎。
維護單位:
新聞中心
更新日期:
2015-11-24