首頁 > 組學測序 > 生信分析 > 多種機器學習算法構建多組學疾病/腫瘤預后模型
構建合適的機器學習模型,對樣本是否為疾病樣本進行預測,或預測腫瘤病人的預后信息。
轉錄組、拷貝數變異數據、甲基化數據、轉錄調控數據等多組學數據。
將多個組學數據的公共數據集隨機劃分為訓練集和測試集,在訓練集上綜合考慮預后相關的多組學基因特征,訓練基于隨機森林、邏輯回歸等算法的疾病診斷模型或預后風險評估模型。用 ROC曲線和AUC值做模型的評估。對于預后風險評估模型,我們根據訓練好的風險模型計算測試集中的每個樣本的Risk score,做K-M生存分析,檢查是否有統(tǒng)計上的差異性。
分析內容
(1)訓練集與測試集的隨機劃分結果
(2)隨機森林、邏輯回歸模型的具體參數
(3)測試集每一個樣本的風險分值以及高風險/低風險分組
(4)模型重要性排序圖;模型評估結果:KM 生存曲線以及 ROC 曲線圖
科研服務咨詢
公眾號二維碼