手机版 客户端

基于RF模型和半监督分析算法的肿瘤分子亚组模式识别方法研究

基于RF模型和半监督分析算法的肿瘤分子亚组模式识别方法研究
  • 导航:首页 > 科学基金
  • 批准号:81773551
  • 批准年度: 2017年
  • 学科分类:流行病学方法与卫生统计(H2611) |
  • 项目负责人:李康
  • 负责人职称:教授
  • 依托单位:哈尔滨医科大学
  • 资助金额:65万元
  • 项目类别:面上项目
  • 研究期限:2018年01月01日 至 2021年12月31日
  • 中文关键词: 监督;算法;肿瘤;亚组;模式识别
  • 英文关键词:malignant carcinoma;Molecular subgroup;Random forest;Semi-supervised analysis;Prediction model

项目摘要

中文摘要

目前恶性肿瘤的诊断与亚组分型,主要使用病理组织学方法,作为临床诊断的“金标准”。然而,由于肿瘤组织结构的复杂性和分子异质性,不同类型的肿瘤具有不同的病理组织结构特征和分级标准,实际中经常难以诊断。本课题研究如何在多组学分子层面上对肿瘤进行亚组鉴别,使其与临床诊断、治疗和预后的目标相一致。对肿瘤分子亚组模式识别,需要筛选出不同亚组的生物标志物,进而得到预测模型。然而,对于有些亚组识别问题,实际中可能只有少量的样品存在亚型标签。本研究提出一种新方法,将有标签和无标签的数据混合在一起,使用随机森林(RF)模型和半监督分析算法对数据进行分析,筛选亚组生物标记物和建立预测模型。研究的主要内容:亚组识别的半监督分析模型、半监督分析的多阶段算法、基于样品权重的半监督Boosting算法、半监督分析的变量筛选方法、分子亚组预测模型等。研究拟使用理论推导、模拟实验和结直肠癌亚组实际数据分析相结合的方法进行。

英文摘要

Recently, histopathological method has been regarded as the gold standard for cancer diagnosis and subgroup analysis in clinical practice. However, due to the molecular heterogeneity and complexity of cancer tissues, cancer subtype has different pathological structure characteristics and grading standards, which would increase the difficulty of diagnosis in practice. In regard to these problems, this study aims at identifying the cancer subgroups based on multi-omics molecular information to improve the diagnosis accuracy and therapy and prognosis. To identify molecular subgroups of cancer, it is necessary to select significant biomarkers for each subgroup and then build up the prediction model. However, for some subgourp identification, only a small number of samples have complete and accurate labels in practice. In this study, we propose to combine labeled and unlabeled samples, analyze the data with random forest model and semi-supervised analysis algorithm, select biomarkers and establish prediction model. The main research contents include semi-supervised model for subgroup identification, multi-stage algorithm for semi-supervised analysis, semi-supervised Boosting algorithm based on weight obtained from samples, variable selection method for semi-supervised analysis, molecular subgroup prediction model, and so on. This study intends to combine the method of theoretical derivation, simulation studies and real example analysis with data from colorectal cancer.

评估说明

    国家自然科学基金项目“基于RF模型和半监督分析算法的肿瘤分子亚组模式识别方法研究”发布于爱科学iikx,并永久归类于相关科学基金导航中,仅供广大科研工作者查询、学习、选题参考。国科金是根据国家发展科学技术的方针、政策和规划,以及科学技术发展方向,面向全国资助基础研究和应用研究,发挥着促进我国基础研究源头创新的作用。国科金的真正价值在于它能否为科学进步和社会发展带来积极的影响。

此文由 爱科学 编辑!:首页 > 科学基金 > 科学基金4 » 基于RF模型和半监督分析算法的肿瘤分子亚组模式识别方法研究

推荐文章