中文摘要
体细胞点突变现象广泛存在于人类基因组中,与组织功能状态及疾病发生有重要关联。体细胞点突变研究目前主要集中在肿瘤基因组学领域,缺乏对健康个体中各组织基因组中点突变状态的关注。阐明体细胞点突变在健康个体不同组织基因组中的分布规律、组织特异性及热点区域不仅能够为疾病发生的分子生物学研究提供方向,还可为理解组织环境相关的功能提供参考。. 本项目拟通过对外显子组及肿瘤相关基因区域深度测序,完成1例50岁以上及2例50岁以下健康个体的外周血、口腔上皮及精子等三种组织的高覆盖度(>500×)候选区域捕获测序。利用生物信息学方法初步构建健康个体基因组目标区域的体细胞点突变分布图谱,确定点突变热点区域并探讨其组织特异性分布规律。. 本项目关注亟需开展的健康个体多组织基因组体细胞点突变模式,对人类基因组体细胞突变的理论体系提供新的数据补充,为后续全基因组层面的探索建立可靠的实验研究体系及数据分析方案。
英文摘要
Somatic point mutation is a common phenomenon in human genome, contributing to function status in specific tissues and disease occurrence. Researches now mainly focus on somatic point mutations within cancer genomes. However, few progresses have been made in healthy individuals. Dissecting the distribution, tissue specificity and hotspot regions of somatic point mutations in multiple tissues of health individuals, can provide new insights in disease occurrence and tissue specific function changes at the genome level.. Here we are to identify hotspot regions of somatic point mutations and their tissue specificity by deep whole exome/target region sequencing (>500×). This will be applied in 3 tissues, including white cells, oral epithelium and sperm, from one healthy individuals over 50 years old and 2 younger than 50. Based on bioinformatics analysis, we aim to obtain the landscape of somatic mutations in the candidate regions of human genome. . This project will make efforts to reveal the somatic point mutation patterns in “healthy” genome in multiple tissues, providing new data for the theory of somatic mutation. The research can also develop the experimental system and data analyzing methods for whole genome level analysis in the future.
结题摘要
课题对5组后代年龄50岁以下的三体家系样本进行高重数外显子测序,通过改进的测序文库构建方法及开发的突变检测算法,鉴定三体家系后代个体中的体细胞突变。研究结果显示,在测序覆盖度达到300X左右时,在每样本中可以发现~100个体细胞突变。通过进行不同个体间、同一个体不同时点,不同组织的突变鼻尖,研究发现体细胞突变数量与个体年龄无关,同一个体不同时间点的突变数量保持一致,不同组织间的突变个数无显著差异。进一步通过对突变分布情况的精细分析发现,健康个体血液中体细胞突变以极低频率存在,体细胞突变频率分布在整体上呈现出向低频率段偏移的情况,提示50岁以下健康个体造血干细胞群体不存在显著遗传漂变或优势克隆。通过突变功能注释,发现62%的突变为错义突变,提示体细胞点突变对于细胞功能影响有限,绝大部分错义突变在基因组中呈中性。通过对突变标记(mutation signature)分析,发现血液及精子主要突变标记为NpCpG的C>T突变,该标记比重随年龄增长逐渐增加,提示自发脱氨基作用为主要的突变来源。研究还发现体细胞突变在GpCpN标记上也存在显著富集,比例在不同个体中保持稳定与且年龄无关,进而通过对肿瘤克隆体细胞突变的分析也发现同样的CpGpN标记的稳定存在。该标记来源于AID (activation-induced cytidine deaminase)参与的DNA损伤修复,健康个体及肿瘤患者中稳定存在的该标记提示在胚胎发育阶段AID参与的DNA损伤修复机制是主要的体细胞突变来源。本课题在体细胞突变研究领域取得了较好进展,建立了完善的低频体细胞突变检测方案,并发现了重要的胚胎发育时期体细胞突变标记。
