Breast cancer is a disease with complex mechanism. It is difficult to diagnose the malignancy of breast cancer patients in early stage through clinical manifestations, but there are clear criteria for differentiation at the cell line level. Based on data mining and gene network, research method is one of the effective means to diagnose this complex disease. Invasive breast cancer refers to a malignant tumor in which cancer cells have penetrated the basement membrane of breast ducts or lobular acini and invaded the stroma. Invasive breast cancer and non-invasive breast cancer have great differences in survival and prognosis. This project is based on in-depth data mining of clinical data to establish gene co-expression networks for invasive breast cancer and non-invasive breast cancer. By using of network analysis method, the gene markers of invasive breast cancer are obtained by comparing different gene expression networks in invasive and non-invasive breast cancer cell lines. The main contents include: (1) Collection and processing of genomic data of breast cancer cell lines in GEO dataset; (2) Construction of gene co-expression networks for invasive and non-invasive breast cancer; (3) Establishment and analysis of specific gene co-expression networks for invasive breast cancer; (4) Identification of invasive breast cancer gene markers through independent public data validation; (5) Assessment of the obtained invasive breast cancer gene markers. This project provides a new idea for the classification and diagnosis of breast cancer and scientific basis for clinical decision-making.
乳腺癌是一种机理复杂的疾病,通过临床表现很难在早期诊断乳腺癌病人的恶性程度,但是在细胞系层面具有明确区分标准。基于数据挖掘和基因网络的研究方法是诊断乳腺癌这种复杂疾病的有效手段之一。浸润性乳腺癌和非浸润性乳腺癌在病人的生存预后差异很大。本项目基于对临床数据进行深度的数据挖掘,建立浸润性乳腺癌和非浸润性乳腺癌的基因共表达网络。利用网络分析方法,通过比较浸润性乳腺癌和非浸润性乳腺癌细胞系中不同基因表达构建的网络来获取浸润性乳腺癌基因标志物。主要内容包括:(1)公共数据集GEO中乳腺癌细胞系基因组数据的收集和处理;(2)浸润性乳腺癌和非浸润性乳腺癌基因共表达网络的构建;(3)浸润性乳腺癌的特有基因共表达网络的建立与分析;(4)通过独立公共数据验证确定浸润性乳腺癌基因标志物;(5)对所得的浸润性乳腺癌基因标志物进行评估。本项目为乳腺癌的分类诊断提供一种新思路,为临床决策提供科学依据。
本项目旨在利用网络分析的方法研究乳腺癌基因标志物问题。项目整体研究工作分为以下三个方面:(1)乳腺癌基因共表达网络分析。乳腺癌远端转移基因标志物的筛选,利用基因-蛋白质的对应关系,将基因共表达网络映射为蛋白质交互网络,再通过应用筛选关键蛋白质的方法,从蛋白质交互网络中筛选基因标志物;乳腺癌预后基因标志物的筛选,定义基于模块间相似度的差异模块筛选方法,应用该方法从根据不同表型构建的基因共表达网络之间,筛选出一系列具有良好预后性能的基因标志物;基于加权基因共表达网络,对聚类方法进行研究,分别应用K均值聚类、层次聚类、最大期望聚类,并将每种聚类得到的基因进行生存分析。(2)乳腺癌分型问题。将临床数据和遗传特征相结合来预测乳腺癌四种亚型患者的生存,构建一个临床信息和基因的整合模型预测乳腺癌患者的生存;乳腺癌四种亚型网络结构分析,考虑同一组基因的网络在四种不同的亚型之间是否呈现不同的网络结构。(3)基于机器学习的方法研究了宫颈癌整合预后预测模型。该模型将宫颈癌患者的临床变量和关键基因相整合,利用特征选择和前向选择算法识别出宫颈癌的预后基因标志物。本项目的研究成果为乳腺癌的临床诊断和靶向药物研发提供科学依据。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
跨社交网络用户对齐技术综述
拥堵路网交通流均衡分配模型
基于网络分析寻找前列腺癌相关microRNA生物标志物
基于超声弹性成像及分子影像技术的浸润性乳腺癌实时病理诊断
基于深度学习检测脉管浸润在早期浸润性乳腺癌预后预测中的价值
人乳腺癌相关癌基因和抗癌基因及其表达的研究