Cell differentiation and transformation process is often combinatorially regulated by multiple coordinated factors. Mining key regulatory principles in such process poses a great challenge for bioinformaticians and data mining researchers. Properly addressing this challenge involves integrating heterogenous omics data sets, discovering linear /nonlinear multivariate interactions in an unbiased and comprehensive manner and reconstructing the causal regulatory network in high accuracy..In this grant, we propose Kernel Dependence Measure (KDM), which is a novel statistical inference algorithm which can resolve the aforementioned problems in a satisfactory way. KDM first maps the heterogenous variables into a possibly infinite dimensional Reproducing Kernel Hilbert Space (RKHS) and then computing a statistic in that space using kernel variance and conditional variance operators. The statistic closely mimics the coefficient of determination of functional relationships in the original space. As a result, it can quantify the signal-to-noise ratio for arbitrary dependencies in an unbiased manner. Further results suggest that it has high statistical power and can also be used to quantify the strength of conditional dependencies in sets of variables. Therefore, it can be used in a Bayesian network learning algorithm to reconstruct the casual regulatory network in a convincing way..With KDM, we are able to perform a comprehensive search of the regulatory principles and reverse engineer the causal regulatory network based on the omics data sets for the cell differentiation and transformation process. The discoveries will greatly facilitate biologists to understand more of that process and design novel cell-type inducing strategies, which not only benefit the basic research of cell biology, but also promote novel research on regenerative medicine.
从高通量组学数据中逆向推断细胞分化/转分化过程中关键调控因子的复杂作用关系是生物信息学研究者面临的一个重大挑战。解决这个问题需要整合异质的组学数据、无偏地系统性挖掘多变量间的复杂作用关系和重构高精度的因果调控网络。.在本项目中,我们提出一种新的统计推断方法—基于核函数的关联性度量算法(KDM)。它将异质变量映射到高维希尔伯特空间中,利用该空间上的方差和条件方差算子得出和统计分析中“拟合优度”相似的统计量。这样,它能够无偏地衡量任意关联的强度(信噪比)。初步研究表明KDM具有较高的统计效力,且能够衡量变量间的条件关联性。因此,我们可将其用于学习贝叶斯网络结构,得出调控元件的因果关系。.基于KDM,我们能对细胞分化/转分化中的组学数据进行深度挖掘,重构出高精度的因果网络,帮助生物学家更深入地理解该过程的分子机理,设计出更高效的细胞诱导策略。本研究对细胞生物学基础研究和再生医学研究都有重要价值。
揭示生物细胞中关键调控因子的复杂作用关系是生物信息学研究者面临的一个重大挑战。在细胞分化与转化过程中,虽然通过整合、挖掘高通量组学数据可以较为精准地推断细胞发育状态,但是组学数据的获取是以破坏培养细胞为代价的“侵入式”实验研究,不便于进行细胞分化/转化的全过程跟踪性研究。. 在本项目中,我们采用了长时间细胞培养成像系统对分化与转化过程进行图像记录,结合这种“非侵入式”的图像数据,系统性地挖掘多调控因子间的复杂作用关系,重构高精度调控网络。为了结合细胞显微图像的异质数据,我们提出基于核函数的关联性度量算法(Kernel Dependence Measure,KDM),它将异质变量映射到高维希尔伯特空间,利用该空间上的方差/条件方差算子得出类似统计分析中“拟合优度”的统计量,可以无偏地衡量任意关联的强度。. 通过KDM和其它关联分析算法,我们对细胞分化/转化中的异质数据进行深度挖掘,在成年小鼠心梗模型的心脏成纤维细胞重编程体系中重构出了部分高精度的因子调控网络,并发现转录因子Sall4和Myocd能显著提高其重编程效率。. 同时,在诱导多功能干细胞到心肌细胞的诱导发育体系(hiPSC-CM)中,我们使用异质生物学数据对细胞群体变化和细胞分化倾向性进行了研究,并以此优化提升心肌细胞的诱导效率,进一步筛选潜在的诱导因子。. 最后,我们还将KDM计算复杂关联强度的基本思想用于图像特征的相关性研究。结合生成对抗网络(generative adversarial networks, GANs),并利用深度网络中图像特征的潜在特征空间表示,取得了高质量的图像修复结果。. 在未来的工作中,我们还将继续完善拓展KDM和相关方法在细胞调控规律研究中的应用,帮助生物学家更深入地理解细胞分化与转化过程中的分子机理,设计出更高效的实验模型和更有效的潜在疾病治疗方案。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
跨社交网络用户对齐技术综述
基于SSVEP 直接脑控机器人方向和速度研究
成体干细胞再生与分化调控的逆向建模
面向软件再(逆向)工程的程序分析理论与关键技术研究
基于人工神经网络的逆向工程关键技术研究
肾脏纤维化时小管上皮细胞逆向分化机制及基因调控研究