直接因果关系辨识是在利用实验数据探索基因调控网络生物学特性等的研究过程中产生的一个重要理论问题。已有方法大都存在计算复杂度高、假阳/阴性率高、参数估计精度低等不足。本项目拟利用大规模网络中对单个节点直接作用的节点数通常服从幂律分布等结构特点和基因调节过程可近似分片线性描述等生物学特点,借鉴信息论中的 KL 距离和极大似然估计、随机过程中的混合相依性和 Markov 链、系统与控制中的 Kalman 滤波和鲁棒状态估计等的思想和处理方法,研究同时利用静态和动态实验数据的基因调控网络直接因果关系辨识方法。研究内容包括基因调控网络的切换时刻估计、结构辨识和参数估计、最优实验设计、幂律参数估计等,并从理论上分析估计算法的计算复杂度和统计特性、利用公共数据库的实验数据和公认测试问题的生物学模型和仿真数据与其它算法进行估计性能比较。研究结果将对建立复杂疾病发生模型和提高药物研发过程效率等起到促进作用。
根据实验数据和细胞生物学知识确定基因调控网络的结构是系统生物学中的一个重要问题,其结果对理解复杂疾病的成因、药物靶标的确定等具有重要意义。通过4年左右的努力,本项目在基因调控网络结构辨识和大规模系统基本性质分析等方面取得了一些有意义的结果。主要结果如下。.1. 利用基于灵敏度惩罚的递推鲁棒状态估计算法和线性化方法,提出了一种非线性动态基因调控网络的因果关系辨识算法。基于该辨识问题的特殊结构,从理论上证明了在一般情况下,该算法能够给出一致估计,且收敛速度快于基于扩展卡尔曼滤波的方法。数值仿真和基于实际数据的计算结果都表明,该算法在收敛速度、估计精度等方面都优于基于扩展卡尔曼滤波和无迹卡尔曼滤波的方法。.2. 针对基因敲除实验数据,提出了一种基于相对表达量变化的大规模基因调控网络的结构辨识方法。该方法充分利用幅度小于1的相对变化量在串联结构中幅值递减的特点、结合生物实验数据信噪比低的特点,有机整合了表达量估计、零入度估计和估计值归一化等中间过程。基于公共测试问题的计算结果表明,该方法在提高估计精度、降低计算复杂度等方面具有显著优越性。.3. 基于均方误差准则,推导出了一种分布式的一步状态预测递推算法,证明了其最优性和增益阵的唯一性,讨论了其鲁棒化问题,并得到了分布式鲁棒状态估计算法。同时从理论上证明了该算法的增益阵等于基于局部信息的卡尔曼滤波器的增益阵。该预测算法在一定条件下近似具有与集总式卡尔曼滤波器同样的估计精度。.4. 基于空间连接系统的类状态空间表示,推导出了一种仅依赖于子系统传输零点和连接矩阵的可控/可观性判据。在此基础上,建立了分布式状态预测算法与集总式卡尔曼滤波器具有相同稳态估计精度的充分必要条件。同时还得到了大规模网络化系统便于计算的稳定和鲁棒稳定的条件。.5. 针对网络化系统的信号传输特性,提出了一种基于灵敏度惩罚的递推鲁棒状态估计算法,建立了该算法收敛的条件。利用正定矩阵的一种黎曼距离,给出了估计误差的协方差阵或伪协方差阵收敛到平稳分布的条件,并推导出一个该平稳分布易于计算的高精度近似表示式。..所得结果大多以研究论文形式发表于国际学术期刊,其中10余篇为SCI 收录,5篇为自动化领域最具影响国际学术期刊 IEEE Trans. on Automatic Control 和 Automatica 长文 (regular paper)。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
跨社交网络用户对齐技术综述
拥堵路网交通流均衡分配模型
卫生系统韧性研究概况及其展望
数据挖掘和静态分析相结合的重复代码缺陷检测及重构方法
随机非线性系统的辨识及基因调控网络建模
基于定性概率网络的时序数据中因果关系挖掘、推理及应用
研究波与裂纹相互作用的动光弹与动焦散线相结合的方法