The design of complex synthetic biosystems requires predefining and constructing a number of fine-tuning regulatory elements with various parameter characteristics, e.g., promoters and ribosome binding sites (RBSs) with a range of strengths. Although random mutation based library construction has practical application, more rational strategies are still required to improve efficiency and save costs during the design of large scale networks and systems. Therefore, developing methodologies based on model calculation and prediction for designing element sequence will become a trend in the future. However, existing models cannot achieve rational design of regulatory element sequence with desired strength, mostly due to the common use of linear regression analysis based modelling methods, which could not well reflect the extremely complex non-linear relationship between element sequences and their strengths, resulting in a low prediction accuracy and poor generality. In this project, to address these issues, artificial neural network and support vector machine based modelling methods with stronger non-linear mapping properties will be apply to construct predicting models with high performance, and finally succeed in rational design of fine-tuning regulatory elements through the combination of wet and dry experiments based on model predictions.
合成生命系统的设计需要预先定义和构建具有不同预期参数特征的精细调控元件,如启动子、核糖体结合位点(RBS)等,以适应复杂生物网络及途径设计对元件强度特性的多样化需求。尽管基于随机突变的元件文库构建方式已得到实际应用,但在大规模生物网络及系统设计中需要更理性的设计方式来提高效率和降低成本。基于计算及模型预测的元件序列设计因而将成为今后的发展趋势。而现有模型普遍采用基于线性回归分析的建模方法难以表征元件序列与强度(活性)之间所存在的异常复杂的非线性关系,从而导致预测准确率偏低,推广性差,无法真正实现调控元件理性设计的需求。本项目针对目前原核调控元件(启动子/RBS)强度预测及序列设计所存在的这些关键技术瓶颈,拟采用非线性映射能力很强的人工神经网络和支持向量机方法来构建高性能预测模型,并基于模型的预测,通过干湿实验相结合而实现原核精细调控元件的理性设计。
合成生命系统的设计需要预先定义和构建具有不同预期参数特征的精细调控元件,如启动子、核糖体结合位点(RBS)等,以适应复杂生物网络及途径设计对元件强度特性的多样化需求。基于定量模型预测的元件序列设计可提高效率和降低成本。而现有模型普遍采用基于线性回归分析的建模方法难以表征元件序列与强度(活性)之间所存在的异常复杂的非线性关系,从而导致预测准确率偏低,推广性差,无法真正实现调控元件定量设计的需求。针对目前所存在的这些关键技术瓶颈,本研究以原核Trc启动子及下游RBS为原核模式调控元件,采用非线性映射能力很强的人工神经网络(ANN)和支持向量机(SVM)建模方法构建了高效的强度预测模型,并实现了元件序列的定量设计。首先,基于易错PCR方法构建了包含100个突变序列的Trc启动子-RBS文库,其相对强度值(定义野生型序列强度为1)范围为0 - 3.559。把该文库序列及强度数据随机划分为训练集及测试集(其中测试集数据不少于10%),分别用于对所构建模型进行训练和测试。在经过多种参数综合优化之后,获得了最优ANN预测模型NET90_19_576和SVM预测模型OptModel,其训练和测试的拟合相关系数平方值都达到0.96以上,远高于传统建模方法的拟合效果。然后,以ANN模型为例,基于此模型从头设计了16个具有不同预期强度的新元件序列。经过实验证实,这些序列基本达到了预期强度值,因而实现了新元件序列的定量设计。进一步的实验结果显示,新设计的元件可有效改善小肽BmK1在大肠杆菌中的表达,并可对大肠杆菌萜类前体供应途径——磷酸脱氧木酮糖(DXP)途径进行精细调控。该研究表明,基于ANN和SVM建模方法所构建的模型可有效实现原核精细调控元件序列的从头定量设计,且所设计的元件具有很好的合成生物学应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
硬件木马:关键问题研究进展及新动向
基于LASSO-SVMR模型城市生活需水量的预测
基于SSVEP 直接脑控机器人方向和速度研究
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
基于分形维数和支持向量机的串联电弧故障诊断方法
基于T7系统与原核宿主正交的转录元件构建及应用
基于顺式调控元件的个体化基因表达预测模型及在免疫响应中的应用
基于概率分布理论预测DNA调控元件的新方法研究
原核生物转录因子结合位点的算法预测及应用