基于高效预测模型的原核精细调控元件理性设计

基本信息
批准号:31301017
项目类别:青年科学基金项目
资助金额:25.00
负责人:蒙海林
学科分类:
依托单位:中国科学院分子植物科学卓越创新中心
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:段桂芳,赵娜,汪建峰,孟令卓,吕华军,杨迎迎
关键词:
人工神经网络精细调控元件理性设计合成生物学支持向量机
结项摘要

The design of complex synthetic biosystems requires predefining and constructing a number of fine-tuning regulatory elements with various parameter characteristics, e.g., promoters and ribosome binding sites (RBSs) with a range of strengths. Although random mutation based library construction has practical application, more rational strategies are still required to improve efficiency and save costs during the design of large scale networks and systems. Therefore, developing methodologies based on model calculation and prediction for designing element sequence will become a trend in the future. However, existing models cannot achieve rational design of regulatory element sequence with desired strength, mostly due to the common use of linear regression analysis based modelling methods, which could not well reflect the extremely complex non-linear relationship between element sequences and their strengths, resulting in a low prediction accuracy and poor generality. In this project, to address these issues, artificial neural network and support vector machine based modelling methods with stronger non-linear mapping properties will be apply to construct predicting models with high performance, and finally succeed in rational design of fine-tuning regulatory elements through the combination of wet and dry experiments based on model predictions.

合成生命系统的设计需要预先定义和构建具有不同预期参数特征的精细调控元件,如启动子、核糖体结合位点(RBS)等,以适应复杂生物网络及途径设计对元件强度特性的多样化需求。尽管基于随机突变的元件文库构建方式已得到实际应用,但在大规模生物网络及系统设计中需要更理性的设计方式来提高效率和降低成本。基于计算及模型预测的元件序列设计因而将成为今后的发展趋势。而现有模型普遍采用基于线性回归分析的建模方法难以表征元件序列与强度(活性)之间所存在的异常复杂的非线性关系,从而导致预测准确率偏低,推广性差,无法真正实现调控元件理性设计的需求。本项目针对目前原核调控元件(启动子/RBS)强度预测及序列设计所存在的这些关键技术瓶颈,拟采用非线性映射能力很强的人工神经网络和支持向量机方法来构建高性能预测模型,并基于模型的预测,通过干湿实验相结合而实现原核精细调控元件的理性设计。

项目摘要

合成生命系统的设计需要预先定义和构建具有不同预期参数特征的精细调控元件,如启动子、核糖体结合位点(RBS)等,以适应复杂生物网络及途径设计对元件强度特性的多样化需求。基于定量模型预测的元件序列设计可提高效率和降低成本。而现有模型普遍采用基于线性回归分析的建模方法难以表征元件序列与强度(活性)之间所存在的异常复杂的非线性关系,从而导致预测准确率偏低,推广性差,无法真正实现调控元件定量设计的需求。针对目前所存在的这些关键技术瓶颈,本研究以原核Trc启动子及下游RBS为原核模式调控元件,采用非线性映射能力很强的人工神经网络(ANN)和支持向量机(SVM)建模方法构建了高效的强度预测模型,并实现了元件序列的定量设计。首先,基于易错PCR方法构建了包含100个突变序列的Trc启动子-RBS文库,其相对强度值(定义野生型序列强度为1)范围为0 - 3.559。把该文库序列及强度数据随机划分为训练集及测试集(其中测试集数据不少于10%),分别用于对所构建模型进行训练和测试。在经过多种参数综合优化之后,获得了最优ANN预测模型NET90_19_576和SVM预测模型OptModel,其训练和测试的拟合相关系数平方值都达到0.96以上,远高于传统建模方法的拟合效果。然后,以ANN模型为例,基于此模型从头设计了16个具有不同预期强度的新元件序列。经过实验证实,这些序列基本达到了预期强度值,因而实现了新元件序列的定量设计。进一步的实验结果显示,新设计的元件可有效改善小肽BmK1在大肠杆菌中的表达,并可对大肠杆菌萜类前体供应途径——磷酸脱氧木酮糖(DXP)途径进行精细调控。该研究表明,基于ANN和SVM建模方法所构建的模型可有效实现原核精细调控元件序列的从头定量设计,且所设计的元件具有很好的合成生物学应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
2

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
5

基于分形维数和支持向量机的串联电弧故障诊断方法

基于分形维数和支持向量机的串联电弧故障诊断方法

DOI:
发表时间:2016

蒙海林的其他基金

批准号:31870776
批准年份:2018
资助金额:59.00
项目类别:面上项目
批准号:31670056
批准年份:2016
资助金额:62.00
项目类别:面上项目

相似国自然基金

1

基于T7系统与原核宿主正交的转录元件构建及应用

批准号:21576153
批准年份:2015
负责人:李强
学科分类:B0812
资助金额:65.00
项目类别:面上项目
2

基于顺式调控元件的个体化基因表达预测模型及在免疫响应中的应用

批准号:31900492
批准年份:2019
负责人:石文强
学科分类:C0608
资助金额:22.00
项目类别:青年科学基金项目
3

基于概率分布理论预测DNA调控元件的新方法研究

批准号:31401141
批准年份:2014
负责人:卢一鸣
学科分类:C0608
资助金额:20.00
项目类别:青年科学基金项目
4

原核生物转录因子结合位点的算法预测及应用

批准号:61070095
批准年份:2010
负责人:李国君
学科分类:F0213
资助金额:38.00
项目类别:面上项目