基于机器学习的化合物多晶型行为描述符挖掘及多晶型预测模型的研究

基本信息
批准号:21776073
项目类别:面上项目
资助金额:64.00
负责人:任国宾
学科分类:
依托单位:华东理工大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:杨明俊,赖力鹏,朱彬,郭春阳,陈宁,王小玉
关键词:
多晶型学位描述符预测模型机器学习内禀关系
结项摘要

Machine learning algorithm is based on statistics. With the automatic classification of large amounts of data, the statistical characteristics are extracted and the forecasting is conducted. In the field of chemistry, machine learning can extract the most related molecular characteristics to the research item from a lot of descriptor information, providing direct discriminant for classification and prediction. At present, due to the lack of systematic cognition about polymorphism, experimental study uses all kinds of trial and excludes error methods, which cause low efficiency. Crystal structure prediction needs hundreds of thousands of the nuclear amount of calculation for a single drug molecule general, and can produce a large number of invalid structures. The systematic cognition about polymorphic behavior can guide the experimental research, and promote the efficiency of crystal structure prediction. This project intends to use flavonoids as the research object, and get a set of complete and accurate polycrystalline behavior pattern database by combining the experimental research, the quantum and computational chemistry, contacting experimental morphology with theoretically predicted outcome. Based on machine learning, a set of descriptors for polymorphic behavior are mined from the database of molecular descriptors, crystal descriptors and external influencing factors quickly and efficiently, then exploring and establishing the model, discovering the intrinsic relationship between descriptors and polymorphic phenomena. The influence rules of different factors to produce polymorphism are analyzed, which provides reliable theory support for the experimental research on polymorphism phenomena.

机器学习算法是以统计为基础,对大量数据进行自动归类提取统计特征并进行预测的过程。在化学领域,机器学习可以从大量的描述符信息中提取与所研究问题最为相关的分子特征,为分类与预测提供直接的判别条件。目前,对多晶型现象缺乏系统的认知。实验研究还是采用撒网式的试错方法进行,效率低。晶体结构预测对于单个药物分子,需要上百万核时的计算量,且会产生大量的无效结构。多晶型行为的系统认知可以指导实验研究,提升晶体结构预测效率。故本项目拟以黄酮类化合物为研究对象,采用实验研究,量子和计算化学,理论预测联系实验晶型,得到一套完整准确的多晶型行为数据库。基于机器学习,从此数据库中的分子描述符,晶体描述符和外部影响因素三个层面挖掘一套适用于多晶型行为的描述符,并发掘和建立模型,发现与多晶型现象之间内禀关系,分析不同因素对产生多晶型的影响规律,并为实验研究多晶型现象提供可靠的理论方法支持。

项目摘要

机器学习算法是以统计为基础,对大量数据进行自动归类提取统计特征并进行预测的过程。在化学领域,机器学习可以从大量的描述符信息中提取与所研究问题最为相关的分子特征,为分类与预测提供直接的判别条件。目前,对多晶型现象缺乏系统的认知。实验研究还是采用撒网式的试错方法进行,效率低。晶体结构预测对于单个药物分子,需要上百万核时的计算量,且会产生大量的无效结构。多晶型行为的系统认知可以指导实验研究,提升晶体结构预测效率。.选取不同类别黄酮类化合物,采用不同的结晶方法对其进行筛选。主要分为四类不同结构的黄酮类化合物,发现不同的官能团取代及其位置均会对黄酮类化合物的多晶型行为产生影响,为项目后续研究不同的分子描述符对化合物多晶型影响行为的预测提供基础。. 对香豆素类化合物开展多晶型和晶体结构预测,理论预测联系实验晶型,指导实验研究。我们设计了一套不同精度水平的计算的方法。首先用精度比较低的方法去处理软件的生成的晶体。然后逐步提高精度;同时只用上一步能量比较低的晶体来进行更高精度的计算。得到化合物多晶型的能量-密度全景图。结果发现,预测的蛇床子素多晶型稳定的两个晶型NO.1和2和实验得到的两种晶型(晶型B和A),为得到全面准确的晶型数据库提供了保证。. 建立多晶型行为数据库,并提取、分类各种描述符。通过构建机器学习算法模型,达到从样本数据中进行学习和预测的能力。基于多晶型行为数据库,构建基于机器学习预测多晶型算法模型,进一步利用机器学习模型通过数据挖掘方法获取与多晶型行为相关的有效特征描述符,实现了多晶型行为的预测。本课题的完成,为实验研究多晶型现象提供可靠的理论方法支持,是一条新的指导多晶型研究的捷径,具有较高的应用前景和良好的社会效益。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
5

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019

相似国自然基金

1

小分子多羟基化合物多晶型成核控制及预测研究

批准号:21406049
批准年份:2014
负责人:苏伟怡
学科分类:B0804
资助金额:25.00
项目类别:青年科学基金项目
2

药物多晶型膜结晶及晶型控制与开发研究

批准号:21206032
批准年份:2012
负责人:刘文举
学科分类:B0804
资助金额:25.00
项目类别:青年科学基金项目
3

高压下有机晶体的多晶型研究

批准号:21073071
批准年份:2010
负责人:邹勃
学科分类:B0305
资助金额:36.00
项目类别:面上项目
4

溶液前聚体成核机理、模型与多晶型应用研究

批准号:21676179
批准年份:2016
负责人:龚俊波
学科分类:B0804
资助金额:64.00
项目类别:面上项目