针对DNA序列数据每天以海量速度增长和占用存储空间日益增加的问题,本项目研究基于矢量的DNA序列数据压缩算法。.在DNA序列数据压缩过程中发掘序列的生物学解释,采用生物启发式优化算法实现高效的DNA序列仿生聚类,生成编码性能更高的近似重复矢量,替代传统的重复子串匹配方法是本项目追求的目标。.本项目将利用近似重复矢量编码技术寻求DNA序列数据无损压缩中的最佳码书设计。运用生物学知识构建具有生物信息学知识的DNA序列仿生聚类, 寻找序列的生物特性,提取近似重复矢量,构造DNA序列数据的近似重复矢量的数学模型,认识和掌握其内在机理和本质特性。.` 本项目将DNA序列数据压缩研究从"精确重复子串匹配"、"最长精确重复子串匹配"、"近似重复子串匹配"拓展到"近似重复矢量"阶段,在国际上属于源头创新,对于提高DNA序列数据编码效率有着重要的理论价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
硬件木马:关键问题研究进展及新动向
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
疏勒河源高寒草甸土壤微生物生物量碳氮变化特征
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
对虾基因组DNA重复序列的分析和定位研究
基于近似重复结构的建筑建模、修复和绘制
网络环境下矢量数据压缩与渐进传输方法研究
与人遗传病相关的DNA重复序列柔性的实验和理论研究