基于Context建模的基因组数据压缩研究

基本信息
批准号:61861045
项目类别:地区科学基金项目
资助金额:35.00
负责人:陈建华
学科分类:
依托单位:云南大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:唐猛,易虎,李京建,王健明,史伟,王炯,和志圆,罗茂
关键词:
上下文加权相似性测度上下文树模型随机访问基因组压缩
结项摘要

Context modeling-based entropy coding has been applied in many applications. The major obstacle in practice is how to construct an effective context model which can improve the entropy coding efficiency as well as reduce the model cost. The optimization of the context tree model and context weighting are two effective methods to tackle the above problem. However, both of them can still be improved. In this project, the tuning of the context tree model will be performed on a more fine-grained basis. The context weighting cost and optional context weighting will be explored. Meanwhile, for the referential-based genome sequence compression, the similarity measure between the reference and target subsequences as well as the suffix array-based optimal matching strategy will be studied. The random access of the compressed sequence along with the corresponding context modeling strategy will also be studied in this project.

基于 Context 建模的熵编码已经获得广泛应用。实际应用中的主要问题是如何建立有效的 Context 模型,既提高熵编码效率又降低模型代价。基于Context树模型的优化与context加权是解决这个问题的有效手段。但目前这两种技术都还有改进的空间。本项目基于最小描述长度理论,研究context树模型的更细粒度优化问题;探索context加权代价和可选择加权。同时,针对基于参考的基因组压缩问题,研究序列片段的相似测度和最佳匹配策略,探索基于后缀数组的匹配序列查找算法,研究压缩数据的随机访问以及适合随机访问分组压缩的context建模问题。研究成果将以论文形式在国内外重要期刊上发表论文 10 篇以上(SCI,EI收录6-8篇)

项目摘要

本项目首先对利用context模型实现高阶条件熵编码时面临的模型稀释问题进行研究。以context树模型作为优化对象,采用描述长度增量作为树节点的合并依据,获得了更有利于改进编码性能的条件概率分布。在基于参考序列的基因组数据压缩研究中,我们根据目标与参考序列的相似程度,合理利用局部与全局匹配,实现了FASTA格式数据的高效压缩。在对FASTQ文件中质量分数压缩研究中,通过设计合理的映射规则和轻量级索引,在保证压缩效率的同时,实现了对压缩数据中指定分段的快速随机访问。.本项目对分布式信源编码问题也展开了研究。针对目前基于信道码的方案不能利用信源内部相关性,我们通过传送一部分信源数据,以改进边信息或改进迭代译码概率分布的方式,使基于信道码的分布式信源编码方案能通过利用信源内部相关性来提高压缩效率。针对基于信源码的分布式信源编码方案在特定的信源概率分布下,不能有效利用信源间相关性的问题,我们以间隔编码来代替扩展概率区间方案,使分布式算术码对信源间相关性的利用不再依赖信源概率分布。.在分布式视频编码的边信息生成与改善研究中,针对如何更有效实现解码方运动估计的问题,我们尝试了将光流法与块匹配法有机结合来降低运动估计的计算复杂度,也研究了通过传送一部分WZ帧信息来弥补解码方运动估计不理想的问题,还探索了基于相位插值的运动估计思路,以便在光照有变化的情况下,弥补光流法的不足。.采样速率很大程度上决定了信号压缩感知的重建质量,因此本项目对速率自适应的压缩感知展开了多项研究。包括通过对稀疏信号的概率分布建模,用采样值的能量对信号稀疏度进行估计,并通过速率自适应调整,实现了监控视频压缩感知重建质量的重大改进;将采样端和重建端提供的信息进行融合来对当前帧的稀疏度进行估计的方案,提高了普通视频的压缩感知重建精度等研究。.综上所述,本项目在上述研究方向都取得了良好的成果,顺利完成了项目研究任务。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

陈建华的其他基金

批准号:21676133
批准年份:2016
资助金额:64.00
项目类别:面上项目
批准号:11501189
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:11901276
批准年份:2019
资助金额:26.00
项目类别:青年科学基金项目
批准号:51874106
批准年份:2018
资助金额:62.00
项目类别:面上项目
批准号:31471547
批准年份:2014
资助金额:80.00
项目类别:面上项目
批准号:51164001
批准年份:2011
资助金额:51.00
项目类别:地区科学基金项目
批准号:61804073
批准年份:2018
资助金额:26.00
项目类别:青年科学基金项目
批准号:21277132
批准年份:2012
资助金额:70.00
项目类别:面上项目
批准号:50864001
批准年份:2008
资助金额:26.00
项目类别:地区科学基金项目
批准号:30371687
批准年份:2003
资助金额:19.00
项目类别:面上项目
批准号:11226241
批准年份:2012
资助金额:3.00
项目类别:数学天元基金项目
批准号:41101366
批准年份:2011
资助金额:23.00
项目类别:青年科学基金项目
批准号:81072560
批准年份:2010
资助金额:10.00
项目类别:面上项目
批准号:40775075
批准年份:2007
资助金额:40.00
项目类别:面上项目
批准号:21076174
批准年份:2010
资助金额:33.00
项目类别:面上项目
批准号:61062005
批准年份:2010
资助金额:22.00
项目类别:地区科学基金项目
批准号:30873192
批准年份:2008
资助金额:8.00
项目类别:面上项目
批准号:51574092
批准年份:2015
资助金额:65.00
项目类别:面上项目

相似国自然基金

1

基于Context建模的熵编码及其应用研究

批准号:61062005
批准年份:2010
负责人:陈建华
学科分类:F0101
资助金额:22.00
项目类别:地区科学基金项目
2

面向质量控制的化工过程数据压缩与建模研究

批准号:20206028
批准年份:2002
负责人:王海清
学科分类:B0806
资助金额:18.00
项目类别:青年科学基金项目
3

基于自组装参考基因组的高通量长读测序数据压缩和比对集成研究

批准号:61871272
批准年份:2018
负责人:朱泽轩
学科分类:F0124
资助金额:62.00
项目类别:面上项目
4

基于几何图像的网格数据压缩方法研究

批准号:61100130
批准年份:2011
负责人:王少帆
学科分类:F0209
资助金额:22.00
项目类别:青年科学基金项目