论文部分内容阅读
体可视化技术是可视化研究中的关键技术之一,在计算流体力学地球空间医疗科学等各个领域中得到了广泛应用,体数据是由一些体素(Voxel)组成的集合,由于是高维数据,往往具有很大的数据量,特别是近年来随着数据获取设备性能的提高和科学模拟精度的增加,体数据的数据量急剧增长,达到了几十GB甚至TB级别如此巨大的数据量对计算性能存储空间和网络传输速度等都提出了很大的挑战,如当前的显存空间难以一次性读入整个体数据进行绘制,因而体数据的压缩技术研究是当前可视化领域的一个重要研究问题近几年来,关于稀疏编码模型在特征提取模式识别数据压缩方面的研究已越来越受重视,其编码方式不依赖于输入数据的性质,仅仅依靠输入数据的统计特性,因而是一种自适应的特征统计方法,应用前景十分宽广,具有较大的实用价值本论文主要围绕稀疏编码理论及机器学习在体数据压缩方面的技术研究展开,具体的研究工作如下:1总结和分析了传统体数据压缩技术,主要有数据分块聚类数据降维特征提取和投影,对每个过程中用到的技术和方法进行了详细地介绍,并分析了各自的压缩效果及特点2简要介绍了稀疏分解理论及算法模型,并结合稀疏编码的收敛性,对体数据的稀疏编码模型进行数学描述,对稀疏编码过程中用到的技术和方法进行了详细地介绍针对原有的稀疏分解算法进行了改进,提出了利用匹配原子间的相关性来实现快速分解的算法另外,本文通过使用K-SVD算法来更新数据字典,进一步优化算法,之后重点介绍了构建过完备数据字典的方法,并讨论了体数据在数据字典上的投影映射及字典的更新3提出了一种基于机器学习的压缩算法,使用PCA主成分分析方法压缩体数据,再利用半监督学习方法建立回归函数来压缩PCA投影系数,组合多个位置相关和系数特征相关的核函数来生成回归函数,并用主动学习方法选取较优的代表系数本文算法结合适当的量化编码,无论在速度上,还是在压缩效果上,相对传统压缩算法都更具优势