论文部分内容阅读
表格自动处理是文档图像处理领域的研究热点之一,既有重要的学术研究意义,也有广泛的应用价值。针对有线表的处理技术已经趋于成熟,但是针对无线表的自动处理技术尚存在诸多不足,难以满足现实应用需求。
本文总结了无线表自动处理技术的研究成果,建立了完整的无线表描述机制与处理系统结构,实现了针对无线表的自动定位、结构分析和格式重现。
本文利用启发式规则和文本块竖直聚类思想,提出稳定的无线表自动定位判断准则和处理方法。基于表格结构描述机制对无线表进行良好的结构描述与分析,并实现了对无线表结构的重现和格式转化。
本文实现了完整的无线表自动处理系统,并基于真实样本集进行性能评测,处理精度达到90%,可满足各类文档图像处理的应用需要。