论文部分内容阅读
以解析美国农业部发布的《世界农产品供需评估报告》的XML数据为例,设计开发软件,通过读取模板识别出报表,并提取模板内正则表达式,利用dom4j作为XML解析器,解析XML文档,通过XPath表达式提取相应XML结构树,利用模板提取到正则表达式去匹配组织模板所需信息和数据,形成特定的数据结构,以此类推逐个读取模板内报表重复上述操作,从而实现按照特定规则解析XML数据的方法.