论文部分内容阅读
Web信息抽取是一个根据抽取的规则,从半结构化的网页文档中抽取相关数据,并将它们转化为结构化的数据的过程.其中抽取规则是信息抽取系统的基础,很多信息抽取规则学习方法已经被提出来.提出一种基于神经网络学习的规则抽取方法,可以通过学习训练样本形成较一般的信息抽取规则,并能够根据所产生的错误的实例自动调整权值,提高包装器的适应性.