论文部分内容阅读
传统的搜索引擎可以很好地发现静态网页,但是不能获取隐藏在查询接口背后的大量数据。大量不断更新的数据只能通过填写HTML页面的查询接口对后台的数据进行查询得到。本文介绍了一种发现查询接口的有效方法。通过用更具代表性的属性描述查询接口。并利用决策树技术对查询接口进行分类,从而达到比较高的识别准确率。