论文部分内容阅读
资源描述框架图查询中,准确估计查询结果的大小是查询优化器中的关键步骤。已有方法忽略了该图自身的不确定性以及子查询间的关联关系,无法有效估计结果。针对该问题,本文提出一种基于贝叶斯模型的基数估计方法。该方法引入贝叶斯网络模型,挖掘出子查询内的属性依赖。同时,在这些属性依赖的基础上提出子网拼接方法,计算出子查询间的影响因子。最后,利用以上信息准确估计出任意查询结果集的基数。实验表明:与已有方法相比,本文方法的准确性提高15%以上,性能没有大幅度下降。