论文部分内容阅读
以P2P、博客、社交网络、Wiki等技术为代表的Web2.0模式的广泛应用,不仅改变了信息产生、存储、传播和共享的方式,而且也给网络用户的工作、生活带来了极大的便利。但由于网络的开放性、虚拟性和匿名性,以及Web2.0中用户生成内容的特性,使得用户会对网上信息以及通信方的可信度产生质疑,并阻碍用户使用各种Web2.0系统。同时Web2.0的参与性与散布性会引发不同用户间的争议,影响Web内容的信任度和信息的传播。因此,Web2.0环境下实体信任的评价方法与管理模型以及争议内容的发现算法成为计算机领域的研究热点。本文在阐述Web2.0的核心技术、特点以及信任的概念、性质、度量方法和管理模型的基础上,对现有的信任模型和争议发现算法进行了分析比较,针对信任评价中文字评论与等级评价不一致和用户主观评价差异等问题,提出相应的解决方法,并分别构建了基于HMM和情感分析的信任模型、基于AHP的电子商务信任评价方法以及消除用户主观评价差异的电子商务信誉模型,最后就维基中的词条争议问题提出基于文本差异的争议度算法,并通过改变争议单词的背景色突显最具争议的内容。具体研究工作如下:(1)建立基于HMM和情感分析的信任模型。依据信任的主观性,将信任作为实体的隐藏状态,并用离散HMM进行描述。通过对在线评论系统中文字评论的情感极性分类将其转换为等级评价,并结合原有的等级评价,设计了综合评价级别生成算法,将综合评价作为HMM的观测值,最后依据HMM参数计算实体的信任度。通过仿真实验对模型解决文字评论和等级评价不一致的有效性进行了验证,并证实信任计算的准确性。(2)设计有效的电子商务信任评价方法。在全面分析电子商务中影响买方对卖方信任因素的基础上,建立了层次化的网站质量评价指标体系,并运用层次分析法计算每个指标的权重,最后根据电子交易特性和信任影响因素设计了初始信任评价算法和重复信任评价算法。通过实例分析说明信任评价方法的应用过程,并验证了方法的实用性和有效性。(3)创建消除用户主观评价差异的电子商务信誉模型。在确立标准用户的基础上,运用调和平均值和上下文环境设计了用户信任评价主观差异的自动发现与消除算法,并据此构建了电子商务的信誉计算与管理模型。通过仿真实验及结果分析对消除用户主观评价差异的信誉算法的准确性和抗欺诈性进行了验证。(4)提出基于文本差异的维基百科争议内容发现算法。依据Wikipeida词条所有版本文本段落数、字数和参考文献数的统计值设计恶意修改版本的过滤算法,并提出基于峰值—谷值确立标志词条成熟版本的方法,对成熟版本之后的所有词条版本文本运用LCS算法统计单词的争议次数,并据此给出词条争议度算法和用户争议度算法,同时提出一个动态的争议单词背景色改变算法。通过仿真实验验证词条争议度算法的性能,并运用Mediawiki引擎创建Wiki站点实现争议单词背景色修改功能。