【摘 要】
:
天网知名度系统是基于北大天网搜索引擎技术和中文信息处理技术,针对用户定制的实体信息开展的个性化网络服务研究.重点研究了网页实体相关度评价算法,从而优化了针对特定信
论文部分内容阅读
天网知名度系统是基于北大天网搜索引擎技术和中文信息处理技术,针对用户定制的实体信息开展的个性化网络服务研究.重点研究了网页实体相关度评价算法,从而优化了针对特定信息的网络查询服务质量.在此研究中,通过对中文网页文本内容的大量观察,作者提出了中文网页褒贬态度机器评价的研究方向.基于褒贬评价的修辞属性,作者确定了以语言手段及领域标准为策略的评价算法,独立完成了网页褒贬态度机器评价模块的全部设计与开发,并为此准备了必要的褒贬评价语言知识库,包括在转化现有的基础静态褒贬义词典的有限资源之外,搜集来自真实中文网页的领域相关褒贬义补充词典,积累了一批褒贬态度表达的语言形式模板.该评价模型针对中文网页,依据领域补充褒贬义词典,对网页实体进行褒贬态度评价,其中包含了一系列评价要素,如褒贬结构、领域标准、实体有关、褒贬猜测等关键方法,关联了多种语言知识,从而更合理地模拟了人对网页褒贬信息的解析方法.该模块被应用到天网知名度系统,通过对75万网页近300个实体的评价测试,得到了有价值的实验结果.网页褒贬相关度评价模型的研究开发,为天网知名度系统的个性化网络服务做出了新的和有意义的尝试.
其他文献
随着经济的高速增长和计算技术的不断革新,企业信息化有了显著的发展。在给组织和企业带来管理上的极大便捷的同时,也给信息安全带来了新的挑战。这其中来自企业内部的攻击威
网络的重要性在于人们可以通过它对异地的信息进行快速访问,由于各种原因导致网络故障会给我们的生活带来许多不便,高质量的网络管理系统的需求日益明显。好的网管系统能降低网
该文介绍了基于WEB的Client/Server和Browser/server信息服务系统的结构模式.分析认为,Browser/server结构是Web信息服务系统结构模式的发展趋势.数据库访问接口技术对于数据
印刷体英文字符识别是模式识别的一个重要分支,具有广泛的应用领域.字符识别主要包括文档切分、单词切分、字符识别及后处理几部分.该文描述的英文字符识别系统实现了从图像
人机交互是一个广受关注的交叉学科领域,用户界面是其主要的实现手段。用户界面经历了批处理界面、命令行界面和图形用户界面三次主要变革,其中,图形用户界面由于其直接操纵和技
组播是一种有效支持多点通信的机制。IP组播利用树转发结构,只需在组播树的分支处复制数据报文,而且在每条链路上仅转发一次。这种技术使IP组播在转发数据到所有组成员时能有效
Internet自诞生以来不断成长,尤其是最近几年更是得到长足发展,功能不断扩展,信息容量呈爆炸性趋势增长.然而在信息极大丰富的同时,用户也面临着信息过载和资源迷向的问题,In
随着互联网技术的迅速发展以及数据的爆炸式增长,云存储日益成为数据存储模式的未来发展趋势。云存储允许用户通过联网设备在任意时间、任意地点对数据进行访问,并无需负责运行
该文首次将入侵检测与攻击源追踪隔离有机地结合在一起,作为一个整体进行研究.提出将入侵检测技术融入攻击源追踪隔离领域,这样现有的大量入侵检测技术就可以直接应用于攻击
低分辨率的、退化的、图像信息不全的汉字识别问题正成为当前字符识别领域里的研究热点,也是影响汉字识别技术进一步推广的一大障碍.对于一个能够实际应用的识别系统,应该具