【摘 要】
:
针对目前中文短信过滤研究缺乏样本库的现状,提出一种客户端样本特征库生成方法。设计客户端短信过滤样本特征数据库,将客户端接收到的短信进行预处理和中文分词,考虑高信息量的
【机 构】
:
兰州工业学院电子信息工程系,兰州交通大学电子信息工程学院
【基金项目】
:
甘肃省自然科学基金资助项目(1208RJZA186),甘肃省高等学校科研基金资助项目(2013A-127),甘肃省科技支撑计划基金资助项目(1104GKCA032),兰州市科技计划基金资助项目(2010-1-225)
论文部分内容阅读
针对目前中文短信过滤研究缺乏样本库的现状,提出一种客户端样本特征库生成方法。设计客户端短信过滤样本特征数据库,将客户端接收到的短信进行预处理和中文分词,考虑高信息量的低频词和带有较强类别特性的特征词,改进互信息评价函数提取样本特征,形成特征数据。采用NaiveBayes算法测试特征数目对过滤器性能的影响,实验结果表明,当特征数目为10时,测试准确率达到最大值,当样本特征库中短信数目达到2000条时,数据库文件的大小约为714.28KB,可在普通手机平台上运行,验证了特征库生成方法的可行性。
其他文献
本文探讨了新时期人力资源开发和利用的趋势,并提出人力资源管理创新建议:首先管理者要转变观念,走出传统的误区,把人力资源能力的开发与广纳人才放在战略的位置;其次人力资
煤炭一直是我国的主要能源,当前,煤炭在我国能源结构中的地位正面临着其他能源形式的挑战。化石类能源向可再生能源和新能源的转变虽是能源发展的大趋势,但目前还仍处在化石
随着中国对美国贸易的增长,美国关税法"337"条款正成为美国企业对我国出口产品进行知识产权诉讼的主要武器.然而,对于这一新式贸易壁垒,国内的大多数企业对其认识较为陌生.由
本文通过构建一个带有企业信贷约束的随机动态一般均衡模型(DSGE),检验了地产价格对宏观经济变量的传递效应。本文假设在企业的信贷约束中土地被作为一种抵押资产,此时要定义
病理性瘢痕的形成机制尚不明确,目前的治疗也未取得良好效果,而基因治疗有望从根本上治疗病理性瘢痕。本文从抑制成纤维细胞增殖、调节细胞外胶原代谢、改善细胞外环境阐述病
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
赫鲁晓夫上台之后,深刻认识到当时苏联政治体制上存在的一些问题,展开了一系列政治体制改革,试图加强党的集体领导,稳固社会主义政治制度。这场改革针对过去政治体制的弊端进
企业作为资产的一种特殊形式,其价值的评估近年来成为资产评估界讨论的热点。伴随着现代资本市场的迅速发展,资本更加广泛地流动,企业私有化、上市、合资、收购兼并、重组等
根据世贸组织《纺織品与服装协定》,2005年1月1日影响全球纺织品贸易长达40年的配额管理体制如期终结。这让不少国内企业为之振奋,期待着解除了一大束缚的中国纺织品在世界市场上能突飞猛进,大展宏图。然而,作为第一纺织大国,我国2004年950亿美元的出口额和20%的世界出口份额也使“中国威胁论”在不少国家随之升温。笔者认为,我国纺织业必须保持清醒头脑,充分认识到我国作为纺织大国还远非纺织强国,要真正
随着我国创业板市场在深交所的正式挂牌成立,我国的资本市场得到了进一步的发展和壮大。虽然,创业板市场专门为新兴产业和成长性较好的中小企业提供了较好的融资平台,但是,在