基于Spring Cloud的分布式语义分析挖掘平台中管理子系统的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:hnwkn2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
企业生产经营过程中产生的大量非结构化数据,尤其是文本数据中,蕴含着众多业务信息。如何充分利用这些数据,挖掘其中蕴含的价值并为决策提供指导成了人们关心的问题。文本的语义分析包含词语、句子和篇章三个层次,目前对各个层次都有一些较为成熟的理论和分析工具,如格语法、潜在语义分析等,这些自然语言处理技术的发展也为文本分析挖掘的实现提供了可能。由于文本内容来源繁多,表达方式灵活多样,存在大量歧义性,简单地应用分析工具很难得到理想结果。此外,多数数据和业务场景密切相关,需要根据业务特点对分析策略进行大量针对性调整,这极大地增加了企业的实施成本。企业需要一个简单易用,又能根据业务需求进行适当调整的工具,来帮助他们实现分析挖掘的目标。在上述背景下,本文论述了一个语义分析挖掘平台设计与实现的全过程。该平台采用本体(Ontology)-要素(Element)-概念(Conception)三位一体的OEC建模技术实现业务建模,将业务和语言分为两个不同层面分别处理,并以此作为基础资源,表达不同业务需求的挖掘策略,最终输出面向业务的结构化的标签。技术方面,该平台采用微服务架构,通过Spring Cloud组件构建了一个灵活高效的分布式系统并通过Docker实现快速部署,使整个系统具有较强的可扩展性。本文所实现的文本分析挖掘平台,可以在不进行自定义开发的情况下即具备较好的分析挖掘能力,内置的场景模型可以帮助企业快速开展相关分析。其中情感分析、命名实体识别等模型准确率可达90%以上,各算法组件的响应时间平均在10ms以内,高并发场景下也能保证在300ms以内。随着内置模型与算法的增加和改进,平台有望成为企业进行文本分析挖掘、执行人工智能战略的最佳选择。
其他文献
近年来,随着机器学习模型的日益成熟和在各领域的广泛应用,其存在的安全问题也逐渐显现。攻击者通过精心构造与真实数据差别不大的对抗样本,可以使机器学习模型做出错误的决策,这对机器学习应用造成了巨大的潜在威胁。尤其是在入侵检测领域,对抗样本可以躲避入侵检测模型的检测,导致系统遭受恶意攻击。但是目前针对入侵检测对抗样本的生成研究都忽略了样本中存在的特征约束,不满足特征约束的对抗样本很容易被检测出来而无法攻
目前,国内人口老龄化问题愈发严峻,因此,老龄化设计逐步受到设计行业乃至全社会的高度关注。在互联网逐渐发展更新迭代至5G时代,移动软件的运用范围逐渐拓展,在社会老龄化的趋势下,老年人也在受智能手机和移动应用的影响成为了移动应用服务的用户人群之一。目前在手机应用市场中,与老年用户相关的应用少之又少,大多数应用都是针对年轻人设计的。老年人有自己独特的生理、心理和认知特征。因此,老年用户的应用程序应该与年
句子压缩是将长而含有冗余信息的句子压缩成简短的语义表达的任务,简化文本结构,保留重要的含义和信息。随着互联网时代的发展,句子压缩成为越来越重要的任务之一。句子压缩技术大大减少互联网上的信息过载,尤其在屏幕空间有限的移动设备上应用广泛。但同样,句子压缩任务也面临着不小的挑战。当前的主流算法中,基于神经网络的压缩算法缺乏外部信息指导,并且对语句中跳跃性的长距离信息难以捕获;而使用基于规则的句法解析方式
行人检测技术与行人重识别、行人跟踪等技术相结合,可应用在公共区域监控安防、智能辅助驾驶等领域。然而,现有的行人检测网络模型主要依靠通用目标检测模型。虽然取得了良好的检测效果,但直接应用通用目标模型对行人进行检测时,部位受遮挡的行人会存在漏检而导致精度降低等问题。本文在卷积神经网络相关理论知识与通用检测模型的基础上,构建了适用于行人部分受遮挡的检测模型,并提出了基于改进YOLOv3网络结构的行人遮挡
A型分子筛作为微孔材料,具有丰富的孔结构、规则的孔道分布,因而在催化材料、吸附材料、分离材料、光电材料、功能材料等领域具有广泛的应用,为社会发展创造巨大的价值。目前,以高岭土等矿物材料为原料合成分子筛是其发展趋势,高岭土是一种天然硅铝酸盐矿物,在我国储量十分丰富。本论文以高岭土为原料,利用水热合成法制备了A型分子筛。研究了陈化温度、陈化时间、晶化温度、晶化时间以及碱浓度对4A型分子筛结晶度的影响,
随着电力改革持续深入,新旧动能转换持续加速,发电政策面临煤电严控、新能源竞争激烈的双重限制,电力市场已然从当初的垄断地位形成电能过剩的激烈竞争格局。燃煤发电企业正面临改革深入化、供需多元化、结构低碳化、价格市场化、监管严格化前所未有的严峻新形势、新挑战。发电企业竞争日趋激烈,电力市场利润空间一再压缩,尤其燃煤小火电机组的生存举步维艰,如履薄冰,未来发展不容乐观。燃煤小火电机组如何根据内外部环境的变
以冗余微惯性测量单元(Micro-Electro-Mechanical System-Inertial Measurement Unit,MEMS-IMU)为核心部件的捷联惯导系统因体积小、可靠性高、自主性和抗干扰能力强等优点在制导、机器人等领域广泛应用,并具有应用于飞机、船舶等运载体的潜力。由于MEMS器件误差是惯导系统的主要误差源,因此目前广泛采用MEMS-IMU误差补偿技术提高捷联惯导系统的
车险目前乃至将来相当长一定时期内都是财险市场最大的险种,甚至中小财险公司车险的保费收入占比均高于七成,造成这一局面不仅是因为车险的覆盖范围大、人们认知度高且市场容
众所周知的是,无线视频组播数字传输方案会产生悬崖效应,为了更好地解决拥有不同信道特性的多个接收端接收到更优的视频质量,一种伪模拟视频传输系统Soft Cast被提出。MIMO技
城乡间发展差距是城乡关系研究的重要理论和实践问题,城乡间发展差距增大,不仅影响区域经济协调发展,影响生产要素的合理流动,也是产生社会矛盾的原因之一,并是影响2020年前国家实现全面脱贫的因素之一。本研究以新疆为案例,二元结构理论、城乡协调发展理论、城乡共生理论、城乡一体化发展理论为基础,采用协调度模型和熵值法、Arc GIS空间分析方法,构建城乡发展差距评价指标体系,对新疆2000年到2016年的