【摘 要】
:
互联网时代的到来使得网上购物成为了更为效率和方便的消费方式。在庞大的商品信息面前,如何快速为用户定位和选择合适的商品,提升用户的消费体验和消费效率是业内关注的技术要点。对于大多数线上商品营销领域而言,数量庞大且结构复杂的商品数据让传统搜索引擎或客服机器人系统无法准确理解用户的要求并简洁、精准的给出用户想要的答案。在大多数P2P平台的导购场景下,用户还必须进行多次迭代的需求描述与分类定位,或者直接联
论文部分内容阅读
互联网时代的到来使得网上购物成为了更为效率和方便的消费方式。在庞大的商品信息面前,如何快速为用户定位和选择合适的商品,提升用户的消费体验和消费效率是业内关注的技术要点。对于大多数线上商品营销领域而言,数量庞大且结构复杂的商品数据让传统搜索引擎或客服机器人系统无法准确理解用户的要求并简洁、精准的给出用户想要的答案。在大多数P2P平台的导购场景下,用户还必须进行多次迭代的需求描述与分类定位,或者直接联系人工客服才能得到自己意向商品的信息。论文以书籍商品为研究领域,以其智能导购关键技术为研究目标,通过引入知识图谱问答(Knowledge Base Question Answering,KBQA)技术,提出了一种基于深度学习的书籍导购应答机器人系统。输入书籍相关问题即可得到相关内容的回复,旨在通过对用户需求的提问进行语义分析并明确用户意图,再通过书籍信息知识图谱快速匹配答案。以此实现书籍的导购业务与信息查询,本文主要开展的工作如下:(1)书籍信息知识图谱的构建。通过构建爬虫程序在权威数据网站上进行了书籍信息爬取。采用了异步爬取技术,提高了爬虫运行效率,并在获得数据后进行了清洗与整合。通过对数据的分析构建了书籍信息知识图谱的Schema层,将Neo4j图数据库选作书籍信息知识图谱的实现平台,依靠py2neo进行了知识图谱的自顶向下自动化快速构建与可视化。(2)提出一种融合特征的命名实体识别模型(RSBC)。构造了书籍领域词典,采用Soft Word方式提取了词汇边界特征。将预训练模型Ro BERTa的字符级嵌入与之结合。并利用Bi LSTM模型融入方向信息并通过CRF层进行标注纠错,提高命名实体识别的准确率。提出一种基于预训练的卷积意图识别模型,将传统Text-CNN与预训练模型相结合,利用BERT善于提取文本特征的特点,弥补了Text-CNN不善于提取长距离文本特征的缺点,取得了一定的效果提升。(3)设计并实现了基于深度学习的书籍导购应答机器人系统。在构建的书籍知识图谱和设计的智能问答算法的基础上,实现了书籍导购应答机器人系统。利用Flask等框架实现系统前后端的开发,完成书籍导购业务和书籍相关知识问答。
其他文献
视觉故事生成是最近兴起的一个研究方向,旨在从一个离散图像序列生成主题一致、情节连贯和表达丰富的故事,并在文学创作及教育行业具有广泛的应用价值,不仅可以减少文字工作者的工作量,同时也可以为少儿教育及考试提供丰富的素材;研究视觉故事生成对多模态文本生成任务的发展也有促进作用。由于图像序列中的各图像间可能不具有直接相关性,挖掘图像之间的关联性较为困难,目前方法生成的故事主要存在主题不一致、情节连贯性差、
随着网络科学的不断发展,网络分析被广泛应用于各个领域,帮助分析复杂系统中的实体关联、异常勘探、传播模式、预测等,而网络可视化是进行网络分析高效直观的途径。复杂系统中实体间的关联模式与属性密切相关,对于由实体对象及其属性共同构成多元网络(multivariate networks,MVNs)进行可视分析也相较于仅考虑拓扑结构或单一属性的网络存在更多挑战。多元网络可视分析在网络布局和交互分析中面临以下
层次数据广泛存在于实际生活中如图书馆目录、分类学和物种发展史等。其将数据组织成不同细粒度层次的特点,有利于人们对数据的理解和认知。但伴随大数据时代的到来,现有层次数据不仅结构庞大同时各节点蕴含丰富的多维属性信息,这给数据的认知带来挑战。可视化和可视分析作为探索认知数据的有效手段,但现有的可视化方法对于探索现有的复杂层次数据的方法较少,如何快速探索分析大且复杂的层次数据,为决策者进行辅助判断,是一个
实时操作系统(Real-Time Operating System,RTOS)有着定制性强、实时性高、占用资源少等优点,被广泛的应用于智慧家庭、智慧农业、智慧城市等领域。微内核是将操作系统的文件系统、网络协议栈等组件隔离在内核之外,内核只保留任务调度、内存管理、进程间通信等组件,这样能够提高设备的可拓展性、灵活性与稳定性,并提供模块化的设计。随着物联网(Internet of Things,IoT
在人的成长各个阶段,其注意力状态都对日常生活有着巨大的影响,利用注意力状态识别结果进行神经反馈,可以辅助治疗注意缺陷多动症、提升成年人的专注状态、改善健康老年人的记忆力以及预防阿尔茨海默病等,具有重要的理论研究和临床应用价值。因此,注意力状态识别越来越引起研究者的重视。利用脑-机接口进行注意力状态识别是目前最常用的方法。但由于脑电的非平稳性,不管是传统方法,还是深度学习方法,识别精度都较低。此外,
抓斗卸船机是干散货码头卸船工作中的关键设备,相较于连续卸船设备,如铰链式卸船机等,有着灵活、适应性强和成本低等优点。在目前的人工卸船方式下,生产效率和安全性都依赖于司机的经验和熟练程度。在司机操作视野受限和长时间高强度劳作的情况下,抓斗与船体发生碰撞事故的概率明显提高。处理碰撞事故通常又伴随着停工和修理赔偿等问题,极大地影响码头生产。因此,智能地判断抓斗与船体的位姿关系并在事故发生前发出警报尤为重
淋巴结呈椭球形,分布较广,能清除细菌、病毒,是免疫系统的重要部分。腹膜后淋巴结位于腹部腹主动脉和下腔静脉之间,腹膜后淋巴结的大小是判断胃癌、宫颈癌和睾丸癌是否转移以及生存期长短的关键,更是监测疾病的进展和验证治疗癌症有效性的重要因素。计算机断层扫描成像(CT)因有较好的空间分辨率、成像质量较高等优势,是临床评估腹膜后淋巴结的主要手段之一。在整个环境复杂的腹部CT图像中,淋巴目标区域覆盖像素较小,属
脑卒中也称为脑血管意外,是因颅内血管阻塞或破裂造成的。脑卒中是全世界最严重的脑血管疾病之一,而颅内动脉粥样硬化斑块(后简称:颅内动脉斑块)的破损是导致脑血管意外的主要原因。高分辨率核磁共振成像技术(High-Resolution Magnetic Resonance Imaging,HRMRI)由于其高精度的成像能力,能够清晰地展示颅内动脉斑块,是目前颅内动脉影像检测的重要方法之一。传统易损斑块诊
进入21世纪以来,中国先后制定了天宫计划、嫦娥工程、中国行星探测工程;伴随着工程的展开,大量航天器被发射到太空。大部分大型航天器达到使用寿命终期时,会进行轨道衰降并重返地球,例如2011年发射的天宫一号空间实验室,在2018年到达使用寿命后重返地球并坠落在南太平洋中部区域。大型航天器重返地球往往不能在大气层完全燃烧销毁,碎片可能会掉落地球,从而对地球造成环境、财产和人员伤害。研究与设计一套大型航天
面对物联网终端设备电池续航时间短、计算资源不足等问题,移动边缘计算作为5G网络的关键技术,可以将终端设备的任务卸载至具有强运算能力的边缘节点。但在偏僻地区或道路遇险等特殊情况下,基站等移动边缘计算基础设施难以部署且部署成本较高。采用携带通信模块和边缘计算服务器的无人机,可帮助终端设备完成数据收集和实时计算,降低终端设备的计算时延和能量消耗;无人机也可以作为中继节点协助终端设备使用基站提供的移动边缘