【摘 要】
:
随着科技迅速的发展以及智能手机的广泛普及,人们的生活已经离不开移动应用程序。然而移动应用程序随时都会访问用户的个人隐私数据,这会对用户的个人信息安全造成侵害。如今世界各国的用户和政府开始关注个人隐私信息的保护,要求移动应用程序必须提供隐私政策供用户去阅读,隐私政策作为移动应用程序服务提供商向用户展示他们是如何收集、使用、披露和管理隐私数据的文本,其冗长且难以理解,用户们通常选择忽略。本文首次提出以
论文部分内容阅读
随着科技迅速的发展以及智能手机的广泛普及,人们的生活已经离不开移动应用程序。然而移动应用程序随时都会访问用户的个人隐私数据,这会对用户的个人信息安全造成侵害。如今世界各国的用户和政府开始关注个人隐私信息的保护,要求移动应用程序必须提供隐私政策供用户去阅读,隐私政策作为移动应用程序服务提供商向用户展示他们是如何收集、使用、披露和管理隐私数据的文本,其冗长且难以理解,用户们通常选择忽略。本文首次提出以摘要的形式去提高隐私政策的可读性。本文从70篇隐私政策中收集、标注并整理了1058对隐私政策摘要数据集,该数据集填补了隐私政策摘要生成领域的空白。同时本文采用生成式的摘要生成方法,在现有Seq2seq+Attention模型的基础上,针对隐私政策摘要生成任务中数据量有限、存在OOV词汇以及重复生成同一单词的现象,本文添加了丰富词向量特征维度、指针生成网络、以及覆盖惩罚机制。而对于本文关于隐私政策摘要的数据量小不能训练出一个可用的模型的问题,本文借鉴了迁移学习的思想,将拥有大数据量的Gigawords数据集训练的模型参数作为本文隐私政策摘要数据集训练的初始化参数,然后进行拟合训练。最后本文通过生成的摘要实例和评价指标ROUGE验证我们方法的有效性,我们在ROUGE-1、ROUGE-2和ROUGE-L上的结果分别达到了31.86%、11.05%和30.70%。结果表明,本文的方法能够针对隐私政策生成简短且具有概括性的摘要,达到了预期效果,对帮助用户快速阅读隐私政策有一定的帮助。
其他文献
随着公共数据库中生物序列的大量涌现,出现了很多用于预测基因和蛋白质的功能属性的生物信息学算法。预测基因和蛋白质的功能属性过程中的一个挑战是直观地分析和理解生物序列的统计特征。虽然目前已经出现了一些web服务器和独立程序用于生物序列的特征提取以及特征可视化,但是仍然缺乏一个可以完成多种序列特征可视化的软件工具。因此本文完成了一个生物序列特征可视化系统,这是一个开源的跨平台独立程序,它可以通过特征可视
长非编码RNA(long noncoding RNAs,lnc RNA)在多种生物活动中发挥着重要作用,包括转录、剪接、翻译和细胞凋亡等等。实验表明lnc RNA主要通过与蛋白质的相互作用实现其生物功能,因此研究lnc RNA与蛋白质的相互作用对于探索lnc RNA的作用机制具有重大意义。通过生物实验验证lnc RNA-蛋白质相互作用需要耗费大量的时间和金钱,开发计算模型预测lnc RNA-蛋白质
随着海上交通量的迅猛增长,水域内的交通负担加重,航运事故时有发生,航运相关人员的生命财产安全受到巨大的威胁。为了提升水域交通管理和异常轨迹监管的服务质量,船舶交通服务系统主要采用船舶轨迹预测方案来监测船舶异常行为,维护水域交通安全。船舶的航线预测属于长期预测,而目前大多数轨迹预测模型对于长期轨迹预测的效果并不理想,且不适用没有路网束缚的海上交通情形,因此无法使用传统的轨迹预测模型来实现船舶轨迹的预
随着科技的发展,人们对社会公共安全的关注度逐渐提高,使得世界各地政府和学者在智能安防领域投入大量精力。安防系统无论是在民用还是在军用都有着不可或缺的地位,而安防最重要的手段之一就是视频监控技术。近年来,有很多学者在行人属性识别领域进行研究,也取得了很大的进展,从最初的手工设计特征结合传统机器学习方法到现在的深度学习算法,行人属性识别技术水平也在不断提高。但是目前大多数的研究都是基于单张图片进行的,
2023年2月,“流浪气球”事件在海外社交平台广泛传播,引发双方外交互动及舆论交锋。推特成为双方舆论交锋的主要场合,中美主流媒体均在此发布大量观点性推文。作为政治意味较为浓厚的海外社交媒体,推特具有“西强我弱”与“众说纷纭”两个基本特点。基于对该事件的分析,中国媒体应重视在海外社交媒体发声,澄清事实真相;内容为王图文并茂,打破西方媒体母语优势;正视美国社会问题,避免敌对心态。未来,应从内容扩展和平
[研究目的]在以俄乌冲突为代表的网络舆论战中,各方力量在舆论场上为战争造势,使得舆论场势力混杂、信息来源复杂、水军搅局、舆论群体极化、情感和情绪色彩浓厚,是一场具有鲜明特色的社交媒体舆论战争。通过情感因素的研究,有助于分析社交媒体时代舆论战的新特征和新趋势。[研究方法]基于情感实践和媒介学的研究成果,结合对俄乌舆论战进行案例分析,研究情感对于社交媒体时代舆论战的影响。[研究结论]研究发现,在社交媒
统筹发展和安全的基本内涵是实现高质量发展和高水平安全的良性互动,以高质量发展促进国家安全体系和安全能力现代化,以高水平安全防范化解发展中的风险挑战,确保经济社会发展的健康推进。统筹发展和安全作为理论逻辑、历史逻辑与现实逻辑的辩证统一,开拓了马克思主义政治经济学新境界,根植于中国共产党的百年历史经验,是党治国理政的一个重大原则,也是新时代党和国家事业发展的战略部署之一。在以中国式现代化推进中华民族伟
推荐系统往往面临着数据稀疏和冷启动两个问题。为了缓解数据稀疏性和冷启动问题所带来的不良影响,本论文使用知识图谱来提供辅助信息,帮助推荐系统在数据稀疏和冷启动的情况下也能得到良好的推荐效果。知识图谱中的信息以图网络结构的方式相互联系,使用起来比较困难,为了更好地使用知识图谱中的有用信息,本论文尝试寻找有效的手段去充分利用知识图谱,从而辅助推荐系统更好地运行。总的来说,本论文的工作主要包括以下三方面内
近年来,基于声学信号的自动语音识别技术的识别效果已经有了很大提升,但是在一些复杂的实际应用场景中,其性能会有大幅下降,或根本无法使用,如在养老助残、高噪声、隐私保护、外太空等场景中。而本文所研究基于非声学信号的无声语音识别(Silent Speech Recognition,SSR)则没有相关限制,在众多领域都能有广泛的应用前景。本论文围绕基于面部表面肌电信号和唇部运动图像的无声语音识别方法及其融
近年来,深度强化学习在不同产业应用中取得了很大的成功,特别在游戏领域,通过深度强化学习算法训练的非人类玩家在各方面都有超过人类玩家的表现。在机器人运动控制的深度强化学习研究中,多机器人协同作业的深度强化学习研究是未来发展无人系统的核心内容。但目前多无人系统运动控制的深度强化学习研究面临状态和行为空间维数高、状态信息误差大以及样本量少的问题,为解决这些问题科学家提出了融合先验知识和虚实结合等策略的机