网络广告中违规描述的智能识别研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:yxzxyzxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网时代,网络广告已然成为了极具有价值的广告媒体之一。对海量的互联网广告信息进行识别是大数据分析中十分重要的内容。然而,网络广告在迅猛发展的同时,由于广告监管和广告从业人员素质等问题,使大量的网络违规广告层出不穷、屡禁不止。因此,对互联网广告进行有效的监管有着重要的现实意义。为了更加智能化的对网络广告中违规描述进行识别,论文从网络广告中两类常见的违规情况出发,提出了两种算法,它们能够对网络广告内容中违规描述进行自动识别。本文的主要工作如下:1.对网络广告中可能存在的违规词语进行识别。针对网络广告数量巨大,难以采用人工方式逐条监管与审查的问题,提出了一种基于违规词库识别广告违规词语的方案。首先依据新修订的《广告法》提取违规种子词汇,再利用同义词扩充种子词汇和语义相似度过滤扩充词汇,得到网络广告违规词库。然后,基于自然语言的规则,在字符串匹配的基础上,结合上下文语义信息识别网络广告中的违规词。实验的结果表明,本方法能有效的识别网络广告中的违规词,可以有效辅助网络广告的监管,具有很好的应用潜力。2.对网络广告中可能存在的违规描述语句进行识别。针对网络广告文本较短以及语义缺失等问题,提出利用Google开发的深度学习工具Word2vec和长短时记忆神经网络模型LSTM的识别方法。首先考虑到传统文本表示方法易造成数据表示稀疏及维度灾难问题,采用Word2vec对网络广告进行包含语义的词向量、句向量表示。然后对于向量化后的文本,采用专门处理序列化数据的长短时记忆神经网络LSTM模型进行网络广告违规语句判定。最后,实验结果表明,本方法能够有效识别网络广告违规语句,特别是对违规广告语句中字形相似、词语语义相似的违规类型识别准确率高。本文提出的两个方法能有效地识别网络广告中的违规词和含违规描述的违规语句,为智能识别网络广告中的违规内容奠定良好的基础,可以在一定程度上减轻执法人员的工作负担,对构造一个值得消费者信任的网络广告市场环境有积极的意义。
其他文献
<正>2018年,笔者有幸参与了"第三届全国学校体育优秀教育教学案例评比"评委工作。在案例评比过程中,最终被评为特等奖的案例《"小鸡"真的能反抓"老鹰"吗?》深深地吸引了我。
高中生美术学科核心素养的培养作为提升课程教学质量的关键点,以当前高中美术课程教学工作开展情况为基础,结合近年来高中美术课程教学经验,以人教版高中美术教材为例,对高中
我国的经济发展由过去的高速转变为中高速的新局面,同时也引发国家经济结构不断朝着更为合理的方向发展。在现阶段企业不仅需要面对国家经济发展的变化,同时也需要时刻关注企业
超声导波检测技术因其检测速度快、检测范围广等优点,成为近年来长距离管线无损检测领域的重要技术。然而,由于导波在传播过程中受到衰减、噪声等影响,使得缺陷信号表现为强噪声
<正>10月24日,港珠澳大桥正式通车运营,为粤港澳大湾区9+2城市群送来"红利",粤港澳大湾区板块及房地产股价纷纷飘红。相关数据显示:10月24日当日收盘,碧桂园股价涨幅1%,招商
目的:观察不同血浆靶浓度舒芬太尼对普外科腹腔镜手术气腹刺激时七氟烷MACBAR(抑制50%患者交感肾上腺素能反应的肺泡气内麻醉药浓度)的影响。方法:选择ASAⅠ-Ⅱ级,年龄18-65岁,
针对土家族摆手舞在高校舞蹈教学中的有效融合,本文首先提出了对摆手舞的相关精髓进行提取,保留原生态的动作,其后结合实践教学目标科学合理设置教学大纲,对摆手舞进行课程的
牙槽突裂整复术现已成为唇腭裂序列治疗的重要环节,上颌骨裂隙骨移植在20世纪初就已提出,但至今,对牙槽突裂的治疗方法仍存在许多争议,本文就牙槽突裂整复术的手术时机、植入
铟、锡氧化物(Indium Tin Oxides)是当今电子信息产业不可缺少和替代的关键材料,由它制成的ITO靶材通过高技术手段能在玻璃、陶瓷、塑料或金属等表面形成具有导电、滤波和耐
复杂网络是本世纪几项重要的基础研究之一。重叠社团结构特性是大部分复杂网络中的重要性质。目前已有若干发现复杂网络中重叠社团结构的方法。本文尝试从博弈论角度对此问题