基于特定示例检测的多示例学习及其在虚拟商品推荐中的应用

来源 :南京大学 | 被引量 : 0次 | 上传用户:cultra
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在传统的监督学习研究中,学习对象与标记是一一对应的关系。然而对于现实世界中具有复杂语义的对象来说,其标记往往是弱的或者有歧义的。多示例学习是用来解决这一问题的框架。在多示例学习中,训练集由多个具有概念标记的包组成,每个包由一组示例来表达,而示例并没有对应的明确标记。多示例学习能反映现实任务的复杂性,已被广泛应用在药物分子活性检测、自然场景分类、文本分类和目标检测等领域。以往的多示例学习研究主要关注于区分包的标记而非直接检测包中关键示例,缺乏高效的正示例检测算法。然而在众多的多示例学习技术应用中,什么样的示例触发了相应的标记始终是一个值得关注的问题。例如,游戏道具推荐中,玩家的何种游戏行为触发了道具购买是运营商的关注的重点。本文结合目前存在的一些问题,对多示例学习进行了深入研究,从特定示例检测的角度做了如下工作:1.提出基于近邻重构的正示例检测算法。从多示例学习中经典的多样性密度算法出发,在负示例共享相同性质的假设下,利用负包的近邻负示例重构正包的负示例,通过排除法检测出正包中的正示例。在正示例检测框架下提出两种近邻重构方法,将多示例学习问题转化为简单的二分类问题,然后使用支持向量机算法来求解。通过在药物分子检测、文档分类和图像分类等不同任务上进行实验,验证了算法具有较好的性能和运行效率。2.将多示例学习应用到大规模虚拟商品推荐中。揭示了互联网虚拟商品推荐这一应用和多示例学习假设的特殊联系,即游戏道具推荐包含的复杂上下文相关性、长距离干涉和角色道具优先等问题。使用一种基于标记排序和特定示例侦测的快速多示例多标记学习方法对游戏道具个性化推荐系统进行建模。基于Spark分布式平台实现大规模推荐系统,在真实的游戏道具购买数据上进行实验,结果表明算法能够高效地处理千万级别的样本,且取得优于传统协同过滤算法的效果。
其他文献
当前,全球化不断深入、科学技术加速升级,在不断加剧的市场竞争下,企业想要生存和发展,必须不断提高科技创新能力,借助行业垄断性技术,筑牢扎实的实力根基,占据极具优势的战
全息思维是按照宇宙大统一定律所揭示的信息泛对应性,着力寻求并应用系统包含着的母系统的显信息和潜信息,努力激发整体相关性的思维功能效应。本文以全息思维与竞技健美操操
【正】 党的十一届三中全会以来,党中央反复强调,在实行改革开放、发展商品经济的新形势下,党和国家机关一定要保持廉洁。经济越是繁荣,商品经济越是活跃,共产党员在坚持廉洁
谈谈发挥思想政治工作在教学改革中的保证服务作用饶盛椿民航飞行学院是专为民航培养飞行员、航行管制员等高层次专业人才的学府。近几年来,为了适应民航事业快速发展的需要,进
【正】 陈独秀毕生以思想启蒙为己任(政治革命、学术研究均为实现民主和科学的手段),披荆斩棘,勇往直前,开创了中国文化和中国革命的新时期。其强大的思想武器尽管来自欧洲,
【正】 依据我国经济发展的长期战略目标与生产力布局的总体构想,为寻求我国东、中、西三大经济区域的长期持续、稳定、协调发展,探索中部六省(包括山西、河南、湖北、湖南、
【正】 江泽民同志在党的十四大报告中指出:“在新的历史时期,党所处的环境和肩负的任务有了很大的变化,党的思想、政治、组织、作风建设都面临许多新情况和新问题。我们一定
阳离子聚合物具有稳定性强、无免疫原性和结构可精细控制的特点,在基因输送领域被广泛地应用。但是阳离子聚合物输送系统,因缺乏对肿瘤细胞的特异性识别,且转染效率低使其在