论文部分内容阅读
电子商务已经成为国民经济和社会信息化非常重要的一部分,与此同时网络评论为网购市场的分析创造了丰富的资源,为买家购买产品时浏览质量评价,商家和供应商挖掘评论、收集市场需求、分析用户需求和潜在客户等情形,均提供了重要的分析依据。在此背景之下,本文主要研究内容如下。本文对非参数化的狄利克雷过程及多项分布混合模型(DPMM)进行深入研究,DPMM最突出的优点在于不需要预先指定聚类个数。在此研究基础上,提出了GSDPMMR模型。GSDPMMR模型不单单对评论文本进行聚类研究,还融合了评论数据集的同质数据:评论