论文部分内容阅读
【摘 要】分析了电子商务网站商家商品评价舆情信息分析处理的主要内容及面临的主要问题,并以淘宝服装类商品为例给出了一个商品评价舆情信息分析的解决和分析处理系统方案。
【关键词】评价舆情信息 分析处理系统 商品评价
随着电子商务网站的快速发展,越来越多的人通过电子商务网站来了解产品信息、购买商品,并且通过评价表达自己的购买商品过程中感受、对购买商品满意程度和对所购买商品的建议和要求。评价和打分是用户了解电子商务网站产品和商家服务的重要途径。电子商务网站商品评价舆情是买家了解商品和店家服务的一种重要渠道和表达方式。建立电子商务网站商品评价舆情分析系统,能够对电子商务网站商品评价的舆情信息根据自己关注程度进行合理分类,分析处理后进行汇总分析,了解和掌握产品和商家的产品的销售的相关信息。以便买家能够更好、更快地了选择和购买产品,也便于卖家能够及时准确了解产品问题和服务,同类竞争店家能够评价舆情分析更好改进产品和服务从而提高产品和服务竞争力。本文以淘宝网服装类产品为例进行评价舆情信息分析与实现。
一、电子商务网站商家商品评价舆情分析处理的主要内容及面临的主要问题
随着网络信息技术的不断发展和电子商务网站的日益普及广泛应用,买卖双方通过电商网站评价方式进行商品和服务的意见、交流,也成为人们发布、交换、获取商品信息的一个重要渠道,电商网站中各种买卖双方的评论言论活跃程度达到空前状态,销售前列产品更为突出。通过电商网站可以进行浏览产品功能、物流和服务,买卖上方互动聊天、网上购物、网上评论等,店家通过电商网站网络进行产品宣传、产品新闻,通过买卖双方打分,商家和买家评论来推广自己商品。随着产品销售日益增长,评论打分也越来越多,反映的问题方向越来越多,以互联网为平台,通过新闻、评论、发贴、回复等为载体表现出来的舆情就是网络舆情。产品评论平台的开放性和虚拟性的特点,使得评论舆情从产生到传播的整个过程往往非常迅速,一些情绪化的观点或是一些恶意的煽动,对买卖双方产生强大的巨大的评论舆论压力。影响产品销售和产品服务。如何利用各类信息处理技术深入分析研究电商网站舆分析,尤其是如何实现产品热点信息、敏感信息的主动发现,已经成为一项十分重要而又紧迫的课题。
(一)电子商务网站商家商品评价舆情分析研究与分析
就电子商务网站商家而言,不仅要关注买家评分还要监测用户评论网络舆情,更加贴切反映仅仅依靠传统的手工方法难以胜任信息的采集、处理、分析和判断工作,这就需要有强有力的舆情分析系统。目前为止,从定性管理角度对网络舆情所作研究已经很多了,但在定量研究电商方面的工作还比较少见,一般关心评分对评论缺乏关心,没有剖析评论数据背后的深层含义,帮助买卖双方做出正确决策和明确的预测因,更无法对商家进行调控和引导;买家给出判据。
(二)电子商务网站商家商品评价舆情面临的难题与挑战
1.评价信息的获取
互联网舆情分析系统的设计难点主要在于如何从海量互联网信息中及时有效地收集到舆情信息以及如何智能地处理这些采集回来的舆情信息电商网站架构的动态变化,使得评论舆情信息采集也要随着网站结构断变化,评论舆情的类型和表现形式不断增加。在网络舆情发现和分析过程中信息来源主要是网页,而网页信息的非结构化对于定位网页中的特定信息造成了一定的困难,当新的互联网技术和舆情数据源出现以后,需要持续地研发适应不同的电商网站出现新的技术,电商网站的动态商品评论监控和舆情分析数据采集只有不断采取新技术才能满足。
2.电商评价舆情信息的获取覆盖局限性
电商评价舆情信息来源具有唯一性。但通过不同电商网站相同产品评价舆情来获得广泛的评价信息,商品评价舆情系统对商家商品舆情信息获取来源单一则获取能力有限,而且也无法做到对商家及其产品的舆情的覆盖全部。数据标本的有限的时候,舆情分析的结果会存在一定的误差是必然的。因此通过不同渠道获得大数据量的评价舆情分析尤为重要。根据需要一般包括用户关心热点话题及其敏感话题、主题跟踪、买卖双方倾向性分析、产品销售趋势分析和销售服务预警以及各类统计报告。
3.分析处理的电子商务网站商家商品评价舆情的价值变化不定
买家通过打分和评论表达自己的对商品买卖过程对产品和商家观点和态度。分析他们的观点和态度,就可以得到商品评价舆情。买家访问电商网站的方式处在动态变化,其关心产品和商家服务的哪些方面的也是根据产品不同而动态变化的。从而固定电商网站所包含的评价网舆情价值具有较大的动态性和变化性,某些方面具有离散性。现在的热门电商网站中商家,在未来可能因为某些热点事件、销售政策、服务策略和经营理念的改变,最重要是通过服务质量来影响到商品所包含的评价舆情信息的数量和价值。
4.电子商务网站商家商品评价舆情对海量信息的关心点不能动态实时反映
电子商务网站商家商品评价舆情的类型和格式不仅多种多样,不同商家评价数量巨大。如果要得到准确详细的舆情信息,必须对这些不同商家海量评价信息具有较高的即时获取和实时分析处理能力。为得到评价舆情分析平台的实际有效利用价值必须加大对海量信息的实时分析和关心点实时处理能力。
二、电子商务网站商家商品评价舆情信息分析系统的解决方案及实现
本文以淘宝服装类产品为例给出一个电子商务网站商家商品评价舆情信息分析系统的解决方案,并给演示实现结果。
(一)总体结构
电子商务网站商家商品评价舆情信息分析系统分为 三个部分。分别是采集模块、系统分析处理模块(使用ICTCLAS算法分词,分析处理模块、主题词管理),系统统计分析模块。
电子商务网站商家商品评价舆情信息分析系统能够及时获取淘宝某商品关注的评论信息,能够实现对评论的信息进行精确采集和分词,能够对不同店、相同产品淘宝客户信息进行自动化和人机交互方式相结合的分析处理。 电子商务网站商家商品评价舆情分析系统对评论信息按不同主题进行分类和聚类处理,对舆情内容依据主题词建立科学的有效分类。通过主题词检测分析当前的舆情态势,最终形成评论舆情分析报告。通过舆情分析报告商家和买家可全面掌握评论舆情动态及其分析依据。
(二)系统的采集模块
通过淘宝评论网页进行分析,对指定淘宝网店的对评论信息进行自动抓取。
评论舆情分析系统的Web信息自动化采集和提取,是评论舆情分析处理系统的基础。系统能够比较准确地提取出Web信息的评论时间,包括提取评论信息等,并将提出的Web数据实现自动转换,转存储为具有结构化、可操作和分析的数据库数据。核心代码如下:
string rateJson = Encoding.Default.GetString(wc.DownloadData(rateUrl));//读取html
rateJson = rateJson.Replace(“\r”, “”).Replace(“\n”, “”).Replace(“TB.detailRate = “, “”);//去除非JSON格式字符
JObject jobject = JObject.Parse(rateJson);//转化为json
if (lastPage == 1)
{
lastPage = int.Parse(jobject[“rateListInfo”][“paginator”][“lastPage”].ToString());//获取总页数
this.items = jobject[“rateListInfo”][“paginator”][“items”].ToString();
}
JArray mName = (JArray)jobject[“rateListInfo”][“rateList”];
for (int i = 0; i < mName.Count; i++)
{
JObject tmpObj = (JObject)mName[i];
string rateContent = (string)tmpObj[“rateContent”];
//记录到datatable
DataRow newRow = dataTable.NewRow();
newRow[0] = (string)tmpObj[“rateDate”];
newRow[1] = (string)tmpObj[“rateContent”];
newRow[2] = “等待分词";
dataTable.Rows.Add(newRow);
dataTable.AcceptChanges();
}
(三)系统分析处理模块
采集到的评论数据由系统根据主题词依据ICTCLAS算法分词,按照一定格式把数据存入系统全文数据库中,形成舆情内容。
通过主题词管理,对于正面评价和负面评价使用的词进行管理,通过聚类和分类的技术进行深入分析,生成电商店家的评论舆情分析报告。
通过的电子商务网站文本信息内容进行自动分类和聚类等技术,是电子商务网站评论网舆情分析处理模块必备的技术手段。
通过挖掘电子商务网站的评论数据的过程中进行自动聚类,把已存在的相同产品不同商家评价网页的相似内容,通过语义分析,把关联和相近的内容进行自动分析。通过建立语义模型,把完成采集评价的相同内容,不断地进行聚类。自动发现不同的店家的不同的评价,买家关注的相关信息,把这些聚类内容进行排序和展现出来,形成买家关注的买产品相关的内容和店家卖产品关注的内容。
(四)系统分析显示模块
通过评论分析处理模块有关的主题检测、把完成分析后的评分结果转给进行显示。分析现显示模块,按照预先设定的主题对这些舆情内容,按照关注的类别进行分类显示打分。用户根据打分结果进行决策,可以把这些评论舆情评分内容转换为数字指标或文字报告,为店家对产品评论结果动态舆情变化和波动情况。也通过系统固定文档格式的生成简报、舆情分析报告、舆情分析图表,把产品舆情的分析处理最终结果呈现给用户。把用户对产品和商家评价舆情的对购买产品过程中对关注程度的变化规律,展现给用户,帮助用户分析判断当前的舆情形势,为客户掌握产品舆情及用户关心的特点和对产品看法和买卖过程思想动态,提供分析依据。
三、总结
总之,电商舆情分析处理系统只要覆盖一定数量店家产品评论的信息,可以及时获取相关产品买卖的相关定量信息,能够帮助买卖双方决策:买方选择店家,卖方提供更好地产品和优质服务,通过评价信息精确采集和综合分析,对多店家、各类电商网站相同产品店家评论信息进行自动化和人机交互方式相结合的分析处理后,可以为用户提供更为精确的依据,因此电子商务网站商家商品评价舆情信息分析系统下一步是把提取更多电子商务网站,建立评价体系,最终获得所需的决策。
参考文献:
[1]杜阿宁互联网舆情信息挖掘方法研究[学位论文],计算机科学与技术学院,哈尔滨工业大学,2007
[2]李敏互联网舆情监控系统设计与实现[学位论文],软件学院,复旦大学,2009
[3]冯希莹试论当前我国舆情研究的主要特色理论与现代化2010年第3期2010.3
[4]北大方正技术研究院方正智思舆情预警辅助决策支持解决方案http//www.founderrd.eom/2005-04/22/content_276.htm 2005.4
[5]李敏互联网舆情监控系统设计与实现[学位论文],软件学院,复旦大学,2009
[6]许鑫,章成志互联网舆情分析及应用研究情报科学第26卷第8期2008年8月
[7]Q.Guan System,S.Ye etc. Research and Design of Internet Public Opinion Analysis 2009 IITA Internation Conference on Services Science Management and Engineering P173-177
【关键词】评价舆情信息 分析处理系统 商品评价
随着电子商务网站的快速发展,越来越多的人通过电子商务网站来了解产品信息、购买商品,并且通过评价表达自己的购买商品过程中感受、对购买商品满意程度和对所购买商品的建议和要求。评价和打分是用户了解电子商务网站产品和商家服务的重要途径。电子商务网站商品评价舆情是买家了解商品和店家服务的一种重要渠道和表达方式。建立电子商务网站商品评价舆情分析系统,能够对电子商务网站商品评价的舆情信息根据自己关注程度进行合理分类,分析处理后进行汇总分析,了解和掌握产品和商家的产品的销售的相关信息。以便买家能够更好、更快地了选择和购买产品,也便于卖家能够及时准确了解产品问题和服务,同类竞争店家能够评价舆情分析更好改进产品和服务从而提高产品和服务竞争力。本文以淘宝网服装类产品为例进行评价舆情信息分析与实现。
一、电子商务网站商家商品评价舆情分析处理的主要内容及面临的主要问题
随着网络信息技术的不断发展和电子商务网站的日益普及广泛应用,买卖双方通过电商网站评价方式进行商品和服务的意见、交流,也成为人们发布、交换、获取商品信息的一个重要渠道,电商网站中各种买卖双方的评论言论活跃程度达到空前状态,销售前列产品更为突出。通过电商网站可以进行浏览产品功能、物流和服务,买卖上方互动聊天、网上购物、网上评论等,店家通过电商网站网络进行产品宣传、产品新闻,通过买卖双方打分,商家和买家评论来推广自己商品。随着产品销售日益增长,评论打分也越来越多,反映的问题方向越来越多,以互联网为平台,通过新闻、评论、发贴、回复等为载体表现出来的舆情就是网络舆情。产品评论平台的开放性和虚拟性的特点,使得评论舆情从产生到传播的整个过程往往非常迅速,一些情绪化的观点或是一些恶意的煽动,对买卖双方产生强大的巨大的评论舆论压力。影响产品销售和产品服务。如何利用各类信息处理技术深入分析研究电商网站舆分析,尤其是如何实现产品热点信息、敏感信息的主动发现,已经成为一项十分重要而又紧迫的课题。
(一)电子商务网站商家商品评价舆情分析研究与分析
就电子商务网站商家而言,不仅要关注买家评分还要监测用户评论网络舆情,更加贴切反映仅仅依靠传统的手工方法难以胜任信息的采集、处理、分析和判断工作,这就需要有强有力的舆情分析系统。目前为止,从定性管理角度对网络舆情所作研究已经很多了,但在定量研究电商方面的工作还比较少见,一般关心评分对评论缺乏关心,没有剖析评论数据背后的深层含义,帮助买卖双方做出正确决策和明确的预测因,更无法对商家进行调控和引导;买家给出判据。
(二)电子商务网站商家商品评价舆情面临的难题与挑战
1.评价信息的获取
互联网舆情分析系统的设计难点主要在于如何从海量互联网信息中及时有效地收集到舆情信息以及如何智能地处理这些采集回来的舆情信息电商网站架构的动态变化,使得评论舆情信息采集也要随着网站结构断变化,评论舆情的类型和表现形式不断增加。在网络舆情发现和分析过程中信息来源主要是网页,而网页信息的非结构化对于定位网页中的特定信息造成了一定的困难,当新的互联网技术和舆情数据源出现以后,需要持续地研发适应不同的电商网站出现新的技术,电商网站的动态商品评论监控和舆情分析数据采集只有不断采取新技术才能满足。
2.电商评价舆情信息的获取覆盖局限性
电商评价舆情信息来源具有唯一性。但通过不同电商网站相同产品评价舆情来获得广泛的评价信息,商品评价舆情系统对商家商品舆情信息获取来源单一则获取能力有限,而且也无法做到对商家及其产品的舆情的覆盖全部。数据标本的有限的时候,舆情分析的结果会存在一定的误差是必然的。因此通过不同渠道获得大数据量的评价舆情分析尤为重要。根据需要一般包括用户关心热点话题及其敏感话题、主题跟踪、买卖双方倾向性分析、产品销售趋势分析和销售服务预警以及各类统计报告。
3.分析处理的电子商务网站商家商品评价舆情的价值变化不定
买家通过打分和评论表达自己的对商品买卖过程对产品和商家观点和态度。分析他们的观点和态度,就可以得到商品评价舆情。买家访问电商网站的方式处在动态变化,其关心产品和商家服务的哪些方面的也是根据产品不同而动态变化的。从而固定电商网站所包含的评价网舆情价值具有较大的动态性和变化性,某些方面具有离散性。现在的热门电商网站中商家,在未来可能因为某些热点事件、销售政策、服务策略和经营理念的改变,最重要是通过服务质量来影响到商品所包含的评价舆情信息的数量和价值。
4.电子商务网站商家商品评价舆情对海量信息的关心点不能动态实时反映
电子商务网站商家商品评价舆情的类型和格式不仅多种多样,不同商家评价数量巨大。如果要得到准确详细的舆情信息,必须对这些不同商家海量评价信息具有较高的即时获取和实时分析处理能力。为得到评价舆情分析平台的实际有效利用价值必须加大对海量信息的实时分析和关心点实时处理能力。
二、电子商务网站商家商品评价舆情信息分析系统的解决方案及实现
本文以淘宝服装类产品为例给出一个电子商务网站商家商品评价舆情信息分析系统的解决方案,并给演示实现结果。
(一)总体结构
电子商务网站商家商品评价舆情信息分析系统分为 三个部分。分别是采集模块、系统分析处理模块(使用ICTCLAS算法分词,分析处理模块、主题词管理),系统统计分析模块。
电子商务网站商家商品评价舆情信息分析系统能够及时获取淘宝某商品关注的评论信息,能够实现对评论的信息进行精确采集和分词,能够对不同店、相同产品淘宝客户信息进行自动化和人机交互方式相结合的分析处理。 电子商务网站商家商品评价舆情分析系统对评论信息按不同主题进行分类和聚类处理,对舆情内容依据主题词建立科学的有效分类。通过主题词检测分析当前的舆情态势,最终形成评论舆情分析报告。通过舆情分析报告商家和买家可全面掌握评论舆情动态及其分析依据。
(二)系统的采集模块
通过淘宝评论网页进行分析,对指定淘宝网店的对评论信息进行自动抓取。
评论舆情分析系统的Web信息自动化采集和提取,是评论舆情分析处理系统的基础。系统能够比较准确地提取出Web信息的评论时间,包括提取评论信息等,并将提出的Web数据实现自动转换,转存储为具有结构化、可操作和分析的数据库数据。核心代码如下:
string rateJson = Encoding.Default.GetString(wc.DownloadData(rateUrl));//读取html
rateJson = rateJson.Replace(“\r”, “”).Replace(“\n”, “”).Replace(“TB.detailRate = “, “”);//去除非JSON格式字符
JObject jobject = JObject.Parse(rateJson);//转化为json
if (lastPage == 1)
{
lastPage = int.Parse(jobject[“rateListInfo”][“paginator”][“lastPage”].ToString());//获取总页数
this.items = jobject[“rateListInfo”][“paginator”][“items”].ToString();
}
JArray mName = (JArray)jobject[“rateListInfo”][“rateList”];
for (int i = 0; i < mName.Count; i++)
{
JObject tmpObj = (JObject)mName[i];
string rateContent = (string)tmpObj[“rateContent”];
//记录到datatable
DataRow newRow = dataTable.NewRow();
newRow[0] = (string)tmpObj[“rateDate”];
newRow[1] = (string)tmpObj[“rateContent”];
newRow[2] = “等待分词";
dataTable.Rows.Add(newRow);
dataTable.AcceptChanges();
}
(三)系统分析处理模块
采集到的评论数据由系统根据主题词依据ICTCLAS算法分词,按照一定格式把数据存入系统全文数据库中,形成舆情内容。
通过主题词管理,对于正面评价和负面评价使用的词进行管理,通过聚类和分类的技术进行深入分析,生成电商店家的评论舆情分析报告。
通过的电子商务网站文本信息内容进行自动分类和聚类等技术,是电子商务网站评论网舆情分析处理模块必备的技术手段。
通过挖掘电子商务网站的评论数据的过程中进行自动聚类,把已存在的相同产品不同商家评价网页的相似内容,通过语义分析,把关联和相近的内容进行自动分析。通过建立语义模型,把完成采集评价的相同内容,不断地进行聚类。自动发现不同的店家的不同的评价,买家关注的相关信息,把这些聚类内容进行排序和展现出来,形成买家关注的买产品相关的内容和店家卖产品关注的内容。
(四)系统分析显示模块
通过评论分析处理模块有关的主题检测、把完成分析后的评分结果转给进行显示。分析现显示模块,按照预先设定的主题对这些舆情内容,按照关注的类别进行分类显示打分。用户根据打分结果进行决策,可以把这些评论舆情评分内容转换为数字指标或文字报告,为店家对产品评论结果动态舆情变化和波动情况。也通过系统固定文档格式的生成简报、舆情分析报告、舆情分析图表,把产品舆情的分析处理最终结果呈现给用户。把用户对产品和商家评价舆情的对购买产品过程中对关注程度的变化规律,展现给用户,帮助用户分析判断当前的舆情形势,为客户掌握产品舆情及用户关心的特点和对产品看法和买卖过程思想动态,提供分析依据。
三、总结
总之,电商舆情分析处理系统只要覆盖一定数量店家产品评论的信息,可以及时获取相关产品买卖的相关定量信息,能够帮助买卖双方决策:买方选择店家,卖方提供更好地产品和优质服务,通过评价信息精确采集和综合分析,对多店家、各类电商网站相同产品店家评论信息进行自动化和人机交互方式相结合的分析处理后,可以为用户提供更为精确的依据,因此电子商务网站商家商品评价舆情信息分析系统下一步是把提取更多电子商务网站,建立评价体系,最终获得所需的决策。
参考文献:
[1]杜阿宁互联网舆情信息挖掘方法研究[学位论文],计算机科学与技术学院,哈尔滨工业大学,2007
[2]李敏互联网舆情监控系统设计与实现[学位论文],软件学院,复旦大学,2009
[3]冯希莹试论当前我国舆情研究的主要特色理论与现代化2010年第3期2010.3
[4]北大方正技术研究院方正智思舆情预警辅助决策支持解决方案http//www.founderrd.eom/2005-04/22/content_276.htm 2005.4
[5]李敏互联网舆情监控系统设计与实现[学位论文],软件学院,复旦大学,2009
[6]许鑫,章成志互联网舆情分析及应用研究情报科学第26卷第8期2008年8月
[7]Q.Guan System,S.Ye etc. Research and Design of Internet Public Opinion Analysis 2009 IITA Internation Conference on Services Science Management and Engineering P173-177