基于机器学习理论的电商用户行为研究

来源 :北京物资学院 | 被引量 : 2次 | 上传用户:lovinglixia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网科技的快速发展,网络与人们的生活息息相关,从日益增长的网民人数到迅速发展起来的快递行业,无不显示出网络带给人们的便利。在如今几乎大家都在进行网络购物的情况下,对于电商平台来说是一个机遇,也是一大挑战。在日益激烈的电商竞争环境中,谁能更好的留住用户,更好的吸引新的用户,是电商平台发展的关键。在如今网络技术,人工智能迅速发展的背景下,说到底,电商平台的竞争是技术的竞争,谁能运用先进的技术让自己的平台更智能化,更便捷化,推荐更精准化等,谁就能在电商领域拥有一席之地。对于电商用户的研究归根到底是对用户行为数据的研究,在海量的用户行为数据中,怎样挖掘出用户的潜在价值信息,探索用户的需求和行为规律等,是用户行为研究的关键。现如今,用户行为研究已经成为国内外研究的热点,而人工智能中机器学习在电商领域的应用更是锦上添花。本文针对电商用户下单问题进行研究,用人工智能中的机器学习算法对用户行为特征进行建模,预测,并结合生态群体智能算法中的经典的蚁群算法对机器学习算法中的xgboost算法进行优化,并在模型框架中用学习法来进行模型的融合,最后和其他机器学习算法:逻辑回归(LR),支持向量机(SVM),基于决策树算法的随机森林算法(RF)和xgboost算法进行对比,得出优化后的xgboost算法在电商用户行为预测研究中的效果较好,预测准确率在85%以上。本文在进行模型框架之前,先对获得的B2C电商网站的用户行为数据进行探索性的数据分析用户在凌晨的交互行为较高,而这些用户大部分都是26-35岁的中青年人,用户下单用户行为购买率随着时间的进行而下降等;再根据分析结果进行特征工程的构建,对特征进行预处理,选择出符合课题研究的特征;并在进行特征处理时根据用户的行为随时间的变化加入IDF值,从而使优势特征更加易于获得。以时间为维度对训练集进行划分,根据时间的变化趋势,采用时间窗口滑动来对特征进行训练和测试,以5天为周期进行训练和测试,通过不断的移动窗口使训练集数据增多,并根据每次滑动的结果,对参数权重进行调整,从而使预测准确率提高。实验表明,这样的方法结合优化的XGBoost算法,效果有了较大的提高。
其他文献
随着经济全球化的发展,港口竞争也由过去国内竞争逐渐转变为国际范围内的竞争。环渤海地区港口腹地广阔,港口基础建设较好,但是与发达国家港口相比仍然存在较大差距。因此,环
文章主要对经济增长与环境和社会健康成本进行探究。具体是在解析经济增长与环境关系、经济增长与社会健康关系的基础上,对经济增长与环境、社会健康成本进行分析,最后针对其
《太平御览》引用了《神农本草经》大量佚文,孙辑本《神农本草经》可谓运用《御览》辑佚《本经》的范例。孙氏将《御览》作为重要材料,对底本文字进行了详细的考校,在《本经
为了开展井灌区灌溉用水利用效率测算分析与评估工作,摸清井灌区现状条件下的灌溉水利用状况,本文在通辽市选择不同灌溉方式进行灌溉水利用效率测试,分析评估样点灌区、灌区