论文部分内容阅读
近年来,随着电子商务的发展,学术界对网上拍卖产生了强烈的兴趣,并有了很多的实证研究成果。大部分的研究将网上拍卖数据当成截面数据,关注最终价格,并忽略了一次拍卖中不断变化的竞价曲线动态特性的影响。本研究中从另一角度来探索网上竞拍品的价格,并提出将研究对象拓展为拍卖中的价格演变趋势及其动态特性。此外,设计了一个动态预测系统来预测正在进行拍卖的价格。本文提到的“动态”指该模型可预测一次拍卖的变化过程中的价格(而不仅是最终价格),并且可以基于新发生的信息进行不断更新。网上拍卖中的价格预测面临着巨大的挑战,因为网上竞拍数据有如下特点:1)它是纵向数据(时间序列数据)和截面数据(属性数据)的综合体;2)事件间分布不均匀,即数据的时间间隔不等;3)数据的动态特性时刻发生着变化,并不是以稳定的速度增长或减少;4)电子商务数据因其网络特性,往往能够得到大量自动生成的数据,需要进行大量的储存和计算,给机器造成很大负担。这些特征导致传统的预测方法不能适用于网上拍卖数据。本研究建立的动态预测模型是基于函数型数据分析的,可以很好的解决这些特征带来的问题。本研究的研究内容与主要结论包括:1)使用估计了一次拍卖的价格曲线的一次导数与二次导数,并将这些动态特性引入预测,结合其它拍卖相关信息建立了网上竞拍的动态预测模型,并使用孔夫子网上的竞拍数据进行了实证。结果发现本研究建立的模型很适合进行网上竞拍价格的预测,且预测效果明显优于传统预测模型(ARIMA)。在分析数据特征时本文也曾提到,进行网上拍卖的预测很不容易,传统方法不仅很难直接应用于网上竞拍数据,它们的预测效果也不佳;而本文的模型不仅预测精度较高,还可以进行实时价格预测。此外,因为借鉴了其他样本的总体规律,本研究的模型更适合于与整体样本特性相似的拍卖。2)使用函数型回归方法分析了拍卖中的各影响因素在拍卖全过程中对竞拍价格的影响变化。结果发现不同自变量的影响在整个拍卖过程中发生着变化。从影响强度看,大部分自变量对拍卖价格曲线的影响会随着拍卖的进行而逐渐减弱,如代理投标次数、竞标数、买家数量、买家平均信誉、跳跃出价、早期出价、拍卖区域、起拍价、卖家信誉、结束时间是否周末;只有最小加价幅度的影响会随着拍卖进行逐步增强。从影响方向来看,代理投标次数、买家数量、起拍价、加价幅度、卖家信誉、拍卖区域在珍品区对价格曲线有正向影响,买家平均信誉、跳跃出价、早期出价、结束时间为周末对价格曲线有负向影响;而竞标数对价格会有先负后正的影响。3)本文剥离了模型的动态部分,比较动态部分的引入对模型的预测效果的影响。结果发现动态特性的引入大大提升了预测效果。与传统研究不同,本文重点考虑了价格曲线动态特性的影响,对其进行估计并将其应用于最终的价格预测。通过对比研究发现,对同一预测模型,引入动态特性的预测效果要比不考虑动态特性的预测效果好的多。对于最终时刻价格,不考虑动态特性时的总体MAPE(15%)是引入时的总体MAPE(7%)的2倍。4)本文比较了不同拍卖区域相关参数的统计特征,结果发现不同拍卖区域对竞拍特性有着影响。首先,珍品区的拍卖品与大众区相比,在均值上,最高竞价、起拍价、最小加价幅度、买家数与竞标数都更高。珍品区的买家信誉也更高,但卖家信誉更低。这揭示了孔夫子网站与eBay的一个区别,孔夫子网上的物品价值并没有通行的市场标准,更需要买家根据经验估计,只有经验丰富的买家才会倾向于进行高价的珍品买卖,而新来买家会在大众区“捡漏”。然后,大众区的代理竞买次数更低,说明珍品区的买家更看重能否赢得拍卖,会更倾向于使用代理并设定较高的心理预期价格。最后,本文的数据表明珍品区买家更倾向使用早期投标策略,而低价值的拍品更容易发生跳跃投标。