论文部分内容阅读
利用回归树算法作为一种函数近似方法,发挥回归树在进行数值预测上的准确性及快速性,将Q学习和回归树算法组合在一起,改善单纯Q学习所需要的培训时间过长的缺点.详细分析了实际市场模型中使用基于回归树的Q学习算法来确定商品销售价格的策略.最后利用数值分析方法来说明此算法在实际应用中所获得的平均利润和培训时间两个参数的关系,并给出它们的关系曲线图.