从表1中可以看到,支持向量机在预测期分类的预测准确率达到64.98%,大于贝叶斯判别的分类准确率45.23%,体现了其在分类上的先进性。 我们再将所有的调研数据按区域(地级市为单位)划分,得到的分类如图2所示,将两种方法得出结果分别求算术平均值,结果如表2所示。 从图2和表2,我们可以看到,在按城市区分之后,SVM的分类准确率有一个提升,平均分类准确率达到了77%,远远高于贝叶斯判别的准确率45%。进行城市区分之后分类准确率更高,这个一方面更加确保支持向量机在分类上的一个有效性;另一方面也说明,不同城市的烟民在购买卷烟的行为也有着不同模式。 5 总结与展望 本文的研究,希望利用支持向量机模型在分类上的天然优势,可以将不同的行为模式区分开来。由于消费者行为的产生取决于多方面不同的因素,而消费者对品牌的敏感性一直是学术研究中的一个重点与难点。 本文利用并行计算,二叉树多类分类方法提高支持向量机的运行效率。从研究的结果来看,运用该方法的广东省内的分类准确率明显的优于贝叶斯判别的分类。这说明支持向量机模型在烟草消费行为分析中有一定的有效性。另外,将不同城市区分开后单独用支持向量机进行消费者行为分析,更加进一步的确定了支持向量机的分类确实比其他分类更有优势。当然,本研究在以下几个方面仍需要更深度的挖掘: ①如何有效地将两类问题的解决办法推广至多类问题,一直是支持向量机研究的一个重要方向。在未来的研究中,需要一种能直接多类的模型,以防止二分类时出现不可分现象是十分必要的。 ②消费者偏好与测量方法是比较复杂的。本文的由于消费者行为影响因素很难量化,如何将定性化与定量化的指标结合,共同利用支持向量机方法进行数据挖掘,也是下一步需要研究的方向。 参考文献: [1]范秋英,方醒.基于层次分析法的网上消费者行为分析[J]. 物流工程与管理,2013,01:121-122. [2]郭磊,陈进,朱义,肖文斌.小波支持向量机在滚动轴承故障诊断中的应用[J].上海交通大学学报,2009,04:678-682. [3]汪海燕,黎建辉,杨风雷,等.支持向量机理论及算法研究综述[J].计算机应用研究,2014,31(5). [4]王孟磊.基于模糊聚类-ABC控制法的百货企业市场细分研究[J].价值工程,2014,16:198-199. [5]B. Baesens, S. Viaene, D. Van den Poel, J. Vanthienen, G. Dedene, Bayesian neural network learning for repeat purchase modeling in direct marketing[M]. European Journal of Operational Research, 2002(138):191-211. [6]G. Cui, M.L. Wong, H.-K. Lui, Machine learning for direct marketing response models: Bayesian networks with evolutionary programming[J]. Management Science, 2006(52):597-612. [7]L. Cao. In-depth behavior understanding and use: the behavior informaticsapproach[J]. Information Sciences, 2010(180):3067-3085. |