摘要: “大数据”时代的来临,企业更加重视通过数据分析来洞察消费者行为,以实现更为精准的营销模式。现有对消费者行为的分类方法主要有层次分析法,聚类,贝叶斯网络等。文章引入支持向量机的方法应用在消费行为分析中,它是在统计学理论基础上发展起来的一种新的模式识别方法,在解决有限样本,非线性及高维模式识别问题中表现出许多特有的优势。最后,文章利用广东省烟草公司的实际调研数据进行支持向量机的训练。文章发现,相比于传统的消费者行为分类方法,支持向量机用于消费者行为分析是一种更精确有效的分类方法。 Abstract: This paper intensively studies the consumer behavior based on the "big data" era for the purpose of precision marketing. Nowadays, after reviewing the numerous literatures, the paper finds several approaches such as AHP algorithm, cluster analysis, Bayesian discrimination algorithm to solve these problems. However, this paper tries to use a new method named Support Vector Machine(SVM), which is a new pattern identification approach, to solve the complicated non-linear cases. Eventually, it uses Guangdong Tobacco case to certify the SVM algorithm, which is more accurate and feasible in this type than traditional consumer behavior analysis approaches such as the Bayesian discrimination algorithm. 关键词: 支持向量机;贝叶斯判别;分类;消费者行为分析 Key words: Support Vector Machine;Bayesian discrimination algorithm;classification;consumer behavior analysis 中图分类号:F253.9 文献标识码:A 文章编号:1006-4311(2015)04-0019-03 0 引言 消费者行为学在20世纪60年代中后期是一个相对较新的领域。随着“大数据”时代的到来,越来越多的学者意识到通过沉淀数据进行消费者行为分析的重要性。目前来讲,用于客户消费行为分析的主要方法有:层次分析法,聚类,贝叶斯网络等。 本次研究通过广东烟草的实地调研数据,利用支持向量机方法,区分低档品牌的购买群体行为模式、普通品牌的购买群体行为模式、高档品牌的购买群体行为模式。在研究过程中,首先是计算商品的价格分布,判断区分低档、普通、高档品牌,再利用二叉树多类分类方法与并行计算方法帮助提高支持向量机运算精度,利用Matlab构建一个平台进行支持向量机的训练与预测,并将该方法与贝叶斯判别的分类效果进行比较,判断支持向量机的分类精度。 1 基于支持向量机的烟草消费行为分类模型 支持向量机(SVM)是Cortes等人于1995年提出的,它在解决小样本、非线性以及高维模式识别中表现出许多特有的优势,并能推广应用到函数拟合等其它机器学习问题中。多分类支持向量机是众多算法中的一种。多分类支持向量机是将SVM从两分类算法推广到多分类的算法。常用的算法有一对多,一对一,二叉树,有向无环图四种。 1.1 模型设计 由于将烟草客户分类为:普通品消费者、低档品消费者、高档品消费者三类,所以选择合适的多类分类方法能有效地提高支持向量机。支持向量机的多分类问题往往由几个两分类问题来解决。商品品牌的分类结构示意如图1所示。 所以本论文选取一对一的多类分类方法结合二叉树分类来解决烟草消费者行为分析的分类问题,根据投票确定最后的分类结果。操作流程为:①收集到某个消费者的相关信息;②利用低档与非低档的支持向量机作为第一层SVM进行分类;③若分类结果为低档,则其低档的分类结构投一票;④若分类结果为非低档,利用普通与高档支持向量机继续为其分类,得到的普通或高档结果投一票;⑤将高档与非高档,普通与非普通作为第一层SVM重复②-④步骤;⑥根据最终投票结果,确定这个消费者的分类归属。 本次烟草消费者行为研究的数据规模较大,所以在这种大规模数据的条件下,必须采取有效的数据策略加快运算速度。所以在模型中并行计算方法为将总问题切割成小规模问题,利用计算机的并行技术进行求解。 所以为了使得支持向量机能更好地学习与区分消费者行为,针对消费者的这种行为模式引入商品分类策略。在广东烟草市场上,我们搜集到各种不同品牌旗下最低商品的价格,计算其总体价格分布函数F(x)。 |