• 休闲生活
  • 教育教学
  • 经济贸易
  • 政法军事
  • 人文社科
  • 农林牧渔
  • 信息科技
  • 建筑房产
  • 环境安全
  • 当前位置: 达达文档网 > 达达文库 > 政法军事 > 正文

    基于因子聚类的电信客户细分研究

    时间:2020-12-10 07:55:31 来源:达达文档网 本文已影响 达达文档网手机站


    打开文本图片集

    摘 要:文章将数据挖掘技术引入电信行业客户细分研究,在电信客户样本集中提炼出有价值的信息,为电信企业客户个性化及差异化服务设计提供依据。首先采用因子分析的方法实现电信客户样本集的维度约减,然后采用K-均值聚类的方法,将客户样本划分为互不相交的6个大类,在此基础上,分析归并形成三个特征消费群,最后,从资费套餐设置、客户保有策略、新客户挖掘的三个维度分析并给出具体的实施策略。

    关键词:因子分析 K-均值聚类 客户细分

    中图分类号:F274,TP270 文献标识码:A

    文章编号:1004-4914(2015)01-059-03

    一、引言

    随着3G网络的普及,越来越多的消费者依赖于移动终端应用,电信消费的模式也面临从基本的通话费用为主向以流量为主的模式转变。特别是4G时代的到来,各大电信运营商开始了新一轮的市场份额抢夺战。如何充分利用电信业交易数据、管理数据,挖掘蕴含的客户信息,建立移动应用客户细分模型,从而实现更加精准的营销,是目前亟待解决的热点问题。

    数据挖掘的方法使得客户细分成为可能。其中,聚类分析是一种非监督型的数据挖掘方法,该方法从样本数据出发,探索样本间的相似性,并将最相似的对象聚集为同簇。聚类分析的方法以其易用鲁棒的优势,在商业领域的应用取得了显著的成效,其中,孙金华{1}等人采用K均值聚类方法设计中小企业客户细分模型,徐昆{2}采用改进的K均值聚类算法实现快速消费品企业资源的最优化配置。赵铭等人{3}采用聚类的方法,有效地识别基金理财客户,并据此制定出相应的个性化营销方案。针对电信客户细分,陈治平等人{4}则采用多种数据挖掘方法实现电信客户细分,实验表明K均值聚类在电信客户细分应用中的有效性,但研究并不是以客户是否使用移动网络作为细分的标准。

    以往的研究为移动互联网应用背景下的电信客户细分研究提供了可借鉴的宝贵思路。面对日趋激烈的电信业市场竞争,如何充分利用电信客户大数据信息,从中挖掘宝贵的知识,从而更加深入地了解客户,在产品趋于同质化的情况下,为客户提供差异化、多元化的电信产品和服务,最终实现有效的客户引导,并保留客户,具有重要的研究意义。

    本文采用因子分析的方法,对电信客户数据进行属性的约减,在此基础上,采用K均值聚类的方法,对用户样本集合实施无监督的机器学习,根据客户是否倾向使用电子支付和无线应用作为聚类评判依据,构造电信客户细分模型;最后,针对该细分模型给出有效的营销策略。

    二、电信客户细分实现过程

    目前电信企业资费套餐类型在不断地调整以满足各类客户的需求,但是由于受地方经济发展差异、消费水平不等、互联网时代消费客户消费模式转变等复杂因素影响,电信运营整体出现杂乱无章的现象。虽然电信业从过去的旧理念“客户得到的产品是他们所想要的”已经转变成“客户得到了他们所想要的”{5},但是如果不能对电信客户实施细致且准确地分类,电信企业仍然无法针对客户未来的成本、收入以及交叉销售绩效进行精准的评估,难以推出合理的营销策略从而提升老客户的粘性,增加新客户的种类和数量。

    本文采用某电信公司客户样本集作为研究对象,该数据集中共有1000套客户数据,每套数据14个维度,分别为居住地、年龄、婚姻状况、家庭月收入(百元)、受教育水平、性别、家庭人口、基本服务累计开通月数、是否申请无线转移服务、上月基本费用、上月限制性免费服务项目的费用、无线服务费用、是否电子支付、客户所申请的服务套餐类型。在对数据集进行极值处理、正常值选择、数据缺失处理等一系列的数据清洗准备工作后,形成用于研究分析的记录共计995套。

    1.因子分析。因子分析的方法能够在错综复杂的指标中找出少数具有代表性的公因子,并将同质的变量归入一个因子,原数据样本集的大部分信息可以通过较少的几个因子反映,从而减少分析指标的个数,同时还可检验变量间关系的假设。因子分析可以在不损失数据集信息量的情况下,减少数据分析的属性维度,是一种基于多元统计分析的有效的数据维度约减方法。

    本文采用SPSS STATISTICS软件实现因子分析。首先对原始数据集进行标准化处理,从而消除量纲和数量级对数据分析带来的影响。然后,对数据数据集合指标间的依赖程度进行假设检验,判断样本集合是否适合采用因子分析实现指标约减,检验结果如表1所示。其中,KMO (Kaiser-Meyer-Olkin)统计量为0.788,巴特利特(Bartlett)球形度检验值为5075.634,对应的sig值为0.000,小于0.05的显著水平,表明样本集合适合做因子分析。此外,指标间的相关系数矩阵也表明变量间存在显著的相关性。

    采用主成分分析的方法提取公因子,根据特征值大于1的原则,提取了具有代表性的公因子。由于初始因子载荷矩阵中因子含义不突出,因此采用最大正交旋转变换进行因子旋转变换。经过5次迭代后收敛,得到旋转后的因子载荷矩阵,最终确定5个公因子。这5个公因子累计方差贡献率达到86%,可以代表原有数据集中的14个指标表达的电信客户信息。

    公因子提取及旋转实验结果见表2。其中,公因子1在无线费用、无线服务、套餐类型、免费部分的载荷较大,代表客户网络综合服务应用情况;公因子2在开通月数、基本费用、年龄和收入的载荷较大,代表客户基本信息和传统的电信服务应用情况;公因子3在家庭人数、婚姻状况的载荷较大,代表电信客户家庭基本情况;公因子4在电子支付、教育水平的载荷较大,代表电信客户的教育程度;公因子5居住地和性别上有较大的载荷,代表地区和性别差异所构成的影响因素。

    2.k-均值聚类。在因子分析得到的五个公因子的基础上,本文选取K-均值聚类方法实现电信客户细分。K-均值是典型的基于划分的聚类算法,该方法将样本数据间的距离作为评价样本是否相似的重要度量标准,通常规定样本间的距离越近表示其相似度越高,同时保证类别和类别之间的距离尽可能大,即类间具有较高的差异性。通过K-均值算法的计算,样本集合中距离较近的数据信息归集起来,形成一个数据类(簇)。由于K-均值聚类算法的具有高可靠性和精准性,以及算法的复杂度较低等优势,成为目前主流的聚类算法之一。基于K-均值聚类的电信客户细分,是一个将电信客户样本集合中相似对象聚集的过程,在非监督学习过程结束后,客户样本集合被聚集成具有相似性的簇,而簇与簇之间有着明显的差异。

    在实现K-均值聚类分析前,首先要保证K值选取的科学性。本文采用系统聚类的方法对样本实施类别的探索性实验,从而确定K-均值聚类的K值,根据系统聚类谱系图分析,确定K值的最优取值为6。

    本文采用SPSS STATISTICS实现聚类分析,在对样本集合实施K-均值聚类分析后,样本集合被聚集成为6个大类。为了研究每一类中的样本是否采用电子支付和无线等网络服务的客户特征进行分析,在SPSS STATISTICS中使用“选择个案”功能,对每一类个案实施挑选并分析,并将结果导入至WINDOWS EXCEL中,运用EXCEL的“筛选”功能对各类别中的因子进行统计分析,分析结果见表3。

    三、实验结果及分析决策

    1.客户细分特征描述。针对电信客户信息实施聚类分析后,电信客户样本被划分为互不相交的6个簇,对6个簇中的客户进行特征描述和分析,挖掘蕴含在样本集中的客户使用无线网络应用与客户细分群属性之间的关系,有如下发现:

    第一类聚集为已婚中青年,女性居多,收入偏低,家庭人数多,开通电信服务的月份短,99.5%不使用无线网络套餐服务,93%未开通电子支付功能。

    第二类聚集为未婚中年及老年,未呈现明显的性别差异,中等收入,教育水平偏低,95.5%不使用无线网络套餐服务,90%未开通电子支付功能。

    第三类聚集为已婚中年,未呈现明显的性别差异,收入高,教育水平较高,50%使用无线网络套餐服务,90%开通了电子支付。

    第四类聚集为未婚中年人,男性居多,中等收入,开通电信服务的月份短,100%使用无线网络套餐服务,且78%的人开通电子支付功能。

    第五类聚集为已婚中老年人,女性居多,中等收入,教育程度高,开通电信服务的月份长,65.5%使用无线网络套餐服务,85%未开通电子支付功能。

    第六类聚集为已婚中老年人,未呈现明显的性别差异,收入偏低,教育程度偏低,开通电信服务的月份长,88%不使用无线网络套餐服务,89%未开通电子支付功能。

    2.结论与电信套餐营销策略。基于因子聚类分析的电信客户细分结果,结合电信企业的业务需求,可将电信客户进一步划分为普通消费型客户、移动互联网应用潜在型客户和移动互联网应用稳定型客户。其中,聚类分析中的第一类、第二类和第六类为普通消费型客户,第三类和第五类为移动互联网应用潜在型客户,而第四类为移动互联网应用稳定型客户。

    普通消费型客户的特点体现为:收入偏低,家庭结构不稳定,基本不使用无线套餐服务和电子支付。针对这部分客户实施电信营销策略设计时,资费设置方面尤其要考虑经济实惠,在价格上体现充分的吸引力,此外,侧重开展更多增值服务从而增加客户粘性,提高保有率。对于普通消费型客户中的第一类客户群,年轻人较多,可以相应的推出相应的购机送话费补贴模式,或0元购机合约等计划;此外,年轻人接受新鲜事物的欲望和能力强,这类客户过渡为移动互联网应用型客户的概率非常高,在营销时侧重针对移动互联网应用服务的特点和类型的推广,向其销售包含流量的实惠型套餐类型。而在第六类中老年人居多,客户开通使用时间长,是电信客户的忠实用户,在推出实惠型的套餐的基础上,提供适合中老年用户的增值服务,尤其注重客户服务的质量,提升老客户的满意度,例如,针对中老年客户记忆力逐渐下降,疾病增多等普遍存在问题,提供起居提醒、用药提醒、紧急呼叫等多种增值服务功能。

    移动互联网应用潜在型客户特点体现为:中高等收入,教育水平高,家庭结构稳定。这部分群体接受移动互联应用等新事物、新技术能力强,中高等的收入也为消费更高级别电信套餐类型提供保障。样本数据集也体现出,在这部分群体中使用无线套餐服务的样本个体,其电信业务的消费水平均很高的特点。这部分客户是进行无线互联网应用新客户挖掘的主要营销对象群体。因此,需设计多样化的移动互联网应用套餐包供这部分客户选择。这一群体中第五类女性偏多,使用电子支付的人数偏低,分析可能造成该因素的原因为女性接受电子类产品能力偏弱的特点。因此,营销时更侧重对移动互联网络应用安全性、使用方法的讲解,从而消除其使用的安全性方面的顾虑,帮助其掌握移动互联应用的方法。而第三类客户群,其中90%的客户开通了电子支付功能,体现了这部分群体有着明显的移动互联网应用需求,但却只有50%的人使用无线套餐服务,因此这部分客户群体是实施移动互联应用新客户挖掘的巨大宝藏。

    移动互联网应用稳定客户特点体现为:教育水平高,收入稳定,绝大多数人开通电子支付,是移动互联应用的忠实客户群。针对这类客户,可以设计高端的移动应用大流量套餐包服务。例如,中国联通推出国内流量计费达到600元后将不再收费,直至15GB后系统自动关闭数据网络的套餐服务,从而满足客户对移动互联网服务应用的需求。此外,这类客户最有可能成为4G网络应用的先驱,在营销时重点向这类客户推荐4G应用的特点和优势,例如只要是使用4G套餐的客户,可授权1~4个亲友分享自己套餐内的流量,只是每人每月收取10元功能费等。同时,样本数据表明,这类客户开通的月数短,体现出明显的流动性趋势,因此需要提供良好的客户服务实现客户保持。

    四、总结

    针对电信行业目前市场状况,尤其是4G时代的到来,如何针对客户对移动互联网络应用的需求制定电信营销方案是很有必要的。本文采用因子分析和K-均值聚类的方法,实现电信客户群的细分,并根据细分结果,针对性地给出每一类客户群的电信营销策略。研究成果通过对顾客信息资源的整合,有效地将电信企业资源集中到最有价值的客户,增加电信企业盈利和改善客户关系,达到电信服务和营销投资的最优化效果。

    [本项目受陕西省自然科学基金项目资助(项目编号2014JQ8367);西北大学大学生创新项目资助(2013西北大学大学生创新创业训练计划项目)]

    注释:

    {1}孙金华,孟昭睿,谢彦麒.基于K-Means算法的中小企业客户细分研究[J].电子商务,2014(3):59-60

    {2}徐昆.优化的聚类分析在企业客户细分中的应用[J].经济论坛,2014(01):123-128

    {3}赵铭,李雪,李秀婷,等.基于聚类分析的商业银行基金客户的分类研究[J].管理评论,2013(07):38-44

    {4}陈治平,胡宇舟,顾学道.聚类算法在电信客户细分中的应用研究[J].计算机应用.,2007,27(10):2566-2569.

    {5}江哲雅.聚类挖掘在电信客户分类中的研究与应用[D].上海交通大学,2013.

    (作者单位:1.西北大学经济管理学院 陕西西安 710127;2.西北大学信息科学与技术学院 陕西西安 710127;3内蒙古自治区农村信用社联合社 内蒙古呼和浩特 010020;第一、二作者简介:刘彩芬,西北大学经济管理学院,本科生;高原,西北大学经济管理学院,学院教学实验中心主任,副教授,研究方向:商务智能、金融数据挖掘)

    (责编:若佳)

    相关热词搜索: 因子 细分 客户 电信 研究

    • 生活居家
    • 情感人生
    • 社会财经
    • 文化
    • 职场
    • 教育
    • 电脑上网