学术论文投稿/征稿

欢迎您!请

登录 注册

手机学刊吧

学刊吧移动端二维码

微信关注

学刊吧微信公众号二维码
关于我们
首页 > 学术论文库 > 经管论文 基于内外部数据驱动的烟草零售客户聚类研究论文

基于内外部数据驱动的烟草零售客户聚类研究论文

6

2026-03-16 16:47:19    来源:    作者:xuling

摘要:在全球控烟政策趋严与消费者需求多元化的背景下,烟草行业面临传统市场增速放缓、客户分类静态化与策略适配性不足等挑战。

  [摘要]在全球控烟政策趋严与消费者需求多元化的背景下,烟草行业面临传统市场增速放缓、客户分类静态化与策略适配性不足等挑战。本研究以某市云岩区3 855户零售客户为样本,整合销售数据、27项外部商业环境指标及地理空间信息,构建融合区域配套、业态结构与人口特征的多模态聚类模型,创新运用t-SNE非线性降维与Gibbs采样优化的K-Means算法,实现客观可量化的零售客户分类与空间异质性分析。研究发现,零售客户呈现显著的圈层化分布特征,其价值呈现显著的空间异质性与环境依赖性,外部环境变量(如区域经济指数、业态丰富度)与客户行为存在链式关联。本研究突破了传统客户分类的静态内生属性局限,通过高维数据降维与特征筛选的技术创新,为烟草企业制定差异化货源投放策略提供了数据驱动的决策支持。

  [关键词]烟草零售客户;聚类分析;商圈特征;数据融合

  0引言

  中国烟草总公司“十四五”规划明确提出构建“数据驱动的现代营销体系”战略目标,要求实现对零售客户的精准画像、聚类组合,为精准营销奠定基础。但在当前的实际运用中,零售客户划分仍然多依赖历史销量、客户规模等内生变量,忽视市场特征与空间关联性,常常导致市场细分失真。因此,本研究提出通过整合订购数据、外部商业环境数据及地理空间信息,构建零售客户多模态聚类模型,以解决传统分类在环境适应性、关联复杂性和全局协同性上的缺陷。为烟草行业提供更精细化的客户管理工具,并形成可复制的行业解决方案,助力其他区域烟草商业应对“市场分化加剧、政策约束强化”的双重挑战,推动行业从“经验驱动”向“数据驱动”转型。

  1理论分析

  1.1烟草行业的零售客户分类管理

  零售客户划分是客户关系管理(CRM)的核心环节,早期零售客户划分主要有三种。第一种是按照档位进行划分,如按照销售量、烟民吸食量划分卷烟零售客户[1]。第二种是结合业态对零售客户进行分类,实际操作中的客户分类主要依赖客户经理的经验或感觉。第三种则是依赖网格等方式进行划分,有学者从客户的当前价值、潜在价值、忠诚价值三个方面确定了零售客户价值评价指标体系,并运用网络层次分析法确定了指标权重[2]。以上几种方法虽然能够在一定程度上划分零售客户,但在刻画外部环境时难以保证准确性和全面性。

  1.2聚类分析在烟草零售客户分类中的运用

  聚类分析方法最早源于分类学,通过数学工具和多元分析技术形成定量分类方法。在零售领域,有学者基于RFM模型的三个特征,通过K-Means聚类算法将客户划分为VIP、重要、普通和小客户四类[3]。也有学者以烟草证号为标志,用DBSCAN算法研究卷烟零售客户的集群热点和空间分布情况并形成分类图[4]。还有学者通过用K-Means算法客观分析零售客户的当前价值和潜在价值[5]。

  尽管零售客户划分已从早期单一指标转向运用聚类分析,能得到更准确的分类和真实的销售环境[6],但聚类分析也存在一定的局限性。例如,K-Means算法在簇数选择、质心选择上有难度,且可能将离群点归为一类;同时,零售客户划分的依据以内部数据为主,目前仍缺乏以外部商业环境特征向量的聚类分析。

  2研究设计与方法

  首先,本文构建了涵盖区域配套、业态构成及人口特征的外部经营环境指标体系,反映不同零售户的外部市场发展水平;其次,采用融合t-SNE与Gibbs采样的K-Means迭代聚类法分析零售客户;最后,将聚类结果映射到地图,探究不同类别零售客户的空间分布规律、市场环境与销售绩效之间的关联及成因,进而提出更合理的货源投放优化策略。

  2.1外部商业环境指标构建

  烟草零售作为强属地化的商业活动,其经营绩效受外部环境制约显著。尽管国家烟草专卖局已发布烟草零售业态分类标准,但实际分类多依赖客服经理的经验判断,缺乏量化依据和可重复性。本研究从“区域配套—业态结构—人口特征”三大维度建立外部商业环境指标体系。其中,区域配套包含区域配套概览、商业配套、住宅、交通4个二级指标和16个三级指标,反映区域基础设施与公共服务能力;业态结构包含餐饮、零售、教育培训等9个三级指标,反映商业生态与消费层级特征;人口特征包括居住人口总量和办公人口总量,反映了消费需求结构与市场潜力(详见表1)。

  2.2基于t-SNE+K-Means的零售客户聚类分析

  聚类是将物理或抽象对象的集合划分为多个类或簇的过程,使同簇对象相似度高、不同簇差别大。目前烟草公司对客户的分类主要依据业态、经营规模、订购频次等内部指标,较少基于外部商业环境进行聚类。因此,本文拟从27个外部商业环境指标出发,对3855户零售客户进行K-Means聚类分析,并结合t-SNE和Gibbs采样以解决高维数据降维与特征选择的难题。

  2.2.1运用t-SNE实现高维数据降维

  t-SNE(t-Distributed Stochastic Neighbor Embedding)是适用于高维数据的降维方法,相比PCA等线性方法,更适用于非线性数据集。第一,它保留了局部结构。t-SNE注重将相近的数据点在低维空间中保持接近,便于揭示数据中局部的群集结构。第二,可捕捉数据中的复杂非线性关系,在某些情况下比线性方法更有效。

  2.2.2 K-Means聚类分析

  k均值聚类模型是一个从样本到类的函数。把每个样本用一个整数i∈{1,2,…,n}表示,每个类ı∈{1,2,…,k}也用一个整数表示,那么划分或者聚类可以用函数1=C(i)表示。k均值聚类的陈列是通过损失函数的最小化选择最优的划分或者函数C。具体步骤如下。

  3实证分析与结果

  3.1数据收集

  本研究共收集了销售、空间和环境三类数据。首先,我们采集了某市云岩区4 836户卷烟零售户2022—2023年的季度销量、空间地理位置等数据,包括许可证号、零售户名称、档位、经营地址、经纬度以及两年8个季度的销量和销售额。通过IDV(许可证号)作为唯一主键,将不同来源的数据进行融合。在数据清洗过程中,剔除包含缺失值、重复及异常的数据,最终保留3 855个有效样本。其次,环境数据以每个许可证号对应的经纬度坐标为中心点,搜索其半径0.5公里范围内各外部经营环境指标的POI数量①。

  3.2零售客户聚类结果与特征分析

  3.2.1零售客户聚类结果及其空间分布

  3.2.1.1零售客户聚类结果

  在t-SNE降维和Gibbs特征选择后,使用K-Means算法将3 855个样本聚为6类。本文对各指标均值及变差系数进行统计与比较分析,结合外部商业环境与地理区位分析,得到以下特征(见图2)。

  第一类零售客户位于地理空间核心区,呈高密度都市发展特征:空间功能配置中住宅单元、商业区、办公设施密度高,公共服务配套完善,教育、医疗、交通设施密度均值分别为9.57个、20.69个、10.94个。在商业活力与消费能力维度,该区域住宅均价8 800元/平方米,餐饮消费人均达25元,商业设施占比突出,已形成高消费群体集聚、商业业态丰富的发展格局,发展潜力强劲。

  第二类零售客户所在区域表现为居住功能主导,商业与办公功能相对薄弱。商业区数量(均值0.27)、百货商场占比(均值0.03)极低,零售(均值153.13)和餐饮、休闲娱乐等服务业设施较少,印证了该区域消费业态多样性不足、商业活力有限的发展现状。

  第三类零售客户所在区域有一定规模的居住和办公人群,人口密度中等,学校数量(均值11.33)和教育培训数量(均值86.07)较高,重点发展教育导向性商业。此外,该区域公共服务设施较为齐全,公共交通、学校和医院等基础设施分布稳定,支撑区域稳定发展。

  第四类零售客户所在区域为次级商业中心,以居住为基础、商务为主导,但其商业设施规模与活跃度远低于第一类区域,三大商业形态占比偏低。该区域虽然具备一定的消费基础,但商业集聚效应和辐射能力明显弱于核心商圈。

  第五类零售客户所在区域处于城市经济发展过渡层级,居住人口(25 117人)中等,办公人口(1 442人)极低,属于普通居住社区,以社区型商业为主,地铁站点少且分布不均,消费市场和劳动力资源较少,生活服务、零售数量中等,但标准差低(如零售标准差224.10),商业分布均匀,且以低端消费为主导。

  第六类零售客户所在区域居住与商业功能相对均衡,已形成中等规模的消费业态体系,为卷烟零售消费提供配套支撑。在人口活力维度,居住人口密度均值高达29 181.52人,办公人口均值为3 628.32人。这种“居住为主,办公为辅”的人口结构保障了稳定的日常消费需求,办公人群的流动性消费提升了区域商业活力,形成了良性的商业循环。

  3.2.1.2空间分布

  将零售客户的聚类结果及其经纬度坐标映射到高德地图上,形成聚类零售客户群落的电子地图。六个聚类整体空间分布呈现明显的圈层特点。核心区(聚类1、4)商业设施密集,销售额领先。过渡区(聚类3、5)商业密度中等,销售额略低。边缘区(聚类2、6)商业活动稀疏,销售额居后,符合“核心→边缘”销售额递减的逻辑。

  虽然整体外部商业环境越发达销售额越高,但仍存在负相关情况。例如,聚类3学校数量(均值11.33所)和教育培训设施(均值86.07个)突出,但商业密度中等(餐饮数量均值439.22),销售额却低于过渡区,这可能是由于教育主导的消费场景限制了高附加值业态发展,客群以家庭和学生为主,导致该区域整体消费能力有限。聚类5社区型商业依赖固定客群,消费结构稳定,但缺乏高流量或高客单价场景。聚类4销售额最高但波动大,工作日消费集中但节假日流量下降,这说明该区域商业生态单一,削弱了持续盈利能力。

  3.2.2零售客户环境差异对卷烟销售的影响对比分析

  3.2.2.1区域配套与销售绩效的双重效应

  实证结果表明,第一类零售客户所在区域商业设施密集且均衡,具有稳定客流量和交叉消费机会,但因过度竞争和市场饱和,销售额易出现大幅波动。第四类区域商业设施较为匮乏,有利于形成稳定的区域商业生态系统,但也限制了销售规模的扩张。第二类区域“居住功能单极化”,消费生态存在缺陷,销售表现稳定,但增长动能不足。第六类区域空间功能配置均衡,“产城融合”的空间结构产生消费协同效应,适度的办公功能引入了高质量的商务消费群体,这种多元化消费场景提升了消费能级。

  3.2.2.2人口结构与消费需求的动态匹配

  从人口经济学视角来看,居住与办公人口数量及结构差异影响消费需求。第一类区域表现为“高密度—高流动性”,人口规模带来的规模经济带动了销售,但人口流动和消费偏好的动态变化也导致需求不确定性。第二类区域表现为居住功能主导,居住与办公人口密度之比高达20:1,消费需求单一,卷烟消费时段集中于早晚高峰,消费品类和升级动力不足,客单价提升受限。第六类区域人口结构均衡,工作日办公人群的商务消费与休息日居民的日常消费良性互补,销售波动较小。

  3.3不同聚类类别货源投放优化策略

  本研究以某市云岩区卷烟零售户为样本,经系统聚类分为6个类别,各类别在区域配套、人口结构、消费水平等维度差异显著(见表2)。

  聚类1位于繁华商业核心区,货源投放需构建多元化、高品质卷烟组合,引入高端特色品牌,减少中低端产品库存。同时,借助大数据监测市场动态和消费偏好变化,灵活、精准地调整货源投放品类与数量,实现供需匹配。

  聚类2为低密度居住区,商业活力匮乏,消费场景相对单一。货源投放应以保障居民日常基本卷烟消费需求为核心,重点投放中低档产品,增设自助售货机或社区便利店合作点以稳定供应,联合零售户开展促销激发消费。

  聚类3和聚类5作为中等发展水平的居住功能主导区域,人口密度高但商业活跃度不足。货源投放应注重产品性价比,重点投放价格适中、品质可靠的产品。同时,结合学校、医院等办公消费人群的作息周期动态调整库存,以提升销售业绩与市场竞争力。

  聚类4区域为次级商业中心,商业设施规模与活跃度不及聚类1区域,但消费基础稳定。可增加体验式烟草文化馆等特色商业配套,适度降低高端产品投放比例,增加中高端性价比产品的市场供给。

  聚类6区域居住与商业功能相对均衡,人口活跃度较高,消费业态体系初具规模。货源投放可聚焦高端市场,引入进口烟草等高价产品。此外,可借助区域商业活动与人口流动优势开展针对性的品牌推广活动,提升品牌知名度与美誉度,拓展市场份额。

  4结论与讨论

  本研究聚焦烟草行业零售客户分类的环境适应性困境,通过整合3 855户零售客户的订购数据、27项外部商业环境指标及地理空间信息,揭示了外部环境变量与客户行为的多维动态关联机制,构建了融合区域配套、业态结构与人口特征的多模态聚类模型,形成对客户分类理论与实践的系统性突破。研究发现:第一,基于t-SNE与K-Means的迭代聚类算法有效解决了高维数据的降维与特征选择难题,将某市云岩区零售客户划分为6类异质性显著的群体,其空间分布呈现圈层化特征,验证了地理空间异质性对客户分群的影响。第二,零售客户价值呈现显著的空间异质性与环境依赖性,区域配套、人口结构与消费水平上的差异显著影响卷烟销售绩效。

主要参考文献

  [1]尹朝阳.刍议卷烟客户的分类[J].商场现代化,2006(8):82-83.

  [2]范奥哲.面向海量零售户的客户价值分类与精准推荐研究[D].杭州:浙江理工大学,2020.

  [3]邓基刚,郑成德,刘景燕,等.基于RFM模型的烟草客户聚类分析研究[J].价值工程,2015,34(6):20-22.

  [4]许菲.基于DBSCAN聚类算法的卷烟零售客户分类研究[J].中国市场,2023(23):121-124.

  [5]闫磊,刘旭,徐斌.基于客户价值的卷烟零售客户分类研究与应用[J].价值工程,2019,38(25):89-90.

  [6]陆静.k-means算法在电信客户关系管理中的应用[J].福建电脑,2012,28(8):83-84.