手把手 | 教你用几行Python和消费数据做客户细分

细分客户群是向客户提供个性化体验的关键。它可以提供关于客户行为、习惯与偏好的相关信息,帮助企业提供量身定制的营销活动从而改善客户体验。在业界人们往往把他吹嘘成提高收入的万能药,但实际上这个操作并不复杂,本文就将带你用简单的代码实现这一项目。

客户细分
我们需要创建什么?
通过使用消费交易数据,我们将会通过创建一个2 x 2的有价值属性的矩阵来得到4个客户群。每一个客户群将与其他群体有两大区别,即当前客户价值和潜在客户价值。
我们将使用什么技术?
我们将使用RFM模型从消费交易数据中创建所需变量。RFM模型代表:
最近消费(Recency):他们最近一次消费是什么时候?
消费频率(Frequency):他们多久消费一次、一次消费多久?
消费金额(Monetary):他们消费了多少?
该模型通常被用于在三个属性交叉处寻找高价值客户。但在本例中,我们将仅适用R(最近消费)与M(消费金额)来创建二维矩阵。

RFM模型
我们使用什么数据?
我们将使用Tableau提供的消费数据样本——它也被称为“Global Superstore”。它通常被用于预测与时间序列分析。该数据集包含超过1500位不同客户4年的消费数据。既然我们做的是行为细分而非人口细分,我们将通过仅选择B2C领域的消费者以及美国区域的消费数据来去除潜在的人口偏差。
我们采取什么方法?
第0步:导入、筛选、清理、合并消费者层级数据。
第1步:为每一位消费者创建RFM变量。
第2步:为实现自动细分,我们将使用R与M变量的80%分位数;我们其实还可以用k均值聚类(K-mean Clustering)或者利用商业背景知识来进行群体区分——比如,全球超市企业用户将活跃客户定义为最近一次订单在100天内的客户。
第3步:计算RM分数,并对客户进行排序。
第4步:可视化价值矩阵,并对关键指标进行进一步分析。[page]分页标题#e#
Python实现:
第0步:导入、筛选、清理、合并消费者层级数据。
import matplotlib as plt
import numpy as np
%matplotlib inline
import warnings
warnings.filterwarnings('ignore')
import pandas as pd
url = 'https://github.com/tristanga/Data-Analysis/raw/master/Global%20Superstore.xls'
df = pd.read_excel(url)
df = df[(df.Segment == 'Consumer') & (df.Country == 'United States')]
df.head()
第1步:为每一位消费者创建RFM变量。
df_RFM = df.groupby('Customer ID').agg({'Order Date': lambda y: (df['Order Date'].max().date() - y.max().date()).days,
'Order ID': lambda y: len(y.unique()),
'Sales': lambda y: round(y.sum(),2)})
df_RFM.columns = ['Recency', 'Frequency', 'Monetary']
df_RFM = df_RFM.sort_values('Monetary', ascending=False)
df_RFM.head()

第2步:使用R与M变量的80%分位数实现自动细分。
# We will use the 80% quantile for each feature
quantiles = df_RFM.quantile(q=[0.8])
print(quantiles)
df_RFM['R']=np.where(df_RFM['Recency']<=int(quantiles.Recency.values), 2, 1)
df_RFM['F']=np.where(df_RFM['Frequency']>=int(quantiles.Frequency.values), 2, 1)
df_RFM['M']=np.where(df_RFM['Monetary']>=int(quantiles.Monetary.values), 2, 1)
df_RFM.head()

第3步:计算RM分数,并对客户进行排序。
# To do the 2 x 2 matrix we will only use Recency & Monetary
df_RFM['RMScore'] = df_RFM.M.map(str)+df_RFM.R.map(str)
df_RFM = df_RFM.reset_index()
df_RFM_SUM = df_RFM.groupby('RMScore').agg({'Customer ID': lambda y: len(y.unique()),
'Frequency': lambda y: round(y.mean(),0),
'Recency': lambda y: round(y.mean(),0),
'R': lambda y: round(y.mean(),0),
'M': lambda y: round(y.mean(),0),
'Monetary': lambda y: round(y.mean(),0)})
df_RFM_SUM = df_RFM_SUM.sort_values('RMScore', ascending=False)
df_RFM_SUM.head()
[page]分页标题#e#
第4步:可视化价值矩阵,并对关键指标进行进一步分析。
# 1) Average Monetary Matrix
df_RFM_M = df_RFM_SUM.pivot(index='M', columns='R', values='Monetary')
df_RFM_M= df_RFM_M.reset_index().sort_values(['M'], ascending = False).set_index(['M'])
df_RFM_M
# 2) Number of Customer Matrix
df_RFM_C = df_RFM_SUM.pivot(index='M', columns='R', values='Customer ID')
df_RFM_C= df_RFM_C.reset_index().sort_values(['M'], ascending = False).set_index(['M'])
df_RFM_C
# 3) Recency Matrix


最终矩阵(左上:流失客户;右上:明星客户;左下:次要客户;右下:新客户)
一些简单的销售与营销策略的启发性实例
“流失客户”分类中的客户人数不是很多,并且从他们身上得到的的平均收入高于“明星客户”分类。既然人数不多,从客户层面与业务部门合作对这些客户进行分析研究并制定一个留住他们的策略应该不难:给他们打电话或者直接见面,说不定就可以把他们挪到“明星客户”分类(例如,高参与度客户)。
“次要客户”分类的平均最近消费时间非常久远(超过1年,而参与度较高的客户平均来说该数据只有60至70天)。发起一些发放优惠券一类的营销活动可能能够带来新的消费,并帮助把该类客户挪至“新客户”分类(例如,高参与度客户)。

简单策略实例(上:打电话;下:电邮营销)
在Github上可以找到本Jupyter Notebook
https://github.com/tristanga/Data-Analysis/blob/master/Notebooks/Automatic Customer Segmentation with RFM %28Python%29.ipynb
相关报道:
https://towardsdatascience.com/how-to-automatically-segment-customers-using-purchase-data-and-a-few-lines-of-python-36939fb587a4
本文首发于微信公众号:大数据文摘。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。[page]分页标题[/page]

- AMD助力微软Windows 11 为用户带来强大、可靠的计算能力2021-10-09 16:20
- 游戏玩家为之疯狂!Chinajoy2021 AMD展台那些火爆的瞬间2021-08-02 15:39
- 全场最佳 AMD Chinajoy2021展台圆满收官2021-08-02 15:38
- AMD 锐龙5000G系列处理器正式亮相Chinajoy20212021-08-02 11:50
- 极速制胜 制霸游戏 AMD携多款游戏神器扬威Chinajoy2021-08-02 11:44
- 央视《新闻联播》头条聚焦铁建重工,聚力攻克“卡脖子”技术难题2021-03-22 11:08
- 刚刚!我又上央视新闻联播头条了!2021-03-22 11:04
- 中国电科(3月1日-3月7日)要闻回顾 | 资讯轻阅读2021-03-22 10:47
- 我国将建第一个国家公园:为何是三江源2021-03-22 10:43
- 美国硅谷上演“大逃亡”:郊区成科技精英避难所2021-03-22 10:41

- 20:48易萃享:AI科技赋能,让精准养生走进日常
- 20:41康力药业:以用户需求为核心,打造全链条健康服务生态体系
- 11:14未来产业50人论坛在沪隆重启幕 量子专场汇聚顶尖智慧共话未来
- 12:15易萃享:千日磨一剑,解锁精准营养个性化新范式
- 11:32康力药业:30载初心如磐,深耕大健康产业步履不停
- 17:18从单品智能到场景智能,方太智慧烟灶登陆AWE 2026引领厨居生活变革
- 14:14外资垄断75%!海上风电变压器受制于人,国家能源安全底线不容失守
- 22:11全球第一海风装机 核心设备国产化率不足25% 75%市场被外资掌控
- 14:59恩捷李晓明:协同减碳 打造产业生态与经济效益共生样本
- 15:21初高中生成绩不理想考不上理想的学校怎么办、如何根据自身优势择校?
- 11:52东方药林百店齐燃启新程 水润万家汇暖流
- 11:44智启社区 共享美好生活——东方药林2026社区战略发布会(沈阳站)圆满举
- 15:21东方药林:守正创新护权益,合规前行启新程?
- 13:52直击MWC2026,浩鲸科技提出AI正在重写通信软件的价值坐标
- 13:51MWC 2026|浩鲸科技周勇:构建智能生产力,在AI时代重塑运营商角色
- 13:53助推产业链高质量发展·创投实录|致瞻科技:以“学霸”思维,立“身位”优势
- 15:13坚守初心,逐光而行——全美世界的深耕与绽放
- 14:26皙之密:精准护肤时代,让素颜美肌自带底气
- 21:19荣誉见证实力:广东康力医药有限公司的标杆成长之路
- 17:21创新为翼:广东康力医药有限公司迈向全球大健康领航者
- 17:03使命如炬:广东康力医药以价值观引领行业前行
- 16:25东方药林沈阳核心峰会召开,“人+健康+生态”战略在东北正式落地
- 16:23东方药林年度盛典落幕:共赴2026健康新征程,深耕社区再启航
- 16:17东方智慧管理学院:在山水间炼就“五力战将”的现代黄埔军校
- 13:29南京市创投集团直投企业软通天枢完成新一轮融资
- 18:16东方药林迎来俄罗斯及中亚五国考察团,健康新丝路启航新程
- 18:07东方药林开年强化合规培训:筑牢规范经营基石
- 17:41东方药林晋级训练营湖北启幕,锻造社区健康服务生力军
- 13:16恒基兆业地产集团庆祝成立50周年,深耕内地共谱新章
- 12:28内容驱动与品牌升级并行——徐美芳市场推广实践对服装产业转型的启示



