北京中科白殿疯 http://pf.39.net/bdfyy/bdfzj/(本文探讨了数据分析在业务探索上的应用。内容较长,共字。)
企业经营面临诸多决策,这些决策从何而来?它们由管理者从经营事实中提取信息,并结合自身经验产生。这一点就要求管理者和决策者需对经营状况有一个客观准确的认识。通过商业分析,可以使我们尽量充分又不失准确地洞察经营状况。从经营数据中提取信息的过程,我把它称为数据探索。
数据探索,在数据技术领域,通常指在数据清洗过程中,对手头数据集进行统计描述分析以试图归纳发现一些信息。在本文,数据探索的内涵更多是从业务角度提出的,它的目的是通过对数据进行各种分析,并不限于描述性统计分析,以发现企业业务中的关键信息。
我将以一个线下零售案例为背景示例一段商业分析之旅。因为零售业的经营模式相对最容易理解,几乎不要求较多的商业经验。与此同时,对零售业务的数据探索,还能让我们一窥商业分析的力量和魅力。我将以一个“自然”的思路轨迹展示整个商业分析过程。零售数据来自某线下连锁便利店企业的一个门店数据。为保证企业原始经营数据不泄露,数据仅包含当年前11周的数据,并且在示例中我会对数据做一些变换处理。此外,本次示例我将仅用Excel完成操作,这意味着企业在初期对商业分析的IT系统投入可以降到最低。
零售的周期
零售业的一个典型特征就是具有明显的周期性。在数据分析领域,更准确的术语是“季节性”,因为它指的是中短期的周期特征。我们一般把以5-10年或更久的呈周期特征的时间序列称为周期性。而像一年之内的周期性,则命名为季节性。零售业产生季节性特征的原因不难理解,比如受消费者获得收入的影响,以及一些商品本身就具有重复性消费的特征。在零售业务中找出季节性特征,对理解零售业务具有关键意义。
大多数传统线下零售企业的数据主要来自POS收银系统。这类收银系统存在已经几十年,功能单一,无法识别消费者。它保留的仅仅是一个消费记录。如果说一套收银系统能够记录下消费者身份信息,就像电商那样,那么分析整体顾客人群的消费周期就有章可循。但若数据集中仅有每笔交易的订单记录,根本无法确认每一笔是由哪个顾客消费产生的,将如何分析寻找季节性规律?答案就来自零售本身固有的周期特征。我将分析动销商品的订单记录,从中找出季节性规律。在做这样的分析之前,我们应该首先对商品做一个初步的分类。这是因为不同的商品动销表现并不相同,如果一股脑把它们混在一起分析,实际上就混杂了多种商品的动销信息,这可能反而让我们看不出隐藏在销售记录中的线索。那么这样的商品类别该如何选择呢?我先从香烟这个品类入手,原因是香烟消费具有典型的周期性特点。通过对数据的整理,我得到一个一段时间内香烟订单量的趋势图。如下方图1所示,纵轴是实际订单量的某种数学变换,它如实反映了订单量趋势变化,但隐藏了真实的订单量信息。
图1一段时间内7款香烟的订单量趋势
由于第1周和第11周数据均不满一周,所以舍弃不用,只保留了从第2周到第10周的数据。从图1中,我们能看出该门店的零售季节性规律吗?似乎有点季节性的倾向,但不是很明显。所以我们对不同香烟订单叠加以做出观察性判断。
我罗列9款香烟的同期累计订单量,如下方图2所示。
图2前11周9款香烟累计订单量递进图
实际上从7款香烟开始,再后面叠加的香烟订单趋势将没有明显变化。这些先后叠加的香烟商品是有选择的。我通过将香烟实际销售单价从高到低排序,分别观察它们的订单量,然后只选择那些订单量明显较大的香烟。如下方图3所示,该图一般也称为价格带分布图。
图3香烟价格带分布
因此,通过简单地对那些有显著销售量的香烟产品进行累计汇总,再结合前面的图1或图2,我们通过观察分析,判断出季节性周期为3周。具体地说,就是2-4周、5-7周、8-10周是该门店香烟零售的3个周期。
线下零售店不只销售香烟,也销售其它品类商品。我们将商品简单划分为香烟和非香烟两个类别,来看一看非香烟品类的销售情况。
图4非香烟类商品的销售趋势
在图4中,我沿用了从香烟商品获得的季节性特征,将非香烟类商品的销售也划分为同样的3个季节性周期。在图4中,我们可以看到在周期1和周期3中,似乎出现了同样的重复性规律。至于周期2的订单量为什么明显高于其它两个周期,是因为这期间是当年春节。所以,目前为止,我们依然可以接受3周为一周期的季节性规律特征。对横轴日期进行压缩,可以看到更为明显的结果,各周期内销售情况接近平稳。如下方图5所示。
图5非香烟类商品的周期销售趋势
对大多数零售企业来说,零售业务的季节性周期为4周左右(1个自然月)是自然的。这与人们的收入季节性周期吻合。只是有时候这个季节性周期规律不一定严格与4周吻合。
我们刻意观察零售的季节性规律是为了什么?其中一个比较关键的考虑,是它可以帮助我们了解零售门店的顾客规模和顾客消费能力。
门店顾客的规模
一个门店的顾客数量是多少?这对门店来说是个重要的问题。传统的零售分析里,