首页 > 互联网资讯 > 人群识别的常见错误,一种方法就可避免 | Data Knows

人群识别的常见错误,一种方法就可避免 | Data Knows


Data Knows,用分析师的观点解答一切关于数据的疑问,以第一财经商业数据中心(CBNData)专业的数据研究成果为载体,告诉你如何利用大数据协助日常商业决策。


一般说来,商家在进行决策时,尤其是在进行市场细分决策时,往往会看到这样的描述:某高端女性护肤品牌A的目标消费群体是一二线城市,年龄在30-40岁间,高消费档次的女性消费者(此处应有都市女金领配图)。

那么,具有以上属性的目标消费者是如何从消费群体中被识别出来的?

这些描述的背后,是经过数据分析得出的消费者洞察。而年龄、性别、地域、消费档次、消费深度等便是用来区分消费者人群的常用属性。为了达到更精准的消费者细分,就需要不同维度属性的交叉分析,这个过程中往往会出现一些常见的错误,其实有一种方法就可以避免。

本期Data Knows就要告诉你如何利用数据分析来得出这些消费者洞察,并避免数据分析中的一些常见错误


人群识别如此简单?

Sooo Naive!---基数偏见,人群识别中的常见问题之一

深夜,上海市区某甲级写字楼仍灯火通明,A品牌营销同学小A看到数据分析师D仔拉出的A品牌“按消费者年龄层分布的线上销售额柱状图”后,小A得出以下结论:A品牌最主要的消费群体应该是23-28岁的消费人群,然后是29-35岁消费人群

其实,小A恰恰产生了数据分析中最易产生的偏见之一,基数偏见,即在不知道基数的情况下做出的判断。此时D仔拍醒了沉浸在“人群识别如此简单”幻想中的小A,给她亮出加入了低端护肤品牌B、所有护肤品,以及线上消费大盘后的柱状图:

小A立刻注意到,好像对于低端品牌B、所有的护肤品、乃至整个线上消费的大盘而言,主要的消费群体都是23-28岁人群,其次才是29-35岁人群

难道所有护肤品牌商的目标客群都是23-35岁人群吗?

正当小A面对屏幕陷入迷思之际,D仔在其身后幽幽说道:“其实,缘于23-35岁的年轻人群是线上消费人群中人数占比最多,因此,在大多数的类目消费中,23-35岁的人群均为占比最大的人群。不可否认,这群人是品牌最大的销售额贡献人群,但考虑到在人数众多的23-35岁人群中找到目标消费者,如同大海捞针,而且并不能与其他品牌的消费目标人群产生区隔。因此,通过对比其他护肤品牌会有不一样的发现。如上图,加入了B品牌后,我们发现A品牌的36岁以上人群消费占比明显高于B品牌及护肤品整体,所以正确的结论应该是36岁以上人群才是A品牌的目标消费群体。

在这里我要教你一种算法。迎着小A眼中的小星星,D仔在白板上写下“TGI”三个字符。


换个算法,还你真相!

通过TGI算法识别结果:同样的数据,相反的结论!

“TGI代表着Target Group Index,直译为目标人群指数,也经常被称为偏好度或重要性。一般常被用于统计中,用以判定特定群体的强势或弱势,算法多样。而我们用来判别人群的TGI算法则被称为人群TGI,人群TGI指数=目标群体中具有某一特征的群体所占比例/总体中具有相同特征的群体所占比例*标准数100。 ”D仔在白板上写完公式后,回头看着眼睛有些发直的小A接着说道:

“如果在这次案例中应用TGI算法,我们可以看出对于A品牌来说,36-50岁与50岁以上人群才是人群TGI指数最高的消费人群,换句话说,也是对A品牌最偏好的人群,而原定的23-35岁人群其实对于A品牌并不偏好。35岁以上人群的消费能力更强,客单价高,也更符合我们A品牌的高端定位,因此将这群人定为目标消费者才是最有效的营销策略。同时对比我们的竞品B品牌,人群TGI指数显示18-28岁的青少年群体更偏好定位低端的B品牌,因此他们的目标消费者应该定为更年轻的人群。”

潜在客户才最重要!

人群TGI指数-减法,找到更大的潜在偏好人群

D仔摇了摇没什么反应的小A,接着说道:“其实还没完呢,从这种人群TGI算法得出的结论应该是50岁以上人群才是最偏好我们A品牌的客户,但其实我们最应该关注的是人群TGI指数第二高的36-50岁人群。”

此时此刻,小A一脸懵......

D仔接着说道:“从数学原理判断,50岁以上人群基数较小,占大盘4%,而36-50岁人群基数相对较大,占大盘17%,基数小的人群更容易在人群TGI计算中出现较大的偏好度,因此仅仅按照偏好度作为依据,容易错误地把小基数群体作为目标人群,从而忽略更大的潜在偏好人群。为了克服这种偏见,我们可以采取减法的方式来计算人群TGI指数,算法为人群TGI指数=目标群体中具有某一特征的群体所占比例-总体中具有相同特征的群体所占比例。缘于原数值能够体现具体场景中的差异度,因此在减法TGI算法中无需标准化计算。”

D仔说着又重新拉出一张柱状图,这次36-50岁人群成为了最偏好A品牌人群。小A恍然大悟道:“这次的结果我理解啦,就是36-50岁人群比起其他人群占整体销售额5%的偏好度,而50岁以上人群有2%的偏好度,因此如果能抓住36岁以上人群,我们至少能抓住品牌总销售额的7%!”

听完后,D仔一脸鄙视:“额,简单来说可以这么理解吧。总之,TGI的使用也是有规则和前提的。”接着,D仔在白板上写下一行大字:人群TGI算法使用须知。写完后D仔头也不回的走出办公室大门,深藏功与名,只留下小A一个人在空荡荡的办公室,呆呆地看着黑板上的使用须知,二脸懵逼......


敲黑板划重点时间!

人群TGI算法使用须知

  1. 人群TGI使用前提是拥有全量大盘数据作为参照;

  2. 人群TGI算法的大盘参照的选择:在业务场景下,优先使用大类目的大盘,例如A品牌使用护肤品消费大盘而非线上消费整体大盘,这样便于理解基于特定类目消费的特殊性;

  3. 人群TGI算法中减法与除法的选择:

    a) 除法:强调相对值差异,适用场景:各分组间占比差异较大,需突出占比小分组

    b) 减法:强调绝对值差异,适用场景:各分组间占比差异较小,需突出占比大分组

    在决定目标消费人群的场景下,我们需突出占比大人群,因此需选择减法;

  4.  除了人群TGI算法外还有品类TGI算法,用于判断特定群体对于购物篮中各品类的偏好度,且听下回分解。

D仔第一堂数据分析课就到此结束啦,如果你有更多想要了解的数据分析中的奥秘与窍门,记得找D仔噢。我们下堂课见。

(封面图面来源于网络)

点击关键词 看我们做过什么


45岁+女性消费  智能物流  母乳喂养研究  电商红人

互联网保险  卡通形象玩具  线上零食  在线票务  女性内衣

线上成人用品  运动消费之跑步  运动消费之人群  酒水消费

珠三角城市智能出行  互联网文娱  中国原创动漫

全球潮流生活  线上美妆消费大数据榜单  成都智能出行

重庆智能出行  2016中国互联网消费生态大数据报告

中国大文娱产业  家庭餐桌消费  进口消费  2016智能出行

在线外卖  线上儿童营养品  网络时尚消费  美妆个护消费

品质生活  厨房环境  90后分享经济  美白大数据  

IP消费大数据  城市休闲旅游出行

关于第一财经商业数据中心


第一财经商业数据中心(CBNData)是集数据可视化新闻、商业分析报告、数据自动化终端于一体的战略数据平台,自成立以来,已陆续发布《中国消费趋势报告2015》、《2016智能出行大数据报告》、《2016春节生活方式消费数据报告》、《2016中国美妆消费趋势报告》、《分享经济发展报告2016》、《2016在线外卖消费大数据洞察》、《2016中国智能物流大数据报告》、、《2016中国进口消费洞察报告》、《2017年中国年货大数据报告》、《2017中国家庭餐桌消费潮流报告》等100余份年度大数据报告,已在商业数据领域建立品牌优势,成为国内消费大数据研究的领军者。

友情链接