这个入口是全网人气新品池,我们今天所获取到的数据都是来源于这里。无论是C店还是B店,统统都有机会进来。这个平台最有价值的数据,就是可以告诉我们自己的新品究竟算是什么品质的,俗称档次,如图所示
不同档位的产品,,平台的推荐力度不同,并且这里是达人们经常选品的地方,如果能进来这里,实际上也算是多了一层曝光。
从营销的角度来讲,实际上让产品尽量得到足够多的曝光才是当务之急的事情。除了达人会主动推荐外,手淘首页也会进行推荐。
这份数据图表就是今天的案例13。重点部分内容就是这个散点图。我们之前做过很多散点图的同学应该都很清楚,散点图本身不难,但如果想要让散点图里头的数据都能够自动分好类的话,似乎不是那么容易的事情。
正如上面这张图所示,我把获取到的快选池新品数据,按不同的关键词进行分类,不同关键词下都可以将数据自动分成5个类别,也就是5种不同的数据。
之所以进行分类,是因为可以更好的区别不同类别的数据特征。因此,为了达到这个效果,我使用了聚类算法当中的K-means算法。不懂算法的同学不要紧,因为微软已经帮我们做好了一个专门来用进行数据挖掘的套件。我们暂且先来看看,究竟这些不同类别的数据都有什么特征。
数据源当中,我使用了品质档、价格、付款人数、所在地,通过K-means算法进行聚类,最后得到5个不同的类别。这些类别的名字分别从1-5进行取名。
通过这个关系图,我们可以很明显看得出来,实际上分类1的数据可以直接连接分类2、3、4、5,说明其重要性不言而喻。
暂且从分类1的角度来看数据,从上面这个图可以看出,分类1的一些特征,比如付款人数在0-299这个范围,价格150.0-361.4这个范围,其他的以此类推,最关键的地方在于这些数据背后的产品,基本上代表的就是第4档位的产品。
而实际上,这个档次的产品的销量是最好的。那么也就是我们这里的分类1的产品代表的就是最好的。
从散点图我们可以看出来,实际上这个分类被其他分类给包裹住了,哈哈。如果没有事先进行数据挖掘的话,我们将看到一堆小圈圈在浮动。
这个是分类特征图,基本上可以快速告诉我们数据的很多信息了。比如,档次上来讲就是集中在4和5,所在地上海就是个热门区域。
通过我们自己做的PBI图表,也是可以看得出来的,这里可能更加明显。
这个数据挖掘套件的好处在于,还能告诉我们不同类别的具体特征,比如从付款人数的平均值来看,分类1在117.07,分类2在64.22,分类3在152.17等等。这样子看数据是不是很方便了。
结合价格区间,我们也可以看出这些产品的价格段分布,基本上在106-375之间。因此,我们的定价这块应该着重考虑这个价格段的。
因为红酒属于标品,因此大品牌特别多,我们可以看出来官方超市是第一位的,其次是上面这些品牌。
最后,说一下这次用到的数据,主要来自于花老师自己研发的数据分析工具箱当中的其中一项功能,如图所示
目前为止,这个是第5代版本,一共有15个免费功能,当然随着我后面的不断更新,肯定会加入更多实用功能进来,尽请期待!
希望我今天的分享能对大家有所帮助,谢谢!不废话,关注知乎专栏花随花心,送数据分析工具箱!