python在电商中的应用_基于Python的聚类方法在电商客户细分中的应用研究

第32卷第3期2018年5月 兰州文理学院学报(自然科学版) Journal of Lanzhou University of Arts and Science(Natural Sciences) Vol.32No.3May 2018 收稿日期:2018-03-10 基金项目:国家自然科学基金项目(61462057 );甘肃省高等学校自筹经费科研项目(2016B-115) 作者简介:贾桂霞(1972-),女,甘肃靖远人,副教授,硕士,主要研究方向为数据挖掘、嵌入式开发.E-mail: jiaguix- ia2004@163.com.   文章编号:2095-6991(2018)03-0055-04 基于Python的聚类方法在电商客户细分中的应用研究贾桂霞1,贾桂云2,李向伟1,张睿敏1 ( 1.兰州工业学院 软件工程学院,甘肃 兰州730050;2.兰州交通大学 土木工程学院,甘肃 兰州730070) 摘要:本文以Python语言及其机器学习库Scikit-Learn为工具,对某电商的客户数据采用K-Means聚类方法进行分类,建立客户价值评估模型.文中可视化地展示了聚类结果,并选用肘方法和轮廓系数对建立的模型的有效性做了定量分析.实验表明,利用Python的强大机器学习库可以轻松地实现数据的可视化和聚类结果评估. 关键词:客户细分;RFM 模型; Python;聚类分析中图分类号:TP391   文献标志码: A 0 引言 聚类分析是数据挖掘研究领域中一个非常重要的研究课题,它在电子商务、图像处理、模式识别、文本分类等领域有广泛的应用.而在电子商务中,基于客户价值进行客户细分是企业和学者关注的焦点[ 1-3],准确的客户分类结果成为企业优化 营销资源分配的重要依据. 本文以一家电商女装店的实际客户数据为例,使用Python的机器学习库Scikit-Learn,对其客户数据采用聚类的方法,进行客户分类.从而帮助企业制定优化的个性化服务方案,针对不同价值的客户采取不同的营销策略,实现企业利润最大化目标. 1 Python 及其扩展库简介 Python是一门简单易学且功能强大的编程语言.它拥有高效的数据结构,并且能用简单而又有效的方式进行面向对象编程.Python具有优雅的语法和动态类型,再结合它的解释性,使其在许多领域成为编写脚本或开发应用程序的理想语言.随着 NumPy,SciPy,Matplotlib和 Pandas等众多程序库的开发, Python在科学领域占据着越来越重要的地位,包括科学计算、数学建模、数据挖掘,可以预见,未来 Python将会成为科学领域 的主流编程语言[ 4]. 2 K- Means 聚类算法 聚类算法大体上可以分为以下几种:划分方法、层次方法、基于密度的方法、基于网格的方法和基于模型的方法[ 5].K-Mean算法是划分方法中的一种算法,由于其具有运行效率高的优点而在实际应用中经常被使用. 2.1 算法基本思想 K-Means聚类算法是典型的基于距离的聚类算法.算法的主要思想是先在需要分类的数据中寻找 K组数据作为初始聚类中心,然后计算其他样本点距离这 K个聚类中心的距离,将样本点归入与其距离最近的聚类中心,然后重新计算各簇中所有样本的中心点,作为新的聚类中心,继续以上步骤,直到新的聚类中心与上一次的聚类中心点不变或达到预定的迭代次数时,算法结束[ 6]. K-Means算法使用随机点作为初始中心点,若初始中心点选择不当,有可能导致簇效果不佳或产生收敛速度慢等问题.K-Means++算法提出使初始中心点尽量远离,它能

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/526874.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python怎样导入scrapy_(Python)在导入的模块scrapy中找不到任何项目

看起来你正在使用教程,但是你发布的内容并不完整,这使得你很难看到你的案例发生了什么。在我会仔细检查你的密码。如果看起来正确,请检查日志输出。在日志应该如下所示:[ ... Scrapy log here ... ]2016-09-19 12:09:27 [scrapy.c…

仪表盘刻度调整_惊艳了我的仪表盘 那些年我遇到最美的“面孔”

文| G哥汽仪表盘上的信息可以让车主们了解自己座驾的状况,出彩的仪表盘设计甚至能让消费者购车时对这款车一见倾心,回顾过往曾经惊艳到我们的那些酷炫仪表盘,那些面孔你是否还依稀还记得……汽车的什么地方最凸显其科技感?营造高科…

负数比较大小_人教版六下【第一单元】负数比较负数的大小

点击蓝色文字关注我们吧!主讲人邬卫老师,长沙市喻沛名师“错例研究”工作室成员。今天讲的微课是人教版小学数学六年级下册第一单元《负数》中有关“比较负数的大小”的典型错题分析。 摘要仿例组练 掌握了这些解题策略及方法之后,我们…

crossin的编程教室python入门_简单三步,用 Python 发邮件

0. 前言发送电子邮件是个很常见的开发需求。比如你写了个监控天气的脚本,发现第二天要下雨,或者网站上关注的某个商品降价了,就可以发个邮件到邮箱来提醒自己。使用 Python 脚本发送邮件并不复杂。不过由于各家邮件的发送机制和安全策略不同&…

中线提取算法_综述|线结构光中心提取算法研究发展

摘 要: 线结构光扫描是三维重建领域的关键技术。光条纹中心提取算法是决定线结构光三维重建精度以及光条纹轮廓定位准确性的重要因素。本文详细阐述了光条纹中心提取算法的理论基础及发展历程,将现有算法分为三类,传统光条纹中心提取算法、基于传统光条纹…

oracle并行parallel update两张表_Oracle与并行性 parallel

Oracle与并行性并行化操作能力是巨型数据库(VeryLargeDatabase,简称VLDB)最重要的特性之一。带有多个CPU的数据库服务器,也被称作SMP,目前是大多数数据库服务器的标准配置。当性能需求以及数据量不断的增长,更加需要使用多处理器和…

创建数组_如何创建数组

js数组js的数组不是典型的数组典型的数组元素的数据类型相同使用连续的内存储存通过数字下标获取元素但是js的数组不这样元素的数据类型可以不同内存不一定连续的(对象是随机储存的)不可以通过数字下标,而是通过字符串下标这意味着数组可以有…

node.js 实现udp传输_Node.js实战15:通过udp传输文件。

本文将要写一个udp服务器,和一个udp客户端,并实现客户端发送文件给服务器。服务器端代码如下:var dgram require("dgram");server();function server(){var socket dgram.createSocket("udp4");socket.on("messag…

mysql在单片机移植_移植MySQL到嵌入式ARM平台

因为MySQL5.5之后,编译是用的cmake不再使用./configure,因此,只好倒回支持./configure的版本来用,这里使用了文档上的5.1.51版本。进行如下步骤完成移植:1) 下载mysql5.1.51:http://www.mirrorservice.org/…

mysql镜像压缩包使用_如何连接docker的mysql镜像

展开全部推荐使用Dockerfile方式。服务的管理使用的是supervisord, 因为dockerfile里只会有一个cmd生效,如果我想62616964757a686964616fe58685e5aeb931333361326332通过ssh去管理容器还要有mysql服务的启动起来 cmd的方式就无法实现,当然容器不需要以sshd的方式去管…

mysql导出数据 程序_mysql导出数据

导出某库全表为SQL语句直接导出某库全表(包括表设计和表数据)为SQL语句mysqldump -h172.16.*.* -uroot -p somedatabase sometable > somewhere/table.sql导出某个表为特定文件格式导出某个表为特定文件格式(txt, xls)(只是数据)可以通过sql自行过滤某些数据mysql -h172.16.…

mysql通用日志不打印_解决logback不打印mybatis的SQL日志的问题

工作这么多年,今天还是因为Logback的这个问题稍微卡了一下,惭愧。问题描述:logback配置了如下信息:...此处省略File Appender内容${logbase}sql.%d{yyyy-MM-dd}.log30[%d{yyyy-MM-dd HH:mm:ss} [%t] [%X{traceId}] %5p %c:%L] %m%…

alibaba 实体转json_com.alibaba.fastjson 转换List Map等对象

原文:http://www.cnblogs.com/goody9807/p/4244862.html本文讲解2点:1. fastjson生成和解析json数据(举例:4种常用类型:JavaBean,List,List,List)2.通过一个android程序测试fastjson的用法。fastjson简介:Fastjson是一个Java语言编…

centos mysql rpm re_centos7和centos6.5环境rpm方式安装mysql5.7和mysql5.6详解

centos环境安装mysql5.7其实不建议安装mysql5.7 语法和配置可能和以前的版本区别较大,多坑,慎入1.yum方式安装(不推荐)a.安装mysql5.7 yum源centos6:wget dev.mysql.com/get/mysql-community-release-el6-5.noarch.rpmyum localinstall mysql-community-…

mysql galera haproxy_安装配置Haproxy代理MySQL Galera集群

这篇文章,我讲介绍如何为MariaDB Galera 集群添加负载均衡,大致步骤如下:确认所有Galera节点作为一个单一集群运行(所有节点都是主节点而且相互同步)安装Haproxy(你可以安装到独立的服务器或者应用服务器)配置集群监控检测脚本,用…

nvme固态硬盘开机慢_为何我使用了固态硬盘开机速度还是需要20-30秒

1、加速网上邻居在Windows XP中访问网上邻居是相当恼人的,系统会搜索自己的共享目录和可作为网络共享的打印机以及计划任务中和网络相关的计划任务,然后才显示出来,显然这样速度就会比Windows 9x中慢很多。其实这些功能我们并没有使用上&…

高性能mysql看不懂_高性能mysql笔记1

转载请注明&#xff1a;TheViper http://www.cnblogs.com/TheViper<>这本书写的真的很好&#xff0c;只可惜本屌不才&#xff0c;大部分都看不懂&#xff0c;暂且记下与mysql优化有关&#xff0c;对自己有用的东西。测试指标吞吐量吞吐量指的是单位时间内的事务处理数&am…

python 热词分析_Python笔记:热词分析2020-01-01

热词分析在公众趋势分析、舆情分析有很宽广的应用&#xff0c;我们来看看怎么从一个TXT文件中分析出文章的热词出来&#xff0c;我们采用流行的第三方“结巴”包来实现。首先安装第三方包(matplotlib&#xff0c;jieba&#xff0c;wordcloud&#xff0c;numpy)mmatplotlib主要来…

子进程会继承父进程的哪些内容_【学习教程】Node.js创建子进程方法

来源 | https://github.com/CommanderXL/biu-blog/issues/25exec其中exec可用于在指定的shell当中执行命令。不同参数间使用空格隔开&#xff0c;可用于复杂的命令。const { exec } require(child_process)exec(cat *.js bad_file | wc -l)exec方法用于异步创建一个新的子进程…

python元编程运用_Python 中的元编程

就像元数据是有关数据的数据一样&#xff0c;元编程就是编写用于操纵程序的某些程序。人们普遍认为&#xff0c;元程序就是生成其他程序的某些程序&#xff0c;但范式更加广泛。所有旨在自我读取、分析、转换或修改的程序都是元编程的范例。例如&#xff1a;领域特定语言 (DSL)…