python找房源_Python租房信息分析!找到最适合自己的房源信息!

原标题:Python租房信息分析!找到最适合自己的房源信息!

租房信息分析

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

file_data = pd.read_csv("./data/链家北京租房数据.csv")

file_data

file_data.shape

file_data.head

file_data.info

file_data.describe

# 重复值

# file_data.duplicated

file_data = file_data.drop_duplicates

file_data.shape

# 空值处理

file_data = file_data.dropna

file_data.shape

删除空值,最好先做判断

空值处理

file_data = file_data.dropna

# 单个值实现

file_data["面积(㎡)"].values[0][:-2]

# 创建一个空的数组

data_new = np.array([])

data_area = file_data["面积(㎡)"].values

for i in data_area:

data_new = np.append(data_new, np.array(i[:-2]))

# 转换data_new中的数据类型

data_new = data_new.astype(np.float64)

file_data.loc[:, "面积(㎡)"] = data_new

house_data = file_data["户型"]

temp_list = []

for i in house_data:

# print(i)

new_info = i.replace("房间", "室")

temp_list.append(new_info)

file_data.loc[:, "户型"] = temp_list

房源数量、位置分布分析

file_data["区域"].unique

new_df = pd.DataFrame({"区域":file_data["区域"].unique, "数量":[0]*13})

# 获取每个区域房源数量

area_count = file_data.groupby(by="区域").count

new_df["数量"] = area_count.values

new_df.sort_values(by="数量", ascending=False)

户型数量分析

def all_house(arr):

key = np.unique(arr)

result = {}

for k in key:

mask = (arr == k)

arr_new = arr[mask]

v = arr_new.size

result[k] = v

return result

house_info = all_house(house_data)

去掉统计数量较少的值

# 去掉统计数量较少的值

house_data = dict((key, value) for key, value in house_info.items if value > 50)

show_houses = pd.DataFrame({"户型": [x for x in house_data.keys],

"数量": [x for x in house_data.values]})

图形展示

# 图形展示房屋类型

house_type = show_houses["户型"]

house_type_num = show_houses["数量"]

plt.barh(range(11), house_type_num)

plt.yticks(range(11), house_type)

plt.xlim(0, 2500)

plt.title("北京市各区域租房数量统计")

plt.xlabel("数量")

plt.ylabel("房屋类型")

# 给每个条上面添加具体数字

for x, y in enumerate(house_type_num):

# print(x, y)

plt.text(y+0.5, x-0.2, "%s" %y)

plt.show

for x, y in enumerate(house_type_num):

print(x, y)

拿到定点坐标位置,在坐标位置附上Y值

平均租金分析

df_all = pd.DataFrame({"区域": file_data["区域"].unique,

"房租总金额": [0]*13,

"总面积": [0]*13})

sum_price = file_data["价格(元/月)"].groupby(file_data["区域"]).sum

sum_area = file_data["面积(㎡)"].groupby(file_data["区域"]).sum

df_all["房租总金额"] = sum_price.values

df_all["总面积"] = sum_area.values

计算各个区域每平方米的房租

# 计算各个区域每平方米的房租

df_all["每平米租金(元)"] = round(df_all["房租总金额"] / df_all["总面积"], 2)

合并

df_merge = pd.merge(new_df, df_all)

图形可视化

# 图形可视化

num = df_merge["数量"]

price = df_merge["每平米租金(元)"]

lx = df_merge["区域"]

l = [i for i in range(13)]

fig = plt.figure(figsize=(10, 8), dpi=100)

# 显示折线图

ax1 = fig.add_subplot(111)

ax1.plot(l, price, "or-", label="价格")

for i, (_x, _y) in enumerate(zip(l, price)):

plt.text(_x+0.2, _y, price[i])

ax1.set_ylim([0, 160])

ax1.set_ylabel("价格")

plt.legend(loc="upper right")

# 显示条形图

ax2 = ax1.twinx

plt.bar(l, num, label="数量", alpha=0.2, color="green")

ax2.set_ylabel("数量")

plt.legend(loc="upper left")

plt.xticks(l, lx)

plt.show

创建x,y轴共享

增加刻度,字符串一一对应

面积基本分析

# 查看房屋的最大面积和最小面积

print('房屋最大面积是%d平米'%(file_data['面积(㎡)'].max))

print('房屋最小面积是%d平米'%(file_data['面积(㎡)'].min))

# 查看房租的最高值和最小值

print('房租最高价格为每月%d元'%(file_data['价格(元/月)'].max))

print('房屋最低价格为每月%d元'%(file_data['价格(元/月)'].min))

面积划分

# 面积划分

area_divide = [1, 30, 50, 70, 90, 120, 140, 160, 1200]

area_cut = pd.cut(list(file_data["面积(㎡)"]), area_divide)

area_cut_num = area_cut.describe

饼图展示

# 图像可视化

area_per = (area_cut_num["freqs"].values)*100

labels = ['30平米以下', '30-50平米', '50-70平米', '70-90平米',

'90-120平米','120-140平米','140-160平米','160平米以上']

plt.figure(figsize=(20, 8), dpi=100)

# plt.axes(aspect=1)

plt.pie(x=area_per, labels=labels, autopct="%.2f %%")

plt.legend

plt.show

plt.axes(aspect=1)

设置椭圆

责任编辑:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/244697.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

php 任意字符串_php 生成任意长度字符串的类(只含有数字 只含有字母 混合数字和字母)...

[php]代码库/** 生成随机字符串的类,默认只包含数字、大小写字母*/class randomString {/** 生成的字符串包含的字符设置*/const NUMERIC_ONLY 1; //只含有数字const LETTER_ONLY 2; //只含有字母const MIXED 3; //混合数字和字母/** 用户传入变量,分…

python添加时间戳_在python中添加时间戳

这两个解决方案(AFAIK)都可以在python的任何2.x版本上运行(因此保证了相当多的向后兼容性)仅依赖于regex库的实现:import redata 2011-03-07 0:27:412011-03-06 0:13:412011-03-05 0:17:402011-03-04 0:55:402011-05-16 0:55:402011-05-16 0:55:402011-07-16 0:55:…

php 删除某个文件夹,Php删除指定文件与文件夹的方法

例子:复制代码 代码示例://删除指定目录(文件夹)中的所有文件函数function delfile($dir) {if (is_dir($dir)) {$dhopendir($dir);//打开目录//列出目录中的所有文件并去掉 . 和 ..while (false ! ( $file readdir ($dh))) {if($file!"." && $fi…

python 按月份分组_django ORM queryset按月、周、TruncMonth分组

如何在Django ORM中对datetime字段进行group by查询?在型号:class test1(models.Model):id models.AutoField(primary_keyTrue, uniqueTrue, verbose_nameid)name models.CharField(verbose_namename, max_length200)cdate models.DateField(verbose_…

explode php 报错,ecshop在php5.4下报错怎么办

ecshop在php5.4下报错的解决办法:1、打开“cls_template”文件,并修改“$tag_selarray_shift(explode( ,$tag));”;2、修改“static”;3、修改cls_captcha文件。本教程操作环境:windows7系统、PHP5.4版、Dell G3电脑。…

python response.json()报错_解决Django响应JsonResponse返回json格式数据报错问题

解决Django响应JsonResponse返回json格式数据报错问题,给大家,报错,代码,图书,希望能解决Django响应JsonResponse返回json格式数据报错问题易采站长站,站长之家为您整理了解决Django响应JsonResponse返回json格式数据报错问题的相关内容。代码return JsonResponse({…

php 实例 规范,PHP开发规范实例详解

本文主要和大家分享PHP开发规范实例详解&#xff0c;希望能帮助到大家。源文件代码使用<?php开头 &#xff0c;忽略闭合标签?>文件格式必须是无BOM UTF-8格式一个文件只声明一种类型&#xff0c;如class和interface不能混写在一个源文件中缩进使用4个空格来缩进&#x…

sql 相加_SQL经典题型

SQL内容及常见面试题如下&#xff1a;以下为具体的面试题内容和答案一、简单查询题目查询姓“猴”的学生名单查询姓名中最后一个字是“猴”的学生名单查询姓名中带“猴”的学生名单查询姓“孟”老师的个数二、汇总分析题目查询课程号为“0002”的总成绩查询选了课程的学生人数查…

centos编译apache php mysql,在CentOS6.7中编译安装 apache php mysql

安装 开发工具 yum groupinstall "Development Tools" ------------------------------ tar -jxvf apr-1.5.2.tar.bz2 cd apr-1.5.2 ./configure --prefix/usr/local/apr make && make install ----------------- tar -jxvf apr-util-1.5.4.tar.bz2 cd apr-u…

python为什么虚部是j不是i_Python基础02 基本数据类型

简单的数据类型以及赋值变量不需要声明Python的变量不需要声明&#xff0c;你可以直接输入&#xff1a;>>>a 10那么你的内存里就有了一个变量a&#xff0c; 它的值是10&#xff0c;它的类型是integer (整数)。 在此之前你不需要做什么特别的声明&#xff0c;而数据类…

php array 如何访问,php – 如何访问$array [@key]值

我正在使用expedia API并且它运行良好,但我不知道如何访问这种特殊类型的数组键.回复如下$response stdClass Object([size] > 1[activePropertyCount] > 144[city] > 1[hotelId] > 12345[HotelSummary] > stdClass Object([order] > 0[ubsScore] > 10748…

基于stm32f429的手写识别_关注智能手机老年用户:百度输入法手写模型迎来重磅升级...

智能手机的快速普及让很多人都已经习惯于任何事情都用手机办理&#xff0c;不仅外出买东西、乘坐公共交通可以使用智能手机支付&#xff0c;同时一些与工作、政务相关的事情也可以在智能手机端完成&#xff0c;而社交工具更是让人们几乎已经不再使用短信、电话功能&#xff0c;…

如何安装ipython notebook_IPython notebook安装指导

1.环境准备yum -y install sqlite-devel #在安装Python之前执行&#xff0c;ipython notebook依赖sqlite执行pip install ipythonpip install notebookpip install pysqlite #ipython notebook 依赖sqlite数据库&#xff0c;必须安装后才能使用[错误处理]如果安装sqlite-devel后…

Html页面上输出不了PHP,在页面上直接输出未经解析的HTML源码

摘要&#xff1a;<?php $str6$我在\php中文网\学习 PHP 和 HTML &#xff0c;目前我还是&小白&。;echo $str6,;//\, 、$str6$我在\php中文网\学习 PHP 和 HTML &#xff0c;目前我还是&小白&。;echo $str6,;//\, 、标签、&等均被解析输出echo htmlspec…

python po设计模式_(Python)PO设计模式

无规矩不成方圆。编写代码也是&#xff0c;如果没有大概的框架&#xff0c;管理代码将会是一件很头疼的事。先看看笔者以前写的python脚本&#xff1a;如果只有一个用例&#xff0c;这样看着好像挺整洁的。但是当用例越来越多后&#xff0c;如果元素定位发生了改变&#xff0c;…

php strtok函数,strtok函数的使用示例

strtok函数是字符串函数库中的一个函数&#xff0c;函数原型如下&#xff1a;char *strtok(char s[], const char *delim);作用&#xff1a;分解字符串为一组字符串。s为要分解的字符串&#xff0c;delim为分隔符字符串。例如&#xff1a;"hello,hi:what?is!the.matter;&…

python 滑块验证码_python selenium 淘宝滑块验证码 问题

正常打开淘宝等页面&#xff0c;搜索商品和滑块验证码是没有问题的&#xff0c;但是用selenium打开&#xff0c;在多次翻页后出现的滑块验证码就总是失败&#xff0c;无论是手动滑还是代码控制都不可以&#xff0c;目前正在找解决办法。。。此问题针对多次翻页出现的滑块验证码…

php框架m方法详细,Thinkphp框架中D方法与M方法的区别是什么

Thinkphp框架中D方法与M方法的区别是什么发布时间&#xff1a;2021-02-06 23:09:38来源&#xff1a;亿速云阅读&#xff1a;69作者&#xff1a;小新小编给大家分享一下Thinkphp框架中D方法与M方法的区别是什么&#xff0c;相信大部分人都还不怎么了解&#xff0c;因此分享这篇文…

vue created 调用方法_vue 基础-生命周期 lifecycle 的执行顺序和作用

前言《vue 基础》系列是再次回炉 vue 记的笔记&#xff0c;除了官网那部分知识点外&#xff0c;还会加入自己的一些理解。(里面会有部分和官网相同的文案&#xff0c;有经验的同学择感兴趣的阅读)平时开发中&#xff0c;我真的不太使用生命周期相关的方法。但必须明确的是&…

php 获取图片字节,php内置函数获取图片类型-exif_imagetype

在PHP获取图片类型可以使用PHP内置函数中的 exif_imagetype预定义常量定义有以下常量&#xff0c;并代表了 exif_imagetype() 可能的返回值&#xff1a;图像类型常量 值 常量1 IMAGETYPE_GIF2 IMAGETYPE_JPEG3 IMAGETYPE_PNG4 IMAGETYPE_SWF5 IMAGETYPE_PSD6 IMAGETYPE_BMP7 IM…