目录
关于pip
卸载安装pip
更新pip
更换pip镜像源
清除缓存
更新指定包
指定清华镜像下载指定包
关于conda
更换清华镜像源
优先使用清华镜像
清除缓存
关于数据分析、数据挖掘常用
Matplotlib 3.6.0 文档(绘图实例)
jupyter字体问题
jupyter重装命令
jupyter中常见的数据处理命令
相关性判断
KNN模型常见代码
决策树常见代码
GDBC常见代码
KMeans模型常见代码
常见的评价指标
AUC
F1值
召回率
关于工程问题
setup.py安装问题
关于pip
卸载安装pip
python -m pip uninstall pip
python -m ensurepip
更新pip
pip install --upgrade pip
更换pip镜像源
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
清除缓存
pip cache purge
更新指定包
pip install -U pip setuptools
指定清华镜像下载指定包
pip install paddlepaddle==2.3.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
关于conda
更换清华镜像源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
优先使用清华镜像
conda config --prepend channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
conda config --prepend channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
清除缓存
conda clean --all
关于数据分析、数据挖掘常用
Matplotlib 3.6.0 文档(绘图实例)
Matplotlib 文档_Matplotlib 中文网
jupyter字体问题
plt.rcParams['font.sans-serif'] = [u'SimHei']
plt.rcParams['axes.unicode_minus'] = False
jupyter重装命令
pip install --upgrade --force-reinstall --no-cache-dir jupyter
jupyter中常见的数据处理命令
# 导入基本包
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
import matplotlib
plt.rcParams['font.sans-serif']=['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False # 用来正常显示负号
matplotlib.rc("font",family='Heiti TC')
%matplotlib inline# 文件导入,数据探索
df = pd.read_csv('./input/data.csv')
df.head(5) # 查看文件前5行
df.shape # 查看数据大小
df.info() # 查看数格式,空值等信息
df.describe() # 查看数据基本的统计信息# iloc[a:b,c:d]:取行索引从a到b-1,列索引从c到d-1的数据。
print(df.iloc[0:2,0:2])
print(df.iloc[0:2,0:2].values)
#Out1: 姓名 班级
# 0 小明 302
# 1 小王 303
#Out2:[['小明' 302]
# ['小王' 303]]df['属性'].value_counts() # 对于每种可能进行计数df['属性'].replace([情况1,情况2],[new情况1,new情况2],inplace=True) # inplace为True时,将新的数据替换原数据
相关性判断
# 热力图判断相关性
# https://blog.csdn.net/weixin_60737527/article/details/126048311plt.figure(figsize = (12,12))
df1 = df.iloc[:,[1,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23]].copy()
plt.title('连续型变量皮尔逊相关系数热力图',fontsize=20)
sns.heatmap(df1.corr(),annot = True,cmap="Blues",annot_kws={'fontsize':9})# 卡方统计判断相关性
KNN模型常见代码
机器学习之K近邻(KNN)模型_knn模型-CSDN博客
决策树常见代码
GDBC常见代码
KMeans模型常见代码
常见的评价指标
AUC
F1值
召回率
关于工程问题
setup.py安装问题
python setup.py install