文章目录
- 第1关:认识数据
- 第2关:数据预处理
- 第3关:数学成绩预测
第1关:认识数据
编程要求
根据提示,在右侧Begin-End区域补充代码,查看数据属性名称。
测试说明
程序会调用你实现的方法,查看数据属性名称,若与正确结果一致,则视为通关。
开始你的任务吧,祝你成功!
示例代码如下:
# -*- coding: utf-8 -*-def get_feature_names(df):'''input:df(DataFrame):输入数据output:feature_names'''#*********Begin*********# feature_names=df.keys()#********** End **********#return feature_names
第2关:数据预处理
编程要求
根据提示,在右侧编辑器补充代码,填补数据缺失值,且对数据进行MinMaxScaler标准化。
测试说明
程序会调用你的方法对数据进行处理,若处理后与正确数据一致,则视为通关。
示例代码如下:
# -*- coding: utf-8 -*-
from sklearn.preprocessing import Imputer,MinMaxScalerdef data_preprocessing(data):'''input:data(ndarray):待处理数据output:preprocessing_data(ndarray):预处理后数据'''#*********Begin*********#imp = Imputer(missing_values='NaN', strategy='mean', axis=0)data = imp.fit_transform(data)min_max_scaler = MinMaxScaler()preprocessing_data = min_max_scaler.fit_transform(data)#********** End **********#return preprocessing_data
第3关:数学成绩预测
编程要求
根据提示,在右侧编辑器补充代码,实现数学成绩分数预测方法。
测试说明
程序会调用你实现的方法对数据进行预测,若模型评估指标值大于0.95则视为通关。
开始你的任务吧,祝你成功!
示例代码如下:
# -*- coding: utf-8 -*-
from sklearn.linear_model import LinearRegressiondef lr(train_data,train_label,test_data):'''input:train_data(ndarray):训练数据train_label(ndarray):训练标签test_data(ndarray):测试数据output:predict(ndarray):测试数据预测标签'''#********* Begin *********#lr = LinearRegression()lr.fit(train_data,train_label)predict = lr.predict(test_data)#********** End **********#return predict