问题1
1.对训练数据集进行数据清洗,处理缺失值和异常值。
2.采用散点图作为可视化手段。
3.采用皮尔逊相关系数进行相关性分析。
4.提出预防措施。
问题2
1.采用k-means聚类算法将洪水概率分为高中低三个群组。
2.通过线性回归模型计算特征权重。
3.选择特定的特征进行灵敏度分析。
STEP3:
问题3
1.划分训练集和测试集7:3。
2.构建神经网络模型:包括多个全连接层,ReLU激活函数和回归输出层。
3.模型训练:包括最大迭代次数,批次大小,初始学习率等。
4.评估模型:计算预测值与真实值之间的均方误差(MSE)。
5.结合问题1选择相关性最大的五个特征,重新训练神经网络模型并评估模型。
绘制一个自己的实际神经网络图
问题4
验证集(text.csv)在模型上进行预测,画直方图和折线图在分析是否服从正态分布。