Kaggle -- Titanic - Machine Learning from Disaster

新手kaggle之旅：1 . 泰坦尼克号

使用一个简单的决策树进行模型构建，达到75.8%的准确率（有点低，但是刚开始）

完整代码如下：

import pandas as pd
import numpy as npdf = pd.read_csv("train.csv")df.infolabel = ['Pclass','Sex','Age','SibSp','Fare','Embarked']x = df[label]
y = df['Survived']
print(x.loc[0])x['Embarked'] = x['Embarked'].map({'C': 1, 'Q': 2, 'S': 3})x['Sex'] = x['Sex'].map({'male': 1,'female' : 2})
print(x.loc[0])x = x.fillna(x.mean())import sklearn
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_scoretrain_x,test_x,train_y,test_y = train_test_split(x,y,test_size=0.2,random_state=42,shuffle=True)clf = DecisionTreeClassifier()
clf.fit(train_x,train_y)y_pred = clf.predict(test_x)accuracy = accuracy_score(y_pred,test_y)
print(f"Accuracy: {accuracy * 100:.2f}%")res = pd.read_csv('test.csv')
print(res.loc[0])res_x = res[label]
res_x['Embarked'] = res_x['Embarked'].map({'C': 1, 'Q': 2, 'S': 3})
res_x['Sex'] = res_x['Sex'].map({'male': 1,'female' : 2})
print(res_x.loc[0])res_x = res_x.fillna(res_x.mean())pred = clf.predict(res_x)
print(pred[0])ans = res[['PassengerId']].copy()
ans['Survived'] = predprint(ans.loc[0])ans.to_csv("ans.csv")

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/851503.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！