机器学习模板

根据心情补充，语言都是Python

hash，把所有的文本转化成数字

from sklearn.preprocessing import LabelEncoder
for c in train.columns:if train[c].dtype == 'object':lbl = LabelEncoder()lbl.fit(list(train[c].values) + list(test[c].values))train[c] = lbl.transform(list(train[c].values))test[c] = lbl.transform(list(test[c].values))

Xgboost训练

'''Train the xgb model then predict the test data'''

xgb_params = {'n_trees': 520, 'eta': 0.0045,'max_depth': 4,'subsample': 0.93,'objective': 'reg:linear', 'eval_metric': 'rmse','base_score': y_mean, # base prediction = mean(target)'silent': 1
}
# NOTE: Make sure that the class is labeled 'class' in the data filedtrain = xgb.DMatrix(train.drop('y', axis=1), y_train)
dtest = xgb.DMatrix(test)num_boost_rounds = 1250
# train model
model = xgb.train(dict(xgb_params, silent=0), dtrain, num_boost_round=num_boost_rounds)
y_pred = model.predict(dtest)

OneHot矩阵转换

enc = OneHotEncoder(handle_unknown='ignore')
enc=enc.fit(pd.concat([X[categorical],X_test[categorical]]))
X_cat_sparse=enc.transform(X[categorical])
X_test_cat_sparse=enc.transform(X_test[categorical])

转载于:https://www.cnblogs.com/qscqesze/p/7053740.html

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/455414.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！