数据预处理及训练结果评估

admin 2024年8月6日13:26:38评论1 views字数 1144阅读3分48秒阅读模式

数据预处理及训练结果评估

归一化(标准化)

1234
#库名from sklearn import preprocessing#使用方法X_scaled = preprocessing.scale(X)

K折验证

12345
from sklearn.model_selection import train_test_splitX, y = np.arange(10).reshape((5, 2)), range(5)X_train, X_test, y_train, y_test = train_test_split(    X, y, test_size=0.125, random_state=0) # 8折验证

准确率、召回率等

123456789101112131415161718192021
from sklearn.metrics import precision_scoreprint(precision_score(y_test,y_predict,average='micro'))#其中,average可选(常用):'''宏平均(Macro-averaging),是先对每一个类统计指标值,然后在对所有类求算术平均值。微平均(Micro-averaging),是对数据集中的每一个实例不分类别进行统计建立全局混淆矩阵,然后计算相应指标。'micro':    计算准确率    'macro':    计算每个标签的准确率    'weighted':   根据每个标签出现的数量按权重计算其准确率'binary':   * 计算二分类的准确率(预测为1的准确率)   * 在召回率中,则计算预测为1的占总数的百分比'''

召回率

123
from sklearn.metrics import recall_score recall_score(y_true, y_pred, average='micro')  # average和上一个类似

f1-score

12
f1score(y_true, y_pred, average='micro') # average和上一个类似

准确率(sklearn训练)

1
print(clf.score(x_train, y_train))

PCA降维

1234567891011
import sklearn.decomposition.pca as PCA#PCA降维mypca=PCA.PCA(n_components=2)x_test_de=mypca.fit_transform(x_test)'''其中explained_variance_:方差值explained_variance_ratio_:方差占比singular_values_:分解得到的奇异值(不是奇异向量)inverse_transform(X):按降维操作逆向升维'''

- source:hachp1.github.io

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2024年8月6日13:26:38
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   数据预处理及训练结果评估http://cn-sec.com/archives/3039037.html

发表评论

匿名网友 填写信息