sklearn随机划分数据函数 -- train test split()

sklearn之train_test_split()

train_test_split函数用于将矩阵随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签

格式:

1
2
X_train,X_test, y_train, y_test=cross_validation.train_test_split
(train_data,train_target,test_size=0.3, random_state=0)

参数解释:

train_data:被划分的样本特征集

train_target:被划分的样本标签

test_size:如果是浮点数,在0-1之间,表示样本占比;如果是整数的话就是样本的数量

random_state:是随机数的种子

测试代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
import numpy as np
from sklearn.model_selection import train_test_split

X,Y=np.arange(24).reshape((8,3)),range(8)

print(X)

print(list(Y))

X_train,X_test,Y_train,Y_test=train_test_split(X,Y,test_size=0.25,random_state=0)

print(X_train)

print(X_test)

print(Y_train)

print(Y_test)

运行效果如图:

打赏
  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!
  • Copyrights © 2018-2021 LeFlacon

奶茶一杯 快乐起飞

支付宝
微信