版本0.18#

警告

Scikit-learn 0.18是scikit-learn支持Python 2.6的最后一个主要版本。scikit-learn的后续版本将需要Python 2.7或更高版本。

版本0.18.2#

June 20, 2017

Changelog#

修复了与NumPy 1.13.0的兼容性： #7946 #8355 通过 Loic Esteve .
示例中的微小兼容性更改 #9010 #8040 #9149 .

代码贡献者#

Aman Dalmia、Loic Esteve、Nate Guerin、Sergei Lebedev

版本0.18.1#

November 11, 2016

Changelog#

增强功能#

改进 sample_without_replacement 在大多数情况下，利用numpy.random.permutation来提高速度。因此，对于固定的随机状态，此版本中的样本可能会有所不同。受影响的估计值：
这也影响了 datasets.make_classification 法

Bug修复#

修复问题 min_grad_norm 和 n_iter_without_progress 参数未被使用 manifold.TSNE . #6497 通过 Sebastian Säger
修复svm决策值的错误 decision_function_shape 是 ovr 在 svm.SVC . svm.SVC 的decision_function在0.17.0到0.18.0版本中不正确。 #7724 通过 Bing Tian Dai
属性 explained_variance_ratio 的 discriminant_analysis.LinearDiscriminantAnalysis 用SVD和Eigen求解器计算的长度现在是相同的。 #7632 通过 JPFrancoia
修复问题单变量特征选择其中评分功能不接受多标签目标。 #7676 通过 Mohammed Affan
修复了调用时设置参数的问题 fit 多次 feature_selection.SelectFromModel . #7756 通过 Andreas Müller
修复问题 partial_fit 方法 multiclass.OneVsRestClassifier 当使用的类数量 partial_fit 少于数据中的班级总数。 #7786 通过 Srivatsan Ramesh
修复问题 calibration.CalibratedClassifierCV 其中数据每个类别的概率之和不为1，并且 CalibratedClassifierCV 现在处理训练集的类数少于总数据的情况。 #7799 通过 Srivatsan Ramesh
修复一个错误， sklearn.feature_selection.SelectFdr 没有完全实施Benjamini-Hochberg程序。它以前选择的功能可能比应该选择的功能少。 #7490 通过 Peng Meng .
sklearn.manifold.LocallyLinearEmbedding 现在可以正确处理integer输入。 #6282 通过 Jake Vanderplas .
The min_weight_fraction_leaf parameter of tree-based classifiers and regressors now assumes uniform sample weights by default if the sample_weight argument is not passed to the fit function. Previously, the parameter was silently ignored. #7301 by Nelson Liu.
数字问题 linear_model.RidgeCV 在中心数据上时 n_features > n_samples. #6178 by Bertrand Thirion
树分裂标准类的克隆/腌制现在是内存安全的 #7680 通过 Ibraim Ganiev .
修复了一个错误， decomposition.NMF 设置其 n_iters_ 中属性 transform() . #7553 通过 Ekaterina Krivich .
sklearn.linear_model.LogisticRegressionCV now correctly handles string labels. #5874 by Raghav RV.
修复了一个错误， sklearn.model_selection.train_test_split 提出了一个错误时 stratify 是字符串标签列表。 #7593 通过 Raghav RV .
修复了一个错误， sklearn.model_selection.GridSearchCV 和 sklearn.model_selection.RandomizedSearchCV 由于腌制错误，无法腌制 np.ma.MaskedArray . #7594 通过 Raghav RV .
All cross-validation utilities in sklearn.model_selection now permit one time cross-validation splitters for the cv parameter. Also non-deterministic cross-validation splitters (where multiple calls to split produce dissimilar splits) can be used as cv parameter. The sklearn.model_selection.GridSearchCV will cross-validate each parameter setting on the split produced by the first split call to the cross-validation splitter. #7660 by Raghav RV.
修复错误 preprocessing.MultiLabelBinarizer.fit_transform 返回了无效的CSR矩阵。 #7750 通过 CJ Carey .
修复了一个错误， metrics.pairwise.cosine_distances 可以返回一个小的负距离。 #7732 通过 Artsion .

API变更摘要#

树木和森林

The min_weight_fraction_leaf parameter of tree-based classifiers and regressors now assumes uniform sample weights by default if the sample_weight argument is not passed to the fit function. Previously, the parameter was silently ignored. #7301 by Nelson Liu.
树分裂标准类的克隆/腌制现在是内存安全的。 #7680 通过 Ibraim Ganiev .

线性、核心化和相关模型

长度 explained_variance_ratio 的 discriminant_analysis.LinearDiscriminantAnalysis Eigen和MVD求解器均发生了变化。该属性的长度现在为min（n_components，n_classes - 1）。 #7632 通过 JPFrancoia
数字问题 linear_model.RidgeCV 在中心数据上时 n_features > n_samples . #6178 通过 Bertrand Thirion

版本0.18#

September 28, 2016

模型选择增强和API更改#

The model_selection module

新模块 sklearn.model_selection ，它将以前的功能组合在一起 sklearn.cross_validation , sklearn.grid_search 和 sklearn.learning_curve ，引入了新的可能性，例如嵌套交叉验证和使用Pandas更好地操作参数搜索。

许多事情都会保持不变，但也有一些关键差异。请阅读以下内容，了解有关这些变化的更多信息。
Data-independent CV splitters enabling nested cross-validation

中定义的新交叉验证拆分器 sklearn.model_selection ，不再使用任何依赖于数据的参数进行初始化，例如 y .相反，他们暴露了一个 split 接收数据并为不同拆分生成器的方法。

此更改使得可以使用交叉验证拆分器来执行嵌套交叉验证，其促进因素如下 model_selection.GridSearchCV 和 model_selection.RandomizedSearchCV 公用事业。
The enhanced cv_results_ attribute

新 cv_results_ 属性（of model_selection.GridSearchCV 和 model_selection.RandomizedSearchCV ）引入代替 grid_scores_ 属性是1D数组的dict，每个数组中的元素对应于参数设置（即搜索候选项）。

的 cv_results_ 可以轻松导入Dict pandas 作为 DataFrame 用于探索搜索结果。

的 cv_results_ 数组包括每个交叉验证拆分的分数（具有诸如 'split0_test_score' ），以及它们的平均值 ('mean_test_score' ）和标准差 ('std_test_score' ).

搜索候选者的排名（基于其平均交叉验证分数）可在 cv_results_['rank_test_score'] .

每个参数的参数值单独存储为numpy掩蔽对象数组。如果相应的参数不适用，则该搜索候选项的值将被屏蔽。此外，所有参数指令的列表存储在 cv_results_['params'] .
Parameters n_folds and n_iter renamed to n_splits

某些参数名称已更改： n_folds 新参数 model_selection.KFold , model_selection.GroupKFold (see下面是名称变更），并且 model_selection.StratifiedKFold 现已更名为 n_splits .的 n_iter 参数 model_selection.ShuffleSplit ，新班级 model_selection.GroupShuffleSplit 和 model_selection.StratifiedShuffleSplit 现已更名为 n_splits .
Rename of splitter classes which accepts group labels along with data

交叉验证拆分器 LabelKFold , LabelShuffleSplit , LeaveOneLabelOut 和 LeavePLabelOut 已更名为 model_selection.GroupKFold , model_selection.GroupShuffleSplit , model_selection.LeaveOneGroupOut 和 model_selection.LeavePGroupsOut 分别

请注意， model_selection.LeavePGroupsOut .
Fit parameter labels renamed to groups

的 labels 中参数 split 新重命名的拆分器的 model_selection.GroupKFold , model_selection.LeaveOneGroupOut , model_selection.LeavePGroupsOut , model_selection.GroupShuffleSplit 被重命名为 groups 遵循他们的班级名称的新命名法。
Parameter n_labels renamed to n_groups

参数 n_labels 在新更名的 model_selection.LeavePGroupsOut 被改变为 n_groups .
训练分数和时间信息

cv_results_ 还包括每个交叉验证拆分的训练分数（带有诸如 'split0_train_score' ），以及它们的平均值 ('mean_train_score' ）和标准差 ('std_train_score' ).为了避免评估培训成绩的成本，设置 return_train_score=False .

此外，还可以在所有交叉验证拆分中对模型进行拆分、训练和评分所需时间的平均值和标准差 'mean_time' 和 'std_time' 分别

Changelog#

新功能#

分类器和回归器

高斯过程模块已经重新实现，现在通过以下方式提供分类和回归估计器： gaussian_process.GaussianProcessClassifier 和 gaussian_process.GaussianProcessRegressor .除其他外，新实现支持内核工程、基于梯度的超参数优化或GP先验和GP后验的函数采样。提供了大量的文档和示例。通过 Jan Hendrik Metzen .
添加了新的监督学习算法： Multi-layer Perceptron #3204 通过 Issam H. Laradji
添加 linear_model.HuberRegressor 一个对异常值鲁棒的线性模型。 #5291 通过 Manoj Kumar .
添加了 multioutput.MultiOutputRegressor 元估计量它通过对每个输出拟合一个回归量，将单输出回归量转换为多输出回归量。通过 Tim Head .

其他估计数

新 mixture.GaussianMixture 和 mixture.BayesianGaussianMixture 取代以前的混合模型，采用更快的推理以获得更合理的结果。 #7295 通过 Wei Xue 和 Thierry Guillemot .
类 decomposition.RandomizedPCA 现在已被考虑到 decomposition.PCA 并且可以用参数调用 svd_solver='randomized' .的默认数量 n_iter 为 'randomized' 已更改为4。PCA的旧行为通过以下方式恢复 svd_solver='full' .一个附加的求解程序调用 arpack 并执行截断（非随机）的奇异值分解。默认情况下，根据输入的大小和请求的组件数量选择最佳求解器。 #5299 通过 Giorgio Patrini .
增加了两个互信息估计功能： feature_selection.mutual_info_classif 和 feature_selection.mutual_info_regression .这些功能可以用于 feature_selection.SelectKBest 和 feature_selection.SelectPercentile 作为评分功能。通过 Andrea Bravi 和 Nikolay Mayorov .
添加了 ensemble.IsolationForest 基于随机森林的异常检测类。通过 Nicolas Goix .
添加 algorithm="elkan" 到 cluster.KMeans 实现Elkan的快速K-Means算法。通过 Andreas Müller .

模型选择与评估

添加 metrics.fowlkes_mallows_score ，Fowlkes Malows指数，衡量一组点的两个集群的相似性 Arnaud Fouchet 和 Thierry Guillemot .
添加 metrics.calinski_harabaz_score ，它计算Calinski和Harabaz分数，以评估所得的一组点的聚集。通过 Arnaud Fouchet 和 Thierry Guillemot .
添加了新的交叉验证拆分器 model_selection.TimeSeriesSplit 来处理时间序列数据。 #6586 通过 YenChen Lin
交叉验证迭代器被来自 sklearn.model_selection ，允许嵌套交叉验证。看到模型选择增强和API更改 for more information. #4294 通过 Raghav RV .

增强功能#

树木和合奏

添加了新的拆分标准 tree.DecisionTreeRegressor ，平均绝对误差。该标准也可以用于 ensemble.ExtraTreesRegressor , ensemble.RandomForestRegressor ，以及梯度增强估计器。 #6667 通过 Nelson Liu .
Added weighted impurity-based early stopping criterion for decision tree growth. #6954 by Nelson Liu
随机森林、额外树和决策树估计器现在有了一种方法 decision_path 它返回树中样本的决策路径。通过 Arnaud Joly .
添加了一个新示例，揭示了决策树结构。通过 Arnaud Joly .
随机森林、额外树、决策树和梯度提升估计器接受参数 min_samples_split 和 min_samples_leaf 以训练样本的百分比提供。通过 yelite 和 Arnaud Joly .
梯度提升估计器接受参数 criterion 指定构建决策树中使用的分裂标准。 #6667 通过 Nelson Liu .
内存占用减少（有时会大大减少）， ensemble.bagging.BaseBagging 以及从中继承的类，即， ensemble.BaggingClassifier , ensemble.BaggingRegressor ，而且 ensemble.IsolationForest ，通过动态生成属性 estimators_samples_ 只有在需要的时候。通过 David Staub .
添加 n_jobs 和 sample_weight 参数 ensemble.VotingClassifier 以并行地适应基本估计量。 #5805 通过 Ibraim Ganiev .

线性、核心化和相关模型

在 linear_model.LogisticRegression ，SAG求解器现在可用于多项情况。 #5251 通过 Tom Dupre la Tour .
linear_model.RANSACRegressor , svm.LinearSVC 和 svm.LinearSVR 现在支持 sample_weight .通过 Imaculate .
添加参数 loss 到 linear_model.RANSACRegressor 来测量每次试验样本的误差通过 Manoj Kumar .
用等序回归预测样本外事件 (isotonic.IsotonicRegression ）现在速度快得多（在使用合成数据的测试中超过1000倍）。通过 Jonathan Arfa .
保序回归 (isotonic.IsotonicRegression ）现在使用更好的算法来避免 O(n^2) behavior in pathological cases, and is also generally faster (##6691). By Antony Lee .
naive_bayes.GaussianNB 现在通过参数接受与数据无关的类先验 priors .通过 Guillaume Lemaitre .
linear_model.ElasticNet 和 linear_model.Lasso 目前拥有 np.float32 输入数据而不将其转换为 np.float64 .这可以减少内存消耗。 #6913 通过 YenChen Lin .
semi_supervised.LabelPropagation 和 semi_supervised.LabelSpreading 现在除了字符串之外还接受任意内核函数 knn 和 rbf . #5762 通过 Utkarsh Upadhyay .

分解、多维学习和集群

添加 inverse_transform 函数来 decomposition.NMF 计算原始形状的数据矩阵。通过 Anish Shah .
cluster.KMeans 和 cluster.MiniBatchKMeans 目前拥有 np.float32 和 np.float64 输入数据而无需对其进行转换。这可以通过使用 np.float32 . #6846 通过 Sebastian Säger 和 YenChen Lin .

预处理和特征选择

preprocessing.RobustScaler 现在接受 quantile_range 参数. #5929 通过 Konstantin Podshumok .
feature_extraction.FeatureHasher now accepts string values. #6173 by Ryad Zenine and Devashish Deshpande.
关键字参数现在可以提供给 func 在 preprocessing.FunctionTransformer 借助于所述 kw_args 参数.通过 Brian McFee .
feature_selection.SelectKBest 和 feature_selection.SelectPercentile 现在接受以X、y作为输入并仅返回分数的分数函数。通过 Nikolay Mayorov .

模型评估和元估计量

multiclass.OneVsOneClassifier 和 multiclass.OneVsRestClassifier 现在支持 partial_fit .通过 Asish Panda 和 Philipp Dowling .
添加了对替代或禁用的支持 pipeline.Pipeline 和 pipeline.FeatureUnion 部件采用 set_params 提供动力的界面 sklearn.grid_search. See 使用Pipeline和GridSearchCV选择降维 By Joel Nothman 和 Robert McGibbon .
新 cv_results_ 属性 model_selection.GridSearchCV （和 model_selection.RandomizedSearchCV ）可以很容易地作为一种输入到熊猫身上 DataFrame . Ref 模型选择增强和API更改 for more information. #6697 通过 Raghav RV .
的推广 model_selection.cross_val_predict .可以传递方法名称，例如 predict_proba 用于交叉验证框架而不是默认框架 predict .通过 Ori Ziv 和 Sears Merritt .
每个搜索候选人的培训分数和培训时间以及评分现已在 cv_results_ 独裁。看到了模型选择增强和API更改 for more information. #7325 通过 Eugene Chen 和 Raghav RV .

Metrics

添加 labels 标志以 metrics.log_loss 当中的类数量 y_true 和 y_pred 不同。 #7239 通过 Hong Guangguo 的帮助下 Mads Jensen 和 Nelson Liu .
支持集群评估中的稀疏应急矩阵 (metrics.cluster.supervised) to scale to a large number of clusters. #7419 by Gregory Stupp and Joel Nothman .
添加 sample_weight 参数以 metrics.matthews_corrcoef .通过 Jatin Shah 和 Raghav RV .
加快 metrics.silhouette_score 通过使用载体化操作。通过 Manoj Kumar .
添加 sample_weight 参数以 metrics.confusion_matrix .通过 Bernardo Stein .

杂项

添加 n_jobs 参数以 feature_selection.RFECV 计算测试分数平行折叠。通过 Manoj Kumar
Codebase不包含C/C ++ cython生成的文件：它们是在构建过程中生成的。分发包仍将包含生成的C/C ++文件。通过 Arthur Mensch .
减少32位浮点输入阵列的内存使用 utils.sparse_func.mean_variance_axis 和 utils.sparse_func.incr_mean_variance_axis 通过支持cython融合类型。通过 YenChen Lin .
的 ignore_warnings 现在接受类别参数以仅忽略指定类型的警告。通过 Thierry Guillemot .
添加参数 return_X_y 和返回类型 (data, target) : tuple 选项 datasets.load_iris 数据集 #7049 , datasets.load_breast_cancer 数据集 #7152 , datasets.load_digits 数据集， datasets.load_diabetes 数据集， datasets.load_linnerud 数据集， datasets.load_boston 数据集 #7154 通过 Manvendra Singh .
简化 clone 函数，建议不支持修改中参数的估计器 __init__ . #5540 通过 Andreas Müller .
当在与估计器训练版本不同的版本中解压缩scikit-learn估计器时， UserWarning 是提出的，看 the documentation on model persistence 了解更多详细信息。 (#7248 ）由 Andreas Müller .

Bug修复#

树木和合奏

随机森林，额外的树，决策树和梯度提升将不再接受 min_samples_split=1 因为至少需要2个样本来分裂决策树节点。通过 Arnaud Joly
ensemble.VotingClassifier 现在提高 NotFittedError 如果 predict , transform 或 predict_proba 被调用到非匹配估计量上。通过 Sebastian Raschka .
修复错误 ensemble.AdaBoostClassifier 和 ensemble.AdaBoostRegressor 如果 random_state 固定 (#7411 ).通过 Joel Nothman .
修复带有随机化的合奏中的错误，其中合奏不会设置 random_state 基于管道或类似嵌套中的基本估计器。 (#7411 ).注意，结果 ensemble.BaggingClassifier ensemble.BaggingRegressor , ensemble.AdaBoostClassifier 和 ensemble.AdaBoostRegressor 现在将与以前的版本不同。通过 Joel Nothman .

线性、核心化和相关模型

Fixed incorrect gradient computation for loss='squared_epsilon_insensitive' in linear_model.SGDClassifier and linear_model.SGDRegressor (#6764). By Wenhua Yang.
修复错误 linear_model.LogisticRegressionCV 哪里 solver='liblinear' 不接受 class_weights='balanced . (#6817 ).通过 Tom Dupre la Tour .
修复错误 neighbors.RadiusNeighborsClassifier 当标记异常值并指定权重函数时发生错误 (#6902 ). 通过 LeonieBorne .
修复 linear_model.ElasticNet 稀疏决策函数，用于在多输出情况下将输出与密集进行匹配。

分解、多维学习和集群

decomposition.RandomizedPCA 默认数量的 iterated_power 是4而不是3 #5141 通过 Giorgio Patrini .
utils.extmath.randomized_svd 默认情况下执行4次迭代，而不是0次迭代。在实践中，这足以在存在噪音的情况下获得真实特征值/载体的良好逼近。当 n_components 小 (< .1 * min(X.shape) ) n_iter 设置为7，除非用户指定更高的数字。这提高了精度与几个组件。 #5299 通过 Giorgio Patrini .
组件之间的白化/非白化不一致 decomposition.PCA 和 decomposition.RandomizedPCA (now考虑到PCA，请参阅新功能）已修复。 components_ 储存时不需要美白。 #5299 通过 Giorgio Patrini .
修复了 manifold.spectral_embedding 其中未规范化拉普拉斯矩阵的对角线被错误地设置为1。 #4995 通过 Peter Fischer .
Fixed incorrect initialization of utils.arpack.eigsh on all occurrences. Affects cluster.bicluster.SpectralBiclustering, decomposition.KernelPCA, manifold.LocallyLinearEmbedding, and manifold.SpectralEmbedding (#5012). By Peter Fischer.
Attribute explained_variance_ratio_ calculated with the SVD solver of discriminant_analysis.LinearDiscriminantAnalysis now returns correct results. By JPFrancoia

预处理和特征选择

preprocessing.data._transform_selected now always passes a copy of X to transform function when copy=True (#7194). By Caio Oliveira.

模型评估和元估计量

model_selection.StratifiedKFold 现在，如果单个类的所有n_labels都小于n_folds，则会出现错误。 #6182 通过 Devashish Deshpande .
修复了 model_selection.StratifiedShuffleSplit 在某些边缘情况下，训练和测试样本可能会重叠，请参阅 #6121 了解更多详细信息。通过 Loic Esteve .
Fix in sklearn.model_selection.StratifiedShuffleSplit to return splits of size train_size and test_size in all cases (#6472). By Andreas Müller.
的交叉验证 multiclass.OneVsOneClassifier 和 multiclass.OneVsRestClassifier 现在可以使用预先计算的内核。 #7350 通过 Russell Smith .
Fix incomplete predict_proba method delegation from model_selection.GridSearchCV to linear_model.SGDClassifier (#7159) by Yichuan Liu.

Metrics

修复错误 metrics.silhouette_score 其中大小为1的集群被错误地评分。他们应该得到0分。通过 Joel Nothman .
修复错误 metrics.silhouette_samples 因此，它现在适用于任意标签，而不仅仅是从0到n_clusters - 1的标签。
修复了如果超出集群应急单元格，预期和调整后的相互信息不正确的错误 2**16 .通过 Joel Nothman .
metrics.pairwise_distances 现在在需要时将数组转换为布尔数组 scipy.spatial.distance . #5460 通过 Tom Dupre la Tour .
修复稀疏输入支持 metrics.silhouette_score 以及示例示例/文本/document_clustering. py。通过 YenChen Lin .
metrics.roc_curve 和 metrics.precision_recall_curve 不再圆 y_score 创建ROC曲线时的值;这给分数差异很小的用户带来了问题 (#7353 ).

杂项

model_selection.tests._search._check_param_grid 现在可以与扩展/实现的所有类型一起正常工作 Sequence （字符串除外），包括范围（Python 3.x）和xRange（Python 2.x）。 #7323 作者：维亚切斯拉夫·科瓦列夫斯基。
utils.extmath.randomized_range_finder 当请求多次乘势迭代时，在数字上更加稳定，因为它默认应用LU正规化。如果 n_iter<2 数字问题不太可能，因此不应用正常化。还有其他规范化选项可用： 'none', 'LU' 和 'QR' . #5141 通过 Giorgio Patrini .
修复某些格式的错误 scipy.sparse 矩阵以及以它们为参数的估计量无法传递给 base.clone .通过 Loic Esteve .
datasets.load_svmlight_file 现在能够读取长int QID值。 #7101 通过 Ibraim Ganiev .

API变更摘要#

线性、核心化和相关模型

residual_metric 一直受到抨击 linear_model.RANSACRegressor .使用 loss 而不是.通过 Manoj Kumar .
访问公共属性 .X_ 和 .y_ 一直受到抨击 isotonic.IsotonicRegression .通过 Jonathan Arfa .

分解、多维学习和集群

老 mixture.DPGMM 被废弃，转而支持新的 mixture.BayesianGaussianMixture (with参数 weight_concentration_prior_type='dirichlet_process' ).新类解决了旧类的计算问题，并比以前更快地使用Dirichlet过程计算高斯混合物。 #7295 通过 Wei Xue 和 Thierry Guillemot .
老 mixture.VBGMM 被废弃，转而支持新的 mixture.BayesianGaussianMixture (with参数 weight_concentration_prior_type='dirichlet_distribution' ).新类解决了旧类的计算问题，并且比以前更快地计算变分贝叶斯高斯混合。 #6651 通过 Wei Xue 和 Thierry Guillemot .
老 mixture.GMM 被废弃，转而支持新的 mixture.GaussianMixture .新类比以前更快地计算高斯混合物，并且一些计算问题已经得到解决。 #6666 通过 Wei Xue 和 Thierry Guillemot .

模型评估和元估计量

的 sklearn.cross_validation, sklearn.grid_search and sklearn.learning_curve have been deprecated and the classes and functions have been reorganized into the sklearn.model_selection module. Ref 模型选择增强和API更改 for more information. #4294 by Raghav RV .
的 grid_scores_ 属性 model_selection.GridSearchCV 和 model_selection.RandomizedSearchCV 已放弃支持该属性 cv_results_ . Ref 模型选择增强和API更改 for more information. #6697 通过 Raghav RV .
的参数 n_iter 或 n_folds 旧CV分配器被新参数取代 n_splits 因为它可以提供一致且明确的界面来表示训练测试拆分的数量。 #7187 通过 YenChen Lin .
classes 参数已重命名为 labels 在 metrics.hamming_loss . #7260 通过 Sebastián Vanrell .
拆分器类 LabelKFold , LabelShuffleSplit , LeaveOneLabelOut 和 LeavePLabelsOut 已更名为 model_selection.GroupKFold , model_selection.GroupShuffleSplit , model_selection.LeaveOneGroupOut 和 model_selection.LeavePGroupsOut 分别还有参数 labels 在 split method of the newly renamed splitters model_selection.LeaveOneGroupOut and model_selection.LeavePGroupsOut is renamed to groups. Additionally in model_selection.LeavePGroupsOut, the parameter n_labels is renamed to n_groups. #6660 by Raghav RV .
的错误和丢失名称 scoring 参数现在以以下方式为开头 'neg_' ，例如 neg_mean_squared_error .无前置版本已被弃用，并将在0.20版本中删除。 #7261 通过 Tim Head .

代码贡献者#

Aditya Joshi, Alejandro, Alexander Fabisch, Alexander Loginov, Alexander Minyushkin, Alexander Rudy, Alexandre Abadie, Alexandre Abraham, Alexandre Gramfort, Alexandre Saint, alexfields, Alvaro Ulloa, alyssaq, Amlan Kar, Andreas Mueller, andrew giessel, Andrew Jackson, Andrew McCulloh, Andrew Murray, Anish Shah, Arafat, Archit Sharma, Ariel Rokem, Arnaud Joly, Arnaud Rachez, Arthur Mensch, Ash Hoover, asnt, b0noI, Behzad Tabibian, Bernardo, Bernhard Kratzwald, Bhargav Mangipudi, blakeflei, Boyuan Deng, Brandon Carter, Brett Naul, Brian McFee, Caio Oliveira, Camilo Lamus, Carol Willing, Cass, CeShine Lee, Charles Truong, Chyi-Kwei Yau, CJ Carey, codevig, Colin Ni, Dan Shiebler, Daniel, Daniel Hnyk, David Ellis, David Nicholson, David Staub, David Thaler, David Warshaw, Davide Lasagna, Deborah, definitelyuncertain, Didi Bar-Zev, djipey, dsquareindia, edwinENSAE, Elias Kuthe, Elvis DOHMATOB, Ethan White, Fabian Pedregosa, Fabio Ticconi, fisache, Florian Wilhelm, Francis, Francis O'Donovan, Gael Varoquaux, Ganiev Ibraim, ghg, Gilles Louppe, Giorgio Patrini, Giovanni Cherubin, Giovanni Lanzani, Glenn Qian, Gordon Mohr, govin-vatsan, Graham Clenaghan, Greg Reda, Greg Stupp, Guillaume Lemaitre, Gustav Mörtberg, halwai, Harizo Rajaona, Harry Mavroforakis, hashcode55, hdmetor, Henry Lin, Hobson Lane, Hugo Bowne-Anderson, Igor Andriushchenko, Imaculate, Inki Hwang, Isaac Sijaranamual, Ishank Gulati, Issam Laradji, Iver Jordal, jackmartin, Jacob Schreiber, Jake Vanderplas, James Fiedler, James Routley, Jan Zikes, Janna Brettingen, jarfa, Jason Laska, jblackburne, jeff levesque, Jeffrey Blackburne, Jeffrey04, Jeremy Hintz, jeremynixon, Jeroen, Jessica Yung, Jill-Jênn Vie, Jimmy Jia, Jiyuan Qian, Joel Nothman, johannah, John, John Boersma, John Kirkham, John Moeller, jonathan.striebel, joncrall, Jordi, Joseph Munoz, Joshua Cook, JPFrancoia, jrfiedler, JulianKahnert, juliathebrave, kaichogami, KamalakerDadi, Kenneth Lyons, Kevin Wang, kingjr, kjell, Konstantin Podshumok, Kornel Kielczewski, Krishna Kalyan, krishnakalyan3, Kvle Putnam, Kyle Jackson, Lars Buitinck, ldavid, LeiG, LeightonZhang, Leland McInnes, Liang-Chi Hsieh, Lilian Besson, lizsz, Loic Esteve, Louis Tiao, Léonie Borne, Mads Jensen, Maniteja Nandana, Manoj Kumar, Manvendra Singh, Marco, Mario Krell, Mark Bao, Mark Szepieniec, Martin Madsen, MartinBpr, MaryanMorel, Massil, Matheus, Mathieu Blondel, Mathieu Dubois, Matteo, Matthias Ekman, Max Moroz, Michael Scherer, michiaki ariga, Mikhail Korobov, Moussa Taifi, mrandrewandrade, Mridul Seth, nadya-p, Naoya Kanai, Nate George, Nelle Varoquaux, Nelson Liu, Nick James, NickleDave, Nico, Nicolas Goix, Nikolay Mayorov, ningchi, nlathia, okbalefthanded, Okhlopkov, Olivier Grisel, Panos Louridas, Paul Strickland, Perrine Letellier, pestrickland, Peter Fischer, Pieter, Ping-Yao, Chang, practicalswift, Preston Parry, Qimu Zheng, Rachit Kansal, Raghav RV, Ralf Gommers, Ramana.S, Rammig, Randy Olson, Rob Alexander, Robert Lutz, Robin Schucker, Rohan Jain, Ruifeng Zheng, Ryan Yu, Rémy Léone, saihttam, Saiwing Yeung, Sam Shleifer, Samuel St-Jean, Sartaj Singh, Sasank Chilamkurthy, saurabh.bansod, Scott Andrews, Scott Lowe, seales, Sebastian Raschka, Sebastian Saeger, Sebastián Vanrell, Sergei Lebedev, shagun Sodhani, shanmuga cv, Shashank Shekhar, shawpan, shengxiduan, Shota, shuckle16, Skipper Seabold, sklearn-ci, SmedbergM, srvanrell, Sébastien Lerique, Taranjeet, themrmax, Thierry, Thierry Guillemot, Thomas, Thomas Hallock, Thomas Moreau, Tim Head, tKammy, toastedcornflakes, Tom, TomDLT, Toshihiro Kamishima, tracer0tong, Trent Hauck, trevorstephens, Tue Vo, Varun, Varun Jewalikar, Viacheslav, Vighnesh Birodkar, Vikram, Villu Ruusmann, Vinayak Mehta, walter, waterponey, Wenhua Yang, Wenjian Huang, Will Welch, wyseguy7, xyguo, yanlend, Yaroslav Halchenko, yelite, Yen, YenChenLin, Yichuan Liu, Yoav Ram, Yoshiki, Zheng RuiFeng, zivori, Óscar Nájera