推荐专题：

700字范文 > k折交叉验证python代码_K折交叉验证法原理及python实现

k折交叉验证python代码_K折交叉验证法原理及python实现

时间：2022-11-02 06:36:10

相关推荐

k折交叉验证python代码_K折交叉验证法原理及python实现

本文为原创文章，转载请注明出处！

在训练数据的过程或者参加数据比赛的时候，常常会遇到数据量不够大的情况，在一次比赛过程我学到一个小技巧—K折交叉验证法(k-fold CrossValidation)，下面和大家分享一下。

1 变形前的K折

在遇到K折交叉验证之前，往往使用的是简单交叉验证(hold -out cross validation)，也就是从全部的训练数据 D中随机选择 d的样例作为训练集 train，剩余的作为测试集 test(红色方框表示)。相信大家一定都非常熟悉，如果还不是很了解赶紧看看大牛Andrew Ng的课程吧。

在这里，数据都只被所用了一次，没有被充分利用

那么，怎样提高数据的利用率呢？

2 K折就是讲数据集切分成K小块，验证集和测试集相互形成补集，循环交替

纽约大学博士Seymour Geisser提出K折交叉验证法，具体步骤如下：

将数据集D随机分为k个包(这里假定K=6)。

每次将其中一个包作为测试集test，剩下k-1个包作为训练集train进行训练。

此时训练集train由D变成了K*D,

最后计算k次求得的分类率的平均值，作为该模型或者假设函数的真实分类率。

它有效的避免过学习以及欠学习状态的发生,最后得到的结果也比较具有说服性

你可能会问K选多少合适呢？

根据情况和个人喜好调节，常用的K值有3,6,10等。

3 python实现

在scikit-learn中有CrossValidation的实现代码，地址：scikit-learn官网crossvalidation文档

使用方法：

>>>import numpy as np

>>>from sklearn.model_selection import KFold

>>>X = ["a", "b", "c", "d"]

>>>kf = KFold(n_splits=2)

>>>for train, test in kf.split(X):

... print("%s %s" % (train, test))

[2 3] [0 1]

[0 1] [2 3]

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

相关阅读

k折交叉验证法python实现_Jason Brownlee专栏| 如何解决不平衡分类的k折交叉验证-不

2020-06-01

交叉验证的缘由原理以及四种交叉验证法（留出法 K-Fold 留一法 Bootstrap）

2023-07-10

k折交叉验证（原理+python实现）

2018-07-08

ML：模型训练/模型评估中常用的两种方法代码实现(留一法一次性切分训练和K折交叉验证

2023-01-17

扩展阅读

: Python那些事——60行Python代码实现多线程PDF转Word

: 一篇文章教你用11行Python代码实现神经网络

: 一篇文章教你用11行Python代码实现神经网络

: 利用Python基础代码语句实现2G时代文字小游戏（世界如此简单）

: 数字签名的原理是什么？这篇文章给你答案（java代码实现）

: 库教程论文实现这是一份超全的PyTorch资源列表（Github 2.2K星）

最近发布

沐浴阳光作文700字

2024-08-03

感恩教师节：致敬老师的节日随笔

2024-08-03

（收藏）梦回童年作文700字

2024-08-03

学生帮教计划700字

2024-08-03

科技与生活作文700字初三话题作文

2024-08-03

精编写景的700字励志日志

2024-08-02

推荐专题

我的家庭作文700字生命的意义作文700字读后感700字初中写景作文700字感恩有你作文700字昆虫记读后感700字初中这样的人让我感动700字挥手自兹去作文700字争论作文700字初一读书征文700字暑假生活日记700字幸福是什么作文700字积极向上的作文700字我的家乡作文700字六一儿童节的作文700字