700字范文 > 深入解析：svm支持向量机python代码

深入解析：svm支持向量机python代码

时间：2019-03-22 10:39:24

下面是使用 scikit-learn 库中的 SVM 模型的示例代码：

from sklearn import svmfrom sklearn.datasets import make_classification# generate some example dataX, y = make_classification(n_features=4, random_state=0)# fit an SVM model to the dataclf = svm.SVC(kernel='linear')clf.fit(X, y)# predict new dataprint(clf.predict([[0, 0, 0, 0]]))

文章目录

什么是支持向量机用 Python 实现 SVM使用 scikit-learn 库实现 SVM 分类多项式和高斯核函数的 SVM总结

什么是支持向量机

支持向量机（SVM），SVM 的目的是在数据集中找到一条最佳分隔超平面，使得在这个超平面两侧的数据分别属于不同的类别，且该超平面与最近的数据点之间的距离最大。

这些最近的数据点称为支持向量，因此该模型被称为支持向量机。

SVM 可以处理线性可分和线性不可分的情况，也可以通过使用核函数来处理非线性问题。

SVM 在解决分类问题时，通常是通过构造一个最大间隔分离超平面来实现的。

在回归问题中，SVM 通过构造一个回归超平面来实现预测。

SVM 的核心思想是利用数学方法将高维数据映射到低维空间，从而对不可分数据进行线性分类。

SVM 模型具有很好的泛化能力，可以解决高维数据的分类问题。

SVM 模型可以使用不同的核函数，如线性核、多项式核、高斯核等，这样可以解决非线性问题。此外，SVM 还可以处理大量特征数据，并具有高效的计算速度。

用 Python 实现 SVM

使用 scikit-learn 库实现 SVM 分类

import numpy as npfrom sklearn import datasetsfrom sklearn.model_selection import train_test_splitfrom sklearn.svm import SVCfrom sklearn.metrics import accuracy_score# 加载数据集iris = datasets.load_iris()X = iris["data"]y = iris["target"]# 划分训练集和测试集X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)# 创建 SVM 模型model = SVC(kernel='linear', C=1, random_state=0)# 训练模型model.fit(X_train, y_train)# 在测试集上进行预测y_pred = model.predict(X_test)# 计算预测精度accuracy = accuracy_score(y_test, y_pred)print("Accuracy:", accuracy)

首先使用load_iris()函数加载iris数据集，然后使用train_test_split()函数将数据集划分为训练集和测试集。接着，使用 SVC 函数创建一个 SVM 模型，并使用fit()函数在训练集上进行训练。最后，使用 predict 函数在测试集上进行预测，并使用accuracy_score()函数计算预测精度。

多项式和高斯核函数的 SVM

使用高斯核函数的 SVM 可以如下实现：

import numpy as npfrom sklearn import datasetsfrom sklearn.model_selection import train_test_splitfrom sklearn.svm import SVCfrom sklearn.metrics import accuracy_score# 加载数据集iris = datasets.load_iris()X = iris["data"]y = iris["target"]# 划分训练集和测试集X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)# 创建 SVM 模型，使用高斯核函数model = SVC(kernel='rbf', C=1, random_state=0)# 训练模型model.fit(X_train, y_train)# 在测试集上进行预测y_pred = model.predict(X_test)# 计算预测精度accuracy = accuracy_score(y_test, y_pred)print("Accuracy:", accuracy)

在上面的代码中，首先加载了scikit-learn中的iris数据集，并将其特征数据存储在X中，标签存储在y中。

使用train_test_split()函数划分出了训练集和测试集，并将其分别存储在X_train，X_test，y_train，y_test中。

创建了一个 SVM 模型，使用了高斯核函数（Radial basis function, RBF）。参数 C 用于控制对误差的惩罚程度，数值越大，惩罚程度越大。参数 gamma 控制高斯核函数的影响范围，数值越小，影响范围越广。

使用fit()方法训练模型。训练后，使用predict()方法在测试集上进行预测，并将预测结果存储在 y_pred 中。

最终的结果将通过accuracy_score()函数计算预测精度，并将其打印出来。

还可以调整 SVM 模型的超参数以改变模型的表现，例如C和gamma。通过调整超参数可以使模型更加适合数据，并提高模型的预测精度。