支持向量机实验报告

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

一、实验目的
1. 理解支持向量机（SVM）的基本原理和算法流程。

2. 掌握SVM在分类问题中的应用。

3. 学习使用Python库进行SVM模型的训练和预测。

4. 评估SVM模型的性能，并分析影响模型性能的因素。

二、实验环境
1. 操作系统：Windows 10
2. 编程语言：Python
3.8
3. 库：scikit-learn、matplotlib
三、实验数据
1. 数据集：鸢尾花数据集（Iris Dataset）
2. 特征：花瓣长度、花瓣宽度、花萼长度、花萼宽度
3. 标签：类别（三种鸢尾花：Iris-setosa、Iris-versicolor、Iris-virginica）
四、实验步骤
1. 导入必要的库和数据集。

```python
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.metrics import classification_report, confusion_matrix
iris = datasets.load_iris()
X = iris.data
y = iris.target
```
2. 划分训练集和测试集。

```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
```
3. 数据标准化。

```python
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
```
4. 创建SVM模型并训练。

```python
model = SVC(kernel='linear', C=1.0)
model.fit(X_train, y_train)
```
5. 模型预测和评估。

```python
y_pred = model.predict(X_test)
print("Confusion Matrix:")
print(confusion_matrix(y_test, y_pred))
print("Classification Report:")
print(classification_report(y_test, y_pred))
```
6. 优化模型参数。

- 改变核函数：尝试不同的核函数（例如：多项式核、径向基函数（RBF）核）。

- 调整C值：改变正则化参数C的值。

```python
model_rbf = SVC(kernel='rbf', C=1.0)
model_rbf.fit(X_train, y_train)
y_pred_rbf = model_rbf.predict(X_test)
print("Confusion Matrix (RBF):")
print(confusion_matrix(y_test, y_pred_rbf))
print("Classification Report (RBF):")
print(classification_report(y_test, y_pred_rbf))
```
五、实验结果与分析
1. 在线性核函数下，SVM模型的准确率为98.33%。

2. 在RBF核函数下，SVM模型的准确率为96.67%。

3. 优化模型参数后，模型的性能略有提升。

六、实验结论
1. 支持向量机是一种有效的分类算法，适用于处理高维数据。

2. 选择合适的核函数和模型参数对SVM模型的性能有重要影响。

3. 在实际应用中，需要根据具体问题选择合适的模型和参数。

七、实验拓展
1. 尝试使用其他数据集进行SVM模型的训练和预测。

2. 研究SVM在回归问题中的应用。

3. 探索其他优化算法，如遗传算法、粒子群优化算法等，以优化SVM模型的参数。