朴素贝叶斯分类数据集
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
朴素贝叶斯分类数据集
朴素贝叶斯分类是一种基于贝叶斯定理的简单概率分类器。它假设特征之间是相互独立的(即朴素)。以下是一个使用朴素贝叶斯分类器的数据集示例:
数据集名称:Iris 数据集
数据集来源:Iris 数据集是一个常用的机器学习数据集,包含了150 个样本,每个样本有4 个特征(花萼长度、花萼宽度、花瓣长度、花瓣宽度)和3 个类别标签(山鸢尾、杂种鸢尾和维吉尼亚鸢尾)。
数据集格式:通常以CSV 格式存储,第一列是标签,后面几列是特征。
数据集示例:
```
标签,花萼长度,花萼宽度,花瓣长度,花瓣宽度
山鸢尾,5.1,3.5,1.4,0.2
杂种鸢尾,4.9,3.0,1.7,0.2
维吉尼亚鸢尾,5.6,3.9,5.1,1.8
...
```
这个数据集可以用Python 的Scikit-learn 库来加载和使用,其中包含了高斯朴素贝叶斯分类器、多项式朴素贝叶斯分类器和伯努利朴素贝叶斯分类器等不同的分类器模型。例如,使用高斯朴素贝叶斯分类器进行分类的代码示例如下:
```python
from sklearn.datasets import load_iris
from sklearn.naive_bayes import GaussianNB
# 加载数据集
iris = load_iris()
X = iris.data
y = iris.target
# 创建高斯朴素贝叶斯分类器对象gnb = GaussianNB()
# 使用训练数据训练分类器gnb.fit(X, y)
# 对测试数据进行预测
y_pred = gnb.predict(X)
```