用于数据挖掘的鸢尾花数据

合集下载

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集引言概述:鸢尾花数据集是机器学习领域中最经典的数据集之一。

它包含了三个不同种类的鸢尾花的测量数据,被广泛应用于分类算法的训练和评估。

本文将详细介绍鸢尾花数据集的来源、特征以及其在机器学习中的应用。

一、鸢尾花数据集的来源1.1 数据集的背景鸢尾花数据集最早由英国统计学家罗纳德·费舍尔于1936年收集并提出。

他通过测量鸢尾花的萼片长度、萼片宽度、花瓣长度和花瓣宽度,将鸢尾花分为三个不同的物种:山鸢尾(Setosa)、变色鸢尾(Versicolor)和维吉尼亚鸢尾(Virginica)。

1.2 数据集的特点鸢尾花数据集共有150个样本,每个样本包含了四个特征的测量值和对应的物种类别。

这些特征值是连续的实数,可以用来描述鸢尾花的形态特征。

数据集中的样本数量相对较小,但足够用来进行机器学习算法的训练和评估。

1.3 数据集的可用性鸢尾花数据集是公开可用的,可以从多个机器学习库中获取,如scikit-learn等。

这使得研究人员和开发者可以方便地使用这个数据集来验证算法的性能和比较不同模型的表现。

二、鸢尾花数据集的特征2.1 萼片长度(Sepal Length)萼片长度是指鸢尾花的萼片(sepals)的长度,以厘米为单位。

它是描述鸢尾花大小的重要特征之一。

2.2 萼片宽度(Sepal Width)萼片宽度是指鸢尾花的萼片的宽度,以厘米为单位。

它也是描述鸢尾花形态的重要特征之一。

2.3 花瓣长度(Petal Length)花瓣长度是指鸢尾花的花瓣(petals)的长度,以厘米为单位。

花瓣长度通常是区分不同鸢尾花物种的重要特征。

2.4 花瓣宽度(Petal Width)花瓣宽度是指鸢尾花的花瓣的宽度,以厘米为单位。

花瓣宽度也是描述鸢尾花形态的重要特征之一。

三、鸢尾花数据集在机器学习中的应用3.1 分类算法的训练鸢尾花数据集被广泛应用于分类算法的训练。

通过使用已知的鸢尾花数据集作为训练样本,机器学习算法可以学习到不同物种之间的特征差异,从而实现对未知鸢尾花的分类。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集引言概述:鸢尾花数据集是机器学习领域中常用的一个数据集,由英国统计学家Fisher于1936年首次引入。

该数据集包含了三个不同种类的鸢尾花的测量数据,是一个用于分类问题的经典数据集。

本文将从数据集的背景介绍、数据集的特征、数据集的应用以及数据集的局限性等方面进行详细阐述。

正文内容:1. 数据集的背景介绍1.1 鸢尾花数据集的来源鸢尾花数据集是由Fisher在研究鸢尾花的遗传学特性时采集而来。

他采集了150朵鸢尾花的样本,每朵鸢尾花都测量了其萼片长度、萼片宽度、花瓣长度和花瓣宽度等四个特征。

1.2 数据集的种类鸢尾花数据集包含了三个不同种类的鸢尾花,分别是山鸢尾(Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。

每一个种类的鸢尾花在特征上都有一定的差异。

1.3 数据集的规模鸢尾花数据集共有150个样本,每一个样本有四个特征。

数据集被广泛应用于机器学习和模式识别领域,成为了分类问题的经典数据集之一。

2. 数据集的特征2.1 萼片长度和宽度萼片是鸢尾花的外部结构之一,其长度和宽度是鸢尾花的重要特征之一。

通过测量萼片的长度和宽度,可以判断鸢尾花的种类。

2.2 花瓣长度和宽度花瓣是鸢尾花的另一个重要特征,其长度和宽度也可以用于鸢尾花的分类。

不同种类的鸢尾花在花瓣的长度和宽度上有一定的差异。

2.3 特征之间的关系鸢尾花数据集中的四个特征之间存在一定的相关性。

例如,花瓣的长度和宽度往往呈正相关关系,而萼片的长度和宽度则没有明显的相关性。

3. 数据集的应用3.1 机器学习算法的训练和评估鸢尾花数据集被广泛应用于机器学习算法的训练和评估。

研究人员可以利用该数据集进行分类算法的训练,并通过对算法的准确率、召回率等指标进行评估。

3.2 特征选择和降维鸢尾花数据集的特征丰富多样,可以用于特征选择和降维算法的研究。

通过对特征的选择和降维,可以提高分类算法的效果和运行效率。

Iris数据集

Iris数据集

Iris数据集Iris数据集是机器学习领域中最经典的数据集之一,常被用来进行分类问题的研究和算法评估。

该数据集由英国统计学家Ronald Fisher于1936年采集整理,包含了150个样本和4个特征。

本文将详细介绍Iris数据集的背景信息、数据结构和常见的应用场景。

1. 背景信息:Iris数据集是基于鸢尾花的特征测量而创建的。

该数据集包含了三个不同品种的鸢尾花:山鸢尾(setosa)、变色鸢尾(versicolor)和维吉尼亚鸢尾(virginica)。

每一个品种的鸢尾花都有50个样本,共计150个样本。

这些鸢尾花腔本是在20世纪30年代早期从美国加利福尼亚州的高山地区采集得到的。

2. 数据结构:Iris数据集的每一个样本都有四个特征,分别是:- 萼片长度(sepal length):以厘米为单位,表示鸢尾花萼片的长度。

- 萼片宽度(sepal width):以厘米为单位,表示鸢尾花萼片的宽度。

- 花瓣长度(petal length):以厘米为单位,表示鸢尾花花瓣的长度。

- 花瓣宽度(petal width):以厘米为单位,表示鸢尾花花瓣的宽度。

这四个特征被用作输入变量,用于预测鸢尾花的品种。

品种的类别被编码为三个离散值:0表示山鸢尾,1表示变色鸢尾,2表示维吉尼亚鸢尾。

3. 应用场景:Iris数据集在机器学习和统计学的研究中被广泛使用,特殊是在分类问题的研究和算法评估中。

以下是一些常见的应用场景:- 分类算法评估:由于Iris数据集的简单性和可解释性,它常被用来评估不同分类算法的性能。

研究人员可以使用该数据集来比较不同算法在分类任务上的准确度、召回率、精确度等指标。

- 特征选择:Iris数据集的特征维度较小,适适合于特征选择算法的研究。

研究人员可以通过比较不同特征选择算法的效果,来确定哪些特征对于鸢尾花品种分类最为重要。

- 可视化技术研究:Iris数据集的四个特征可以方便地用于可视化技术的研究。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集鸢尾花数据集是机器学习领域中常用的数据集之一,用于分类问题的实验和算法验证。

该数据集由英国统计学家罗纳德·费舍尔于1936年收集整理,是机器学习领域中最经典的数据集之一。

鸢尾花数据集包含了150个样本,每个样本有4个特征,分别是花萼长度、花萼宽度、花瓣长度和花瓣宽度。

这四个特征都以厘米为单位进行测量。

根据这四个特征,每个样本被分为三个类别之一:山鸢尾(Iris setosa)、变色鸢尾(Iris versicolor)和维吉尼亚鸢尾(Iris virginica)。

下面是鸢尾花数据集中的一些样本示例:样本1:花萼长度:5.1cm,花萼宽度:3.5cm,花瓣长度:1.4cm,花瓣宽度:0.2cm,类别:山鸢尾样本2:花萼长度:4.9cm,花萼宽度:3.0cm,花瓣长度:1.4cm,花瓣宽度:0.2cm,类别:山鸢尾样本3:花萼长度:7.0cm,花萼宽度:3.2cm,花瓣长度:4.7cm,花瓣宽度:1.4cm,类别:变色鸢尾样本4:花萼长度:6.4cm,花萼宽度:3.2cm,花瓣长度:4.5cm,花瓣宽度:1.5cm,类别:变色鸢尾样本5:花萼长度:6.3cm,花萼宽度:3.3cm,花瓣长度:6.0cm,花瓣宽度:2.5cm,类别:维吉尼亚鸢尾鸢尾花数据集的目标是通过这些特征来预测鸢尾花的类别。

这个数据集被广泛应用于机器学习算法的训练、测试和评估。

常见的应用包括分类算法、聚类算法、特征选择和降维算法等。

在使用鸢尾花数据集时,通常采用交叉验证的方法来评估算法的性能。

数据集会被划分为训练集和测试集,其中训练集用于训练模型,测试集用于评估模型的性能。

常见的评估指标包括准确率、精确率、召回率和F1值等。

除了在机器学习算法中的应用,鸢尾花数据集也被广泛应用于数据可视化和数据挖掘领域。

通过对这些数据进行可视化分析,可以更好地理解不同类别之间的差异和相似性。

总结来说,鸢尾花数据集是一个经典的用于分类问题的数据集,包含了150个样本和4个特征,用于训练、测试和评估机器学习算法的性能。

sas数据挖掘实例

sas数据挖掘实例

sas数据挖掘实例数据挖掘是从大数据中获取有价值的信息的过程。

SAS作为业内领先的数据分析软件,具有强大的数据挖掘功能。

本文将通过一个SAS数据挖掘实例,来介绍SAS数据挖掘的相关知识和技术。

实例简述本次实例选取了一个经典的数据集:鸢尾花数据集(Iris Dataset)。

该数据集是由英国统计学家和生物学家Ronald Fisher在1936年收集而来,由三种不同的鸢尾花,每种鸢尾花各50个样本,共计150个样本。

每个样本都有四个特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度。

我们的目标是使用SAS对该数据集进行数据挖掘,从中分析出不同鸢尾花的数据模式和特征。

数据预处理在进行数据挖掘之前,我们需要对原始数据进行处理,使其符合数据挖掘的要求。

首先,我们需要将数据导入到SAS软件中。

SAS支持导入多种类型的数据,如CSV、Excel、TXT等。

由于我们的鸢尾花数据集为CSV格式,因此我们可以使用以下代码将其导入SAS:```SASproc import datafile='iris.csv'out=irisdbms=csv;getnames=yes;run;```代码中,我们使用了`proc import`命令,将CSV格式的`iris`文件导入到SAS中,并将其保存为SAS数据集`iris`。

同时,我们使用了`getnames=yes`参数,表示将文件的第一行作为变量名导入。

接下来,我们需要查看数据集的基本信息。

SAS提供了多种查看数据集信息的方法,此处我们使用`proc contents`命令可以查看数据集的变量名、变量类型、样本数等信息。

```SASproc contents data=iris;run;```运行后,SAS会在日志窗口输出数据集的基本信息。

我们发现该数据集共有150个样本,每个样本有四个连续型变量:花萼长度、花萼宽度、花瓣长度和花瓣宽度。

数据可视化在进行数据挖掘之前,我们还可以使用SAS提供的可视化工具对数据集进行探索分析。

kmeans应用案例

kmeans应用案例

kmeans应用案例K-means 应用案例。

K-means 是一种常见的聚类算法,它可以对数据进行分组,找出数据中的相似性,并将数据划分为不同的类别。

在实际应用中,K-means 算法被广泛应用于数据挖掘、模式识别、图像分割等领域。

下面将介绍 K-means 算法在实际案例中的应用。

首先,我们来看一个简单的 K-means 应用案例,鸢尾花数据集。

鸢尾花数据集是一个经典的数据集,其中包含了鸢尾花的四个特征,花萼长度、花萼宽度、花瓣长度和花瓣宽度。

我们可以利用 K-means 算法对这些特征进行聚类,找出不同种类的鸢尾花。

通过 K-means 聚类分析,我们可以将鸢尾花数据集分为三个类别,分别对应于不同的鸢尾花种类。

这样的聚类结果有助于我们更好地理解鸢尾花数据的特点,对鸢尾花进行分类和识别。

除了鸢尾花数据集,K-means 算法还可以应用于其他领域。

例如,在市场营销中,我们可以利用 K-means 算法对客户进行分群,找出具有相似行为和偏好的客户群体,从而针对不同的客户群体制定个性化的营销策略。

在医学影像分析中,K-means 算法可以用于图像分割,将医学影像中的不同组织和结构进行分离,有助于医生更准确地诊断疾病。

在互联网广告投放中,K-means 算法可以对用户进行行为分析,找出具有相似兴趣和偏好的用户群体,从而提高广告的投放效果。

总的来说,K-means 算法是一种简单而有效的聚类算法,它在实际应用中具有广泛的应用前景。

通过对数据进行聚类分析,我们可以更好地理解数据的特点,发现数据中的规律和趋势,为决策提供有力的支持。

希望本文介绍的 K-means 应用案例能够帮助大家更好地理解和应用这一算法。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集鸢尾花数据集是一份经典的机器学习数据集,用于分类问题的研究和实践。

该数据集由英国统计学家罗纳德·费舍尔于1936年整理,是机器学习领域中最常用的数据集之一。

本文将按照标准格式介绍鸢尾花数据集的相关信息,包括数据集的来源、数据的特征、数据的标签、数据集的应用以及数据集的评估指标。

1. 数据集的来源:鸢尾花数据集最早由罗纳德·费舍尔采集于20世纪30年代,其目的是通过测量鸢尾花的花萼长度、花萼宽度、花瓣长度和花瓣宽度等特征来区分不同种类的鸢尾花。

费舍尔采集了150朵鸢尾花的数据,每朵花采集了这四个特征的测量值,并且将每朵花所属的鸢尾花种类记录下来,共包括三个种类:山鸢尾(Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。

2. 数据的特征:鸢尾花数据集包含了四个特征,分别是花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)和花瓣宽度(petal width)。

这些特征的单位为厘米(cm),是通过测量鸢尾花的实际尺寸得到的。

3. 数据的标签:鸢尾花数据集的标签是鸢尾花的种类,共有三个类别:山鸢尾(Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。

每一个样本都有相应的标签,用于指示该样本属于哪个种类。

4. 数据集的应用:鸢尾花数据集是机器学习领域中最常用的数据集之一,被广泛应用于分类问题的研究和实践。

通过对鸢尾花数据集的分析和建模,可以训练出一个分类器,用于自动识别新的鸢尾花腔本所属的种类。

这对于植物学研究、生态学研究以及农业领域的品种鉴定等具有重要意义。

5. 数据集的评估指标:在使用鸢尾花数据集进行分类任务时,常用的评估指标包括准确率(accuracy)、精确率(precision)、召回率(recall)和F1值(F1-score)等。

Iris数据集

Iris数据集

Iris数据集引言概述:Iris数据集是机器学习领域中最常用的数据集之一。

它包含了三种不同种类的鸢尾花(Iris setosa、Iris virginica和Iris versicolor)的150个样本,每个样本有四个特征(花萼长度、花萼宽度、花瓣长度和花瓣宽度)。

这个数据集被广泛应用于分类算法的训练和评估。

一、数据集的背景和来源1.1 数据集的背景Iris数据集最早由英国统计学家和生物学家Ronald Fisher于1936年引入。

他通过测量鸢尾花的花萼和花瓣的特征,成功地将三种不同的鸢尾花进行了分类。

1.2 数据集的来源Fisher采集的Iris数据集是通过在英国哥伦比亚大学的花园中收集的鸢尾花样本得到的。

他测量了每个样本的花萼和花瓣的长度和宽度,并记录下来。

1.3 数据集的受欢迎程度由于Iris数据集的简单性和可解释性,以及其在分类问题中的广泛应用,它成为了机器学习领域中最受欢迎的数据集之一。

许多学术论文和教科书都使用这个数据集来演示分类算法的效果。

二、数据集的特征和标签2.1 数据集特征Iris数据集的每个样本有四个特征,分别是花萼长度、花萼宽度、花瓣长度和花瓣宽度。

这些特征是连续的实数值。

2.2 数据集标签每个样本都有一个标签,表示鸢尾花的种类。

数据集中一共有三种鸢尾花:Iris setosa、Iris virginica和Iris versicolor。

这些标签是离散的分类值。

2.3 数据集的样本数量Iris数据集一共包含150个样本,其中每个类别均匀地分布,每个类别有50个样本。

三、数据集的应用领域3.1 机器学习算法的训练和评估Iris数据集广泛应用于机器学习算法的训练和评估。

由于数据集具有良好的特征和标签,它可以用于分类算法的训练和测试,以验证算法的准确性和性能。

3.2 特征选择和特征提取Iris数据集也被用于特征选择和特征提取的研究。

研究人员可以通过分析不同特征对鸢尾花种类的影响,来选择最重要的特征或提取新的特征。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集引言概述:鸢尾花数据集是机器学习领域中常用的一个数据集,由英国统计学家Fisher于1936年收集整理而成。

该数据集包含了三个不同种类的鸢尾花的测量数据,是分类问题中的经典案例。

本文将对鸢尾花数据集进行详细介绍和分析,以便读者更好地了解和应用该数据集。

一、数据集概述1.1 数据来源鸢尾花数据集是由Fisher在20世纪30年代通过对鸢尾花进行测量所得。

他收集了三个品种的鸢尾花,分别是山鸢尾(setosa)、变色鸢尾(versicolor)和维吉尼亚鸢尾(virginica)。

1.2 数据特征该数据集包含了150个样本,每个样本有四个特征,分别是花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)和花瓣宽度(petal width)。

这些特征用于描述鸢尾花的形态特征。

1.3 数据标签每个样本都有一个标签,用于表示鸢尾花的品种。

标签分为三类,分别对应三个品种:0代表山鸢尾,1代表变色鸢尾,2代表维吉尼亚鸢尾。

二、数据集的应用2.1 机器学习算法训练鸢尾花数据集作为一个经典的分类问题案例,常被用于机器学习算法的训练和测试。

通过对样本数据的学习,算法可以根据鸢尾花的特征来预测其所属的品种,从而实现分类任务。

2.2 特征选择和提取对鸢尾花数据集进行特征选择和提取,可以帮助我们识别出对分类任务最具有区分性的特征。

通过对特征的分析和比较,我们可以选择出最重要的特征,提高分类模型的准确性和效果。

2.3 数据可视化鸢尾花数据集的特征维度较低,可以方便地进行数据可视化。

通过绘制散点图、箱线图等图表,我们可以直观地观察到不同品种鸢尾花在特征上的分布情况,进一步了解其特征之间的关系。

三、数据集的分析3.1 数据分布情况通过统计和可视化分析,我们可以了解鸢尾花数据集中各个品种的样本数量分布情况。

这有助于我们判断数据集是否存在类别不平衡的问题,并采取相应的处理措施。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集鸢尾花数据集是一种常用的机器学习数据集,广泛应用于分类算法的训练和评估。

该数据集由英国统计学家Ronald Fisher于1936年采集,并成为模式识别领域中最重要的数据集之一。

鸢尾花数据集包含了150个样本,每一个样本有4个特征,分别是花萼长度、花萼宽度、花瓣长度和花瓣宽度。

以下是对鸢尾花数据集的详细描述:1. 数据集概述:鸢尾花数据集包含了三个不同种类的鸢尾花,分别是Setosa、Versicolor和Virginica。

每一个类别都有50个样本。

数据集中的样本按照类别顺序罗列,即前50个样本属于Setosa,接下来的50个样本属于Versicolor,最后50个样本属于Virginica。

2. 特征描述:2.1 花萼长度(Sepal Length):以厘米(cm)为单位,表示鸢尾花的花萼的长度。

2.2 花萼宽度(Sepal Width):以厘米(cm)为单位,表示鸢尾花的花萼的宽度。

2.3 花瓣长度(Petal Length):以厘米(cm)为单位,表示鸢尾花的花瓣的长度。

2.4 花瓣宽度(Petal Width):以厘米(cm)为单位,表示鸢尾花的花瓣的宽度。

3. 数据集的应用:鸢尾花数据集常用于机器学习算法的训练和评估。

通过对鸢尾花数据集的特征进行分析和建模,可以实现对新样本的分类。

例如,可以使用分类算法对新的鸢尾花腔本进行分类,判断其属于Setosa、Versicolor还是Virginica。

4. 数据集的可视化:通过对鸢尾花数据集进行可视化,可以更直观地了解样本之间的分布情况。

可以使用散点图或者箱线图等方式展示不同类别鸢尾花在各个特征上的分布情况。

通过可视化,可以观察到不同类别之间在特征上的差异,进一步辅助分类算法的选择和优化。

5. 数据集的预处理:在使用鸢尾花数据集进行机器学习任务之前,通常需要对数据进行预处理。

预处理的步骤包括数据清洗、特征选择、特征缩放等。

例如,可以通过去除缺失值、处理异常值等方式进行数据清洗;可以通过相关性分析、主成份分析等方式进行特征选择;可以通过归一化、标准化等方式进行特征缩放。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集鸢尾花数据集是机器学习领域中常用的数据集之一,被广泛应用于分类算法的训练和测试。

本文将介绍鸢尾花数据集的背景和特点,并详细阐述其数据结构、数据预处理、特征选择、模型训练和性能评估等五个方面的内容。

引言概述:鸢尾花数据集是由英国统计学家Fisher于1936年采集整理的,用于研究鸢尾花的分类问题。

该数据集包含了150个样本,每一个样本包括了鸢尾花的四个特征:花萼长度、花萼宽度、花瓣长度和花瓣宽度。

根据鸢尾花的品种不同,数据集中的样本被分为三个类别:Setosa、Versicolor和Virginica。

鸢尾花数据集成为了机器学习领域中最经典的分类问题之一,被广泛应用于各种分类算法的研究和评估。

一、数据结构:1.1 样本数量:鸢尾花数据集共包含150个样本,每一个样本对应一朵鸢尾花。

1.2 特征维度:每一个样本包含了四个特征,即花萼长度、花萼宽度、花瓣长度和花瓣宽度。

1.3 类别标签:根据鸢尾花的品种不同,数据集中的样本被分为三个类别:Setosa、Versicolor和Virginica。

二、数据预处理:2.1 缺失值处理:鸢尾花数据集中不包含缺失值,无需进行缺失值处理。

2.2 数据清洗:在数据预处理过程中,通常需要对异常值进行处理,以避免对模型训练的干扰。

2.3 特征缩放:由于鸢尾花数据集的特征具有不同的量纲,可以使用特征缩放方法(如标准化或者归一化)将其统一到相同的范围。

三、特征选择:3.1 相关性分析:通过计算特征与目标变量之间的相关系数,可以评估特征与分类结果的相关性,选择相关性较高的特征进行模型训练。

3.2 特征重要性评估:使用一些特征选择算法(如决策树、随机森林等)可以评估每一个特征对模型性能的贡献程度,从而选择重要的特征。

3.3 嵌入式方法:一些机器学习算法本身就具备特征选择的能力,如L1正则化的逻辑回归模型,可以自动选择重要的特征。

四、模型训练:4.1 模型选择:根据鸢尾花数据集的特点,可以选择适合分类问题的算法,如逻辑回归、支持向量机、决策树等。

数据挖掘作业—莺尾花

数据挖掘作业—莺尾花

(一)ChiMerge的工作原理:ChiMerge是监督的、自底向上的(即基于合并的)数据离散化方法。

它依赖于卡方分析:具有最小卡方值的相邻区间合并在一起,直到满足确定的停止准则。

基本思想:对于精确的离散化,相对类频率在一个区间内应当完全一致。

因此,如果两个相邻的区间具有非常类似的类分布,则这两个区间可以合并;否则,它们应当保持分开。

而低卡方值表明它们具有相似的类分布。

1、最简单的离散算法是:等宽区间。

从最小值到最大值之间,,均分为N等份,这样,如果A, B为最小最大值,则每个区间的长度为w=(B-A) / N, 则区间边界值为A+W, A+2W, …. A+(N-1)W。

2、还有一种简单算法,等频区间。

区间的边界值要经过选择,使得每个区间包含大致相等的实例数量。

比如说N=10,每个区间应该包含大约10%的实例。

3、以上两种算法有弊端:比如,等宽区间划分,划分为5区间,最高工资为50000,则所有工资低于10000的人都被划分到同一区间。

等频区间可能正好相反,所有工资高于50000的人都会被划分到50000这一区间中。

这两种算法都忽略了实例所属的类型,落在正确区间里的偶然性很大。

4、C4、CART、PVM算法在离散属性时会考虑类信息,但是是在算法实施的过程中间,而不是在预处理阶段。

例如,C4算法(ID3决策树系列的一种),将数值属性离散为两个区间,而取这两个区间时,该属性的信息增益是最大的。

5、评价一个离散算法是否有效很难,因为不知道什么是最高效的分类。

6、离散化的主要目的是:消除数值属性以及为数值属性定义准确的类别。

7、高质量的离散化应该是:区间内一致,区间之间区分明显。

8、ChiMerge算法用卡方统计量来决定相邻区间是否一致或者是否区别明显。

如果经过验证,类别属性独立于其中一个区间,则这个区间就要被合并。

9、ChiMerge算法包括2部分:1、初始化,2、自底向上合并,当满足停止条件的时候,区间合并停止。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集鸢尾花数据集是机器学习领域中常用的分类问题数据集之一。

它包含了150个样本,分为三个类别:山鸢尾(Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。

每个样本都由四个特征进行描述:花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)和花瓣宽度(petal width)。

鸢尾花数据集的目标是根据这四个特征预测鸢尾花的类别。

该数据集被广泛应用于机器学习算法的训练和评估中,因为它是一个简单且具有挑战性的分类问题。

下面是鸢尾花数据集的详细描述:1. 数据集的基本信息:- 数据集名称:鸢尾花数据集- 数据集来源:Fisher, R.A. (1936) The use of multiple measurements in taxonomic problems- 数据集大小:150个样本- 数据集类别:山鸢尾(Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)- 特征数量:4个特征- 数据集格式:CSV格式2. 数据集特征描述:- 特征1:花萼长度(sepal length)- 数据类型:浮点数- 单位:厘米(cm)- 取值范围:[4.3, 7.9]- 特征2:花萼宽度(sepal width) - 数据类型:浮点数- 单位:厘米(cm)- 取值范围:[2.0, 4.4]- 特征3:花瓣长度(petal length) - 数据类型:浮点数- 单位:厘米(cm)- 取值范围:[1.0, 6.9]- 特征4:花瓣宽度(petal width) - 数据类型:浮点数- 单位:厘米(cm)- 取值范围:[0.1, 2.5]3. 数据集类别分布:- 类别1:山鸢尾(Iris-setosa)- 样本数量:50个- 样本索引:1-50- 类别2:变色鸢尾(Iris-versicolor)- 样本数量:50个- 样本索引:51-100- 类别3:维吉尼亚鸢尾(Iris-virginica)- 样本数量:50个- 样本索引:101-1504. 数据集的应用场景:鸢尾花数据集可以用于以下机器学习任务:- 分类算法的训练和评估- 特征选择和特征工程的实践- 数据可视化和探索性数据分析5. 数据集的获取方式:鸢尾花数据集可以通过访问机器学习库(如scikit-learn)来获取,也可以在各种开放数据集平台上找到相关的下载链接。

Iris数据集

Iris数据集

Iris数据集引言概述:Iris数据集是机器学习和数据挖掘领域中经典的数据集之一,它包含了150个样本,分为三类鸢尾花(Setosa、Versicolor和Virginica),每一个类别包含50个样本。

Iris数据集被广泛应用于分类算法的评估和比较,是许多机器学习入门课程的教学案例。

本文将介绍Iris数据集的特点、应用、分析方法以及常见的数据预处理步骤。

一、数据集特点:1.1 包含的特征:Iris数据集包含四个特征,分别是花萼长度(Sepal Length)、花萼宽度(Sepal Width)、花瓣长度(Petal Length)和花瓣宽度(Petal Width)。

1.2 数据分布均衡:每一个类别包含50个样本,且样本之间的特征分布相对均衡,有利于分类算法的训练和评估。

1.3 适合于多分类问题:由于Iris数据集包含三个类别,适适合于多分类问题的训练和测试。

二、数据集应用:2.1 机器学习算法评估:Iris数据集常被用于评估分类算法的性能,如K近邻(K-Nearest Neighbors)、支持向量机(Support Vector Machine)等。

2.2 特征选择和降维:通过对Iris数据集进行特征选择和降维,可以匡助提高分类算法的效率和准确性。

2.3 模型解释和可视化:利用Iris数据集进行模型解释和可视化,可以匡助理解分类算法的决策过程和结果。

三、数据集分析方法:3.1 数据可视化:通过绘制散点图、箱线图等可视化手段,可以直观地展示Iris 数据集中不同类别的分布情况。

3.2 特征相关性分析:利用相关系数、热力图等方法,可以分析Iris数据集中特征之间的相关性,有助于选择合适的特征进行建模。

3.3 聚类分析:通过聚类算法对Iris数据集进行分析,可以探索数据集中样本之间的相似性和差异性。

四、数据预处理步骤:4.1 缺失值处理:检查数据集中是否存在缺失值,若有则需要进行填充或者删除处理,确保数据的完整性。

数据分析之鸢尾花简单分析

数据分析之鸢尾花简单分析

数据分析之鸢尾花简单分析鸢尾花是一种常见的观赏植物,是植物学中的经典研究对象之一、鸢尾花数据集是著名的机器学习数据集,常被用来进行基础的数据分析和分类算法的验证。

本文将通过对鸢尾花数据集的分析,来展示数据分析的基本流程和方法。

我们首先导入必要的库和数据集:```pythonimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.datasets import load_irisiris = load_irisdata = iris.datatarget = iris.targettarget_names = iris.target_names```接下来,我们可以通过一些统计方法来对数据集进行初步的分析。

首先,我们可以统计每个类别(品种)的样本数量:```pythonunique, counts = np.unique(target, return_counts=True)class_counts = dict(zip(target_names, counts))print(class_counts)```输出结果为:{'setosa': 50, 'versicolor': 50, 'virginica': 50},说明数据集中的三个类别的样本数量相同,每个类别都有50个样本。

然后,我们可以计算每个特征的平均值、标准差、最小值、最大值等统计指标:```pythonfeature_names = iris.feature_namesmean_values = np.mean(data, axis=0)std_values = np.std(data, axis=0)min_values = np.min(data, axis=0)max_values = np.max(data, axis=0)df_stats = pd.DataFrame({'Feature': feature_names,'Mean': mean_values,'Std': std_values,'Min': min_values,'Max': max_values})print(df_stats)```输出结果为:Feature , Mean , Std , Min , Ma----:,:----------------,-------:,----------:,-----:,-----:这些统计指标可以让我们对特征的分布和范围有更清楚的了解。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集鸢尾花数据集是机器学习领域中经典的数据集之一,由英国统计学家Fisher于1936年采集整理而成。

该数据集包含了150个样本,分为3类,每类50个样本。

每一个样本都有4个特征,分别是花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)和花瓣宽度(petal width)。

下面将详细介绍鸢尾花数据集的特征和类别分布情况。

1. 特征描述:1.1 花萼长度(sepal length):以厘米(cm)为单位测量的鸢尾花花萼的长度。

1.2 花萼宽度(sepal width):以厘米(cm)为单位测量的鸢尾花花萼的宽度。

1.3 花瓣长度(petal length):以厘米(cm)为单位测量的鸢尾花花瓣的长度。

1.4 花瓣宽度(petal width):以厘米(cm)为单位测量的鸢尾花花瓣的宽度。

2. 类别分布:鸢尾花数据集中共有3个类别,分别是Setosa、Versicolor和Virginica。

每一个类别包含50个样本。

2.1 Setosa:这是鸢尾花数据集中的第一个类别,包含了50个样本。

这些样本具有较小的花萼长度、花萼宽度、花瓣长度和花瓣宽度。

2.2 Versicolor:这是鸢尾花数据集中的第二个类别,也包含了50个样本。

这些样本具有中等大小的花萼长度、花萼宽度、花瓣长度和花瓣宽度。

2.3 Virginica:这是鸢尾花数据集中的第三个类别,同样包含了50个样本。

这些样本具有较大的花萼长度、花萼宽度、花瓣长度和花瓣宽度。

鸢尾花数据集的特征和类别分布情况可以通过数据可视化的方式更直观地展示出来。

以下是对鸢尾花数据集进行可视化分析的结果:1. 花萼长度和花萼宽度的关系:通过绘制散点图,可以观察到不同类别的鸢尾花在花萼长度和花萼宽度上的分布情况。

Setosa类别的花萼较小,Versicolor类别的花萼大小中等,Virginica类别的花萼较大。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集鸢尾花数据集是机器学习领域中常用的数据集之一,用于分类算法的训练和评估。

该数据集包含了150个样本,每个样本有4个特征和一个类别标签。

在本文中,我们将详细介绍鸢尾花数据集的特征和类别,并提供一些基本的统计信息和数据可视化结果。

特征描述:1. 萼片长度(sepal length):以厘米为单位测量的萼片的长度。

2. 萼片宽度(sepal width):以厘米为单位测量的萼片的宽度。

3. 花瓣长度(petal length):以厘米为单位测量的花瓣的长度。

4. 花瓣宽度(petal width):以厘米为单位测量的花瓣的宽度。

类别标签:鸢尾花数据集包含三个类别的鸢尾花:Setosa、Versicolor和Virginica。

每个样本都被标记为其中之一。

数据集统计信息:下面是鸢尾花数据集的一些基本统计信息:- 样本总数:150- 特征数:4- 类别数:3- Setosa样本数:50- Versicolor样本数:50- Virginica样本数:50数据可视化:为了更好地理解鸢尾花数据集,我们绘制了以下几个图表:1. 萼片长度和宽度的散点图:该图表以萼片长度为横坐标,萼片宽度为纵坐标,每个样本用不同的颜色表示。

通过观察该图表,我们可以看出不同类别的鸢尾花在萼片长度和宽度上的分布情况。

2. 花瓣长度和宽度的散点图:该图表以花瓣长度为横坐标,花瓣宽度为纵坐标,每个样本用不同的颜色表示。

通过观察该图表,我们可以看出不同类别的鸢尾花在花瓣长度和宽度上的分布情况。

3. 萼片长度的直方图:该图表展示了萼片长度的分布情况。

横坐标表示萼片长度的范围,纵坐标表示该范围内的样本数量。

通过观察该图表,我们可以了解萼片长度在数据集中的分布情况。

4. 花瓣长度的直方图:该图表展示了花瓣长度的分布情况。

横坐标表示花瓣长度的范围,纵坐标表示该范围内的样本数量。

通过观察该图表,我们可以了解花瓣长度在数据集中的分布情况。

5. 类别分布饼图:该图表展示了鸢尾花数据集中各个类别的样本数量占比。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集鸢尾花数据集是机器学习领域中常用的一个数据集,用于分类问题的研究和实践。

该数据集包含了150个样本,每一个样本都有4个特征和一个类别标签。

在本文中,我们将详细介绍鸢尾花数据集的特征和类别标签,并提供一些基本的统计数据和可视化分析。

1. 数据集介绍鸢尾花数据集是由英国统计学家和生物学家Ronald Fisher在1936年采集的。

该数据集包含了3种不同品种的鸢尾花,分别是山鸢尾(Iris setosa)、变色鸢尾(Iris versicolor)和维吉尼亚鸢尾(Iris virginica)。

每一个样本都由4个特征进行描述,包括花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)和花瓣宽度(petal width)。

2. 数据集特征鸢尾花数据集的特征是连续型数值,表示了花朵的大小和形状。

这些特征可以用来区分不同品种的鸢尾花。

下面是对每一个特征的详细描述:- 花萼长度(sepal length):以厘米(cm)为单位测量的花萼的长度。

- 花萼宽度(sepal width):以厘米(cm)为单位测量的花萼的宽度。

- 花瓣长度(petal length):以厘米(cm)为单位测量的花瓣的长度。

- 花瓣宽度(petal width):以厘米(cm)为单位测量的花瓣的宽度。

3. 类别标签鸢尾花数据集的类别标签表示了每一个样本所属的鸢尾花品种。

共有3个类别标签,分别用数字0、1和2表示,对应山鸢尾、变色鸢尾和维吉尼亚鸢尾。

4. 数据集统计信息为了更好地理解鸢尾花数据集,我们提供了一些基本的统计信息。

下面是对每一个特征的统计描述:- 花萼长度(sepal length):- 平均值:5.84 cm- 最小值:4.3 cm- 最大值:7.9 cm- 标准差:0.83 cm- 花萼宽度(sepal width):- 平均值:3.05 cm- 最小值:2.0 cm- 最大值:4.4 cm- 标准差:0.43 cm- 花瓣长度(petal length):- 平均值:3.76 cm- 最小值:1.0 cm- 最大值:6.9 cm- 标准差:1.76 cm- 花瓣宽度(petal width):- 平均值:1.20 cm- 最小值:0.1 cm- 最大值:2.5 cm- 标准差:0.76 cm5. 数据集可视化分析为了更直观地了解鸢尾花数据集,我们进行了一些可视化分析。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集鸢尾花数据集是机器学习领域中常用的一个数据集,用于分类算法的性能评估和模型训练。

该数据集包含了150个样本,每个样本有4个特征,分别是花萼长度、花萼宽度、花瓣长度和花瓣宽度。

这些样本被分为3个类别,分别是Setosa、Versicolor和Virginica。

以下是对鸢尾花数据集的详细描述:1. 数据集的基本信息:- 数据集名称:鸢尾花数据集- 数据集大小:150个样本- 特征数量:4个特征- 类别数量:3个类别2. 特征描述:- 花萼长度(sepal length):以厘米为单位测量的花萼的长度- 花萼宽度(sepal width):以厘米为单位测量的花萼的宽度- 花瓣长度(petal length):以厘米为单位测量的花瓣的长度- 花瓣宽度(petal width):以厘米为单位测量的花瓣的宽度3. 类别描述:- Setosa:山鸢尾花,属于鸢尾花的一种,具有独特的花朵形态特征- Versicolor:变色鸢尾花,属于鸢尾花的一种,花朵颜色较为鲜艳- Virginica:维吉尼亚鸢尾花,属于鸢尾花的一种,花朵形态与Setosa和Versicolor有所不同4. 数据集的用途:- 分类算法的性能评估:鸢尾花数据集常被用于评估分类算法的性能,因为它是一个相对简单且易于理解的数据集。

- 模型训练:鸢尾花数据集也可以用于训练分类模型,通过学习样本的特征和对应的类别标签,模型可以预测新样本的类别。

5. 数据集的来源:- 鸢尾花数据集最早由英国统计学家和生物学家Ronald Fisher于1936年收集整理,并用于描述线性判别分析方法。

6. 数据集的应用案例:- 鸢尾花数据集已被广泛应用于机器学习和数据挖掘的教学和研究领域,例如支持向量机、决策树和神经网络等分类算法的训练和评估。

- 该数据集也可以用于可视化技术的演示,通过对样本的特征进行可视化,可以更直观地理解和分析数据集的特点。

以上是对鸢尾花数据集的详细描述,包括数据集的基本信息、特征描述、类别描述、用途、来源和应用案例。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集鸢尾花数据集是机器学习领域中常用的数据集之一,用于分类问题的训练和测试。

该数据集包含了三个不同种类的鸢尾花(山鸢尾、变色鸢尾和维吉尼亚鸢尾)的测量数据,共有150个样本。

每个样本包含了四个特征:花萼长度、花萼宽度、花瓣长度和花瓣宽度。

下面是对鸢尾花数据集的详细描述:1. 数据集来源:鸢尾花数据集最早由英国统计学家R.A. Fisher在1936年的论文中提出,并成为了模式识别领域中的经典数据集。

2. 数据集结构:鸢尾花数据集共有150个样本,每个样本包含了四个特征和一个类别标签。

特征用于描述鸢尾花的形态特征,而类别标签用于表示鸢尾花的种类。

3. 特征描述:鸢尾花数据集中的四个特征分别是:- 花萼长度(Sepal Length):以厘米为单位,表示鸢尾花花萼的长度。

- 花萼宽度(Sepal Width):以厘米为单位,表示鸢尾花花萼的宽度。

- 花瓣长度(Petal Length):以厘米为单位,表示鸢尾花花瓣的长度。

- 花瓣宽度(Petal Width):以厘米为单位,表示鸢尾花花瓣的宽度。

4. 类别标签:鸢尾花数据集中的类别标签表示鸢尾花的种类,共有三个类别:- 山鸢尾(Setosa):用数字0表示。

- 变色鸢尾(Versicolor):用数字1表示。

- 维吉尼亚鸢尾(Virginica):用数字2表示。

5. 数据集用途:鸢尾花数据集常用于机器学习算法的训练和测试,特别是在分类问题中。

通过使用该数据集,可以对机器学习算法进行评估和比较,以及进行分类模型的训练和预测。

6. 数据集的应用:鸢尾花数据集在机器学习领域被广泛应用,例如:- 分类算法的评估:通过使用鸢尾花数据集,可以对不同的分类算法进行评估和比较,以选择最适合的算法。

- 特征选择:可以利用鸢尾花数据集进行特征选择,找出对分类任务最具有区分性的特征。

- 分类模型的训练和预测:可以使用鸢尾花数据集训练分类模型,并对新的鸢尾花样本进行分类预测。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6.1 2.6 5.6 1.4 Iris-virginica
7.7 3 6.1 2.3 Iris-virginica
6.3 3.4 5.6 2.4 Iris-virginica
6.4 3.1 5.5 1.8 Iris-virginica
6 3 4.8 1.8 Iris-virginica
6.9 3.1 5.4 2.1 Iris-virginica
5 3.6 1.4 0.2 Iris-setosa
5.4 3.9 1.7 0.4 Iris-setosa
4.6 3.4 1.4 0.3 Iris-setosa
5 3.4 1.5 0.2 Iris-setosa
4.4 2.9 1.4 0.2 Iris-setosa
4.9 3.1 1.5 0.1 Iris-setosa
7.2 3 5.8 1.6 Iris-virginica
7.4 2.8 6.1 1.9 Iris-virginica
7.9 3.8 6.4 2 Iris-virginica
6.4 2.8 5.6 2.2 Iris-virginica
6.3 2.8 5.1 1.5 Iris-virginica
5.4 3.9 1.3 0.4 Iris-setosa
5.1 3.5 1.4 0.3 Iris-setosa
5.7 3.8 1.7 0.3 Iris-setosa
5.1 3.8 1.5 0.3 Iris-setosa
5.4 3.4 1.7 0.2 Iris-setosa
5.1 3.7 1.5 0.4 Iris-setosa
6.3 2.5 4.9 1.5 Iris-versicolor
6.1 2.8 4.7 1.2 Iris-versicolor
6.4 2.9 4.3 1.3 Iris-versicolor
6.6 3 4.4 1.4 Iris-versicolor
6.8 2.8 4.8 1.4 Iris-versicolor
5.8 2.7 3.9 1.2 Iris-versicolor
6 2.7 5.1 1.6 Iris-versicolor
5.4 3 4.5 1.5 Iris-versicolor
6 3.4 4.5 1.6 Iris-versicolor
6.7 3.1 4.7 1.5 Iris-versicolor
6.7 3.1 5.6 2.4 Iris-virginica
6.9 3.1 5.1 2.3 Iris-virginica
5.8 2.7 5.1 1.9 Iris-virginica
6.8 3.2 5.9 2.3 Iris-virginica
6.7 3.3 5.7 2.5 Iris-virginica
6.7 3.3 5.7 2.1 Iris-virginica
7.2 3.2 6 1.8 Iris-virginica
6.2 2.8 4.8 1.8 Iris-virginica
6.1 3 4.9 1.8 Iris-virginica
6.4 2.8 5.6 2.1 Iris-virginica
5.8 2.6 4 1.2 Iris-versicolor
5 2.3 3.3 1 Iris-versicolor
5.6 2.7 4.2 1.3 Iris-versicolor
5.7 3 4.2 1.2 Iris-versicolor
5.7 2.9 4.2 1.3 Iris-versicolor
6 2.2 4 1 Iris-versicolor
6.1 2.9 4.7 1.4 Iris-versicolor
5.6 2.9 3.6 1.3 Iris-versicolor
6.7 3.1 4.4 1.4 Iris-versicolor
5.6 3 4.5 1.5 Iris-versicolor
5.8 2.7 4.1 1 Iris-versicolor
6.2 2.2 4.5 1.5 Iris-versicolor
5.6 2.5 3.9 1.1 Iris-versicolor
5.9 3.2 4.8 1.8 Iris-versicolor
6.1 2.8 4 1.3 Iris-versicolor
5 3.5 1.3 0.3 Iris-setosa
4.5 2.3 1.3 0.3 Iris-setosa
4.4 3.2 1.3 0.2 Iris-setosa
5 3.5 1.6 0.6 Iris-setosa
5.1 3.8 1.9 0.4 Iris-setosa
4.8 3 1.4 0.3 Iris-setosa
5.1 3.5 1.4 0.2 Iris-setosa
4.9 3 1.4 0.2 Iris-setosa
4.7 3.2 1.3 0.2 Iris-setosa
4.6 3.1 1.5 0.2 Iris-setosa
4.6 3.6 1 0.2 Iris-setosa
5.1 3.3 1.7 0.5 Iris-setosa
4.8 3.4 1.9 0.2 Iris-setosa
5 3 1.6 0.2 Iris-setosa
5 3.4 1.6 0.4 Iris-setosa
5.2 3.5 1.5 0.2 Iris-setosa
6.7 3 5 1.7 Iris-versicolor
6 2.9 4.5 1.5 Iris-versicolor
5.7 2.6 3.5 1 Iris-versicolor
5.5 2.4 3.8 1.1 Iris-versicolor
5.5 2.4 3.7 1 Iris-versicolor
5.4 3.7 1.5 0.2 Iris-setosa
4.8 3.4 1.6 0.2 Iris-setosa
4.8 3 1.4 0.1 Iris-setosa
4.3 3 1.1 0.1 Iris-setosa
5.8 4 1.2 0.2 Iris-setosa
5.7 4.4 1.5 0.4 Iris-setosa
6.9 3.1 4.9 1.5 Iris-versicolor
5.5 2.3 4 1.3 Iris-versicolor
6.5 2.8 4.6 1.5 Iris-versicolor
5.7 2.8 4.5 1.3 Iris-versicolor
6.3 3.3 4.7 1.6 Iris-versicolor
4.9 2.4 3.3 1 Iris-versicolor
6.6 2.9 4.6 1.3 Iris-versicolor
5.2 2.7 3.9 1.4 Iris-versicolor
5 2 3.5 1 Iris-versicolor
5.9 3 4.2 1.5 Iris-versicolor
6.2 2.9 4.3 1.3 Iris-versicolor
5.1 2.5 3 1.1 Iris-versicolor
5.7 2.8 4.1 1.3 Iris-vers
icolor
6.3 3.3 6 2.5 Iris-virginica
5.1 3.8 1.6 0.2 Iris-setosa
4.6 3.2 1.4 0.2 Iris-setosa
5.3 3.7 1.5 0.2 Iris-setosa
5 3.3 1.4 0.2 Iris-setosa
7 3.2 4.7 1.4 Iris-versicolor
6.4 3.2 4.5 1.5 Iris-versicolor
7.7 2.6 6.9 2.3 Iris-virginica
6 2.2 5 1.5 Iris-virginica
6.9 3.2 5.7 2.3 Iris-virginica
5.6 2.8 4.9 2 Iris-virginica
7.7 2.8 6.7 2 Iris-virginica
6.3 2.7 4.9 1.8 Iris-virginica
6.7 3 5.2 2.3 Iris-virginica
6.3 2.5 5 1.9 Iris-virginica
6.5 3 5.2 2 Iris-virginica
6.2 3.4 5.4 2.3 Iris-virginica
5.9 3 5.1 1.8 Iris-virginica
4.9 3.1 1.5 0.2 Iris-setosa
5 3.2 1.2 0.2 Iris-setosa
5.5 3.5 1.3 0.2 Iris-setosa
4.9 3.6 1.4 0.1 Iris-setsetosa
5.1 3.4 1.5 0.2 Iris-setosa
5.8 2.7 5.1 1.9 Iris-virginica
7.1 3 5.9 2.1 Iris-virginica
6.3 2.9 5.6 1.8 Iris-virginica
6.5 3 5.8 2.2 Iris-virginica
7.6 3 6.6 2.1 Iris-virginica
4.9 2.5 4.5 1.7 Iris-virginica
6.8 3 5.5 2.1 Iris-virginica
5.7 2.5 5 2 Iris-virginica
5.8 2.8 5.1 2.4 Iris-virginica
6.4 3.2 5.3 2.3 Iris-virginica
相关文档
最新文档