BASKETS(频繁模式挖掘处理后数据)
数据挖掘原理与应用---试题及答案试卷十二答案精选全文完整版
数据挖掘原理与应用 试题及答案试卷一、(30分,总共30题,每题答对得1分,答错得0分)单选题1、在ID3算法中信息增益是指( D )A、信息的溢出程度B、信息的增加效益C、熵增加的程度最大D、熵减少的程度最大2、下面哪种情况不会影响K-means聚类的效果?( B )A、数据点密度分布不均B、数据点呈圆形状分布C、数据中有异常点存在D、数据点呈非凸形状分布3、下列哪个不是数据对象的别名 ( C )A、样品B、实例C、维度D、元组4、人从出生到长大的过程中,是如何认识事物的? ( D )A、聚类过程B、分类过程C、先分类,后聚类D、先聚类,后分类5、决策树模型中应如何妥善处理连续型属性:( C )A、直接忽略B、利用固定阈值进行离散化C、根据信息增益选择阈值进行离散化D、随机选择数据标签发生变化的位置进行离散化6、假定用于分析的数据包含属性age。
数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70。
问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。
第二个箱子值为:( A )A、18.3B、22.6C、26.8D、27.97、建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?( C )A、根据内容检索B、建模描述C、预测建模D、寻找模式和规则8、如果现在需要对一组数据进行样本个体或指标变量按其具有的特性进行分类,寻找合理的度量事物相似性的统计量,应该采取( A )A、聚类分析B、回归分析C、相关分析D、判别分析9、时间序列数据更适合用( A )做数据规约。
A、小波变换B、主成分分析C、决策树D、直方图10、下面哪些场景合适使用PCA?( A )A、降低数据的维度,节约内存和存储空间B、降低数据维度,并作为其它有监督学习的输入C、获得更多的特征D、替代线性回归11、数字图像处理中常使用主成分分析(PCA)来对数据进行降维,下列关于PCA算法错误的是:( C )A、PCA算法是用较少数量的特征对样本进行描述以达到降低特征空间维数的方法;B、PCA本质是KL-变换;C、PCA是最小绝对值误差意义下的最优正交变换;D、PCA算法通过对协方差矩阵做特征分解获得最优投影子空间,来消除模式特征之间的相关性、突出差异性;12、将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( C )A、频繁模式挖掘B、分类和预测C、数据预处理D、数据流挖掘13、假设使用维数降低作为预处理技术,使用PCA将数据减少到k维度。
数据挖掘名词解释
数据挖掘名词解释数据挖掘(Data Mining)是指从大量的复杂、未经组织的数据中,通过使用各种算法和技术来挖掘出有用的、非显而易见的、潜藏在数据中的模式和知识的过程。
以下是对数据挖掘中常用的一些名词的解释:1. 数据预处理(Data Preprocessing):指在进行数据挖掘之前,对原始数据进行清理、转换、集成和规约等操作,以获得适合挖掘的数据。
2. 特征选择(Feature Selection):从原始数据中选择对于挖掘目标有意义的特征或属性,用于构建挖掘模型。
特征选择可以提高挖掘模型的准确性、有效性和可解释性。
3. 数据集成(Data Integration):将不同数据源中的数据集成到一个统一的数据仓库或数据集中,以便进行分析和挖掘。
4. 数据降维(Dimensionality Reduction):由于原始数据中可能包含大量的特征或属性,而这些特征可能存在冗余或不相关的情况,因此需要对数据进行降维,减少数据中的特征数目,提高挖掘效率和准确性。
5. 模式发现(Pattern Discovery):通过对数据挖掘算法的应用,从数据中发现隐藏的、有意义的模式,如关联规则、序列模式、聚类模式等。
6. 关联规则挖掘(Association Rule Mining):从大规模数据集中挖掘出频繁出现的项集和项集之间的关联规则。
关联规则挖掘常用于市场篮子分析、购物推荐、交叉销售等领域。
7. 分类(Classification):根据已知的样本和样本的标签,训练分类模型,然后用于对未标注样本的分类预测。
分类是数据挖掘中的一项重要任务,常用于客户分类、欺诈检测、垃圾邮件过滤等场景。
8. 聚类(Clustering):根据数据中的相似性或距离度量,将样本划分为若干个组或簇,使得同组内的样本更加相似,不同组之间的样本差异更大。
聚类可用于市场细分、用户群体划分、图像分析等领域。
9. 时间序列分析(Time Series Analysis):针对按时间顺序排列的数据,通过挖掘数据中的趋势、周期性、季节性等模式,预测未来的走势和变化。
数据挖掘 填空题
1.知识发现是一个完整的数据分析过程,主要包括以下几个步骤:确定知识发现的目标、数据采集、数据探索、数据预处理、__数据挖掘_、模式评估。
2._特征性描述_是指从某类对象关联的数据中提取这类对象的共同特征(属性)。
3.回归与分类的区别在于:___回归__可用于预测连续的目标变量,___分类__可用于预测离散的目标变量。
4.__数据仓库_是面向主题的、集成的、相对稳定的、随时间不断变化的数据集合,与传统数据库面向应用相对应。
5.Pandas的两种核心数据结构是:__Series__和__DataFrame__。
6.我们可以将机器学习处理的问题分为两大类:监督学习和_无监督学习__。
7.通常,在训练有监督的学习的机器学习模型的时候,会将数据划分为__训练集__和__测试集__,划分比例一般为0.75:0.25。
1.分类问题的基本流程可以分为__训练__和__预测_两个阶段。
2.构建一个机器学习框架的基本步骤:数据的加载、选择模型、模型的训练、__模型的预测_、模型的评测、模型的保存。
3.__回归分析_是确定两种或两种以上变量间相互依赖关系的一种统计分析方法是应用及其广泛的数据分析方法之一。
4.在机器学习的过程中,我们将原始数据划分为训练集、验证集、测试集之后,可用的数据将会大大地减少。
为了解决这个问题,我们提出了__交叉验证_这样的解决办法。
5.当机器学习把训练样本学得“太好”的时候,可能已经把训练样本自身的一些特点当作所有潜在样本都会具有的一般性质,这样会导致泛化性能下降。
这种现象在机器学习中称为__过拟合__。
6.常用的降维算法有__主成分分析__、___因子分析__和独立成分分析。
7.关联规则的挖掘过程主要包含两个阶段__发现频繁项集_和__产生关联规则__1、数据仓库是一个(面向主题的)、(集成的)、(相对稳定的)、(反映历史变化)的数据集合,通常用于(决策支持的)目的2、如果df1=pd.DataFrame([[1,2,3],[NaN,NaN,2],[NaN,NaN,NaN],[8,8,NaN]]),则df1.fillna(100)=?([[1,2,3],[100,100,2],[100,100,100],[8,8,100]])3、数据挖掘模型一般分为(有监督学习)和(无监督学习)两大类4、如果df=pd.DataFrame({'key':['A','B','C','A','B','C','A','B','C'],'data':[0,5,10,5,10,15,10,15,20]}),则df.groupby('key').sum()=?(A:15,B:30,C:45)5、聚类算法根据产生簇的机制不同,主要分成(划分聚类)、(层次聚类)和(密度聚类)三种算法6、常见的数据仓库体系结构包括(两层架构)、(独立型数据集市)、(依赖型数据集市和操作型数据存储)、(逻辑型数据集市和实时数据仓库)等四种7、Pandas最核心的三种数据结构,分别是(Series)、(DataFrame)和(Panel)8、数据挖掘中计算向量之间相关性时一般会用到哪些距离?(欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、杰卡德距离、余弦夹角、相关距离、汉明距离(答对3个即可))等9、在决策树算法中用什么指标来选择分裂属性非常关键,其中ID3算法使用(信息增益),C4.5算法使用(信息增益率),CART算法使用(基尼系数)10、OLAP的中文意思是指(在线分析处理)1、常见的数据仓库体系结构包括(两层架构)、(独立型数据集市)、(依赖型数据集市和操作型数据存储)、(逻辑型数据集市和实时数据仓库)等四种2、Pandas最核心的三种数据结构,分别是(Series)、(DataFrame)和(Panel)3、数据挖掘中计算向量之间相关性时一般会用到哪些距离?(欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、杰卡德距离、余弦夹角、相关距离、汉明距离(答对3个即可))等4、在决策树算法中用什么指标来选择分裂属性非常关键,其中ID3算法使用(信息增益),C4.5算法使用(信息增益率),CART算法使用(基尼系数)5、OLAP的中文意思是指(在线分析处理)6、如果ser=pd.Series(np.arange(4,0,-1),index=["a","b","c","d"]),则ser.values二?([4,3,2,1]),ser*2=([&6,4,2])7、线性回归最常见的两种求解方法,一种是(最小二乘法),另一种是(梯度下降法)8、对于回归分析中常见的过拟合现象,一般通过引入(正则化)项来改善,最有名的改进算法包括(Ridge岭回归)和(Lasso套索回归)9、Python字符串str='HelloWorld!',print(str[-2])的结果是?(d)10、数据抽取工具ETL主要包括(抽取)、(清洗)、(转换)、(装载)1、数据挖掘中计算向量之间相关性时一般会用到哪些距离?(欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、杰卡德距离、余弦夹角、相关距离、汉明距离(答对3个即可))等2、在决策树算法中用什么指标来选择分裂属性非常关键,其中ID3算法使用(信息增益),C4.5算法使用(信息增益率),CART算法使用(基尼系数)3、OLAP的中文意思是指(在线分析处理4、如果ser=pd.Series(np.arange(4,0,-1),index=["a","b","c","d"]),则ser.values二?([4,3,2,1]),ser*2=([&6,4,2])5、线性回归最常见的两种求解方法,一种是(最小二乘法),另一种是(梯度下降法)6、对于回归分析中常见的过拟合现象,一般通过引入(正则化)项来改善,最有名的改进算法包括(Ridge岭回归)和(Lasso套索回归)7、Python字符串str='HelloWorld!',print(str[-2])的结果是?(d)8、数据抽取工具ETL主要包括(抽取)、(清洗)、(转换)、(装载)9、CF是协同过滤的简称,一般分为基于(用户)的协同过滤和基于(商品)的协同过滤10、假如Li二[1,2,3,4,5,6],则Li[::-1]的执行结果是([6,5,4,3,2,1])1、数据仓库是一个(面向主题的)、(集成的)、(相对稳定的)、(反映历史变化)的数据集合,通常用于(决策支持的)目的2、如果df1=pd.DataFrame([[1,2,3],[NaN,NaN,2],[NaN,NaN,NaN],[8,8,NaN]]),则df1.fillna(100)=?([[1,2,3],[100,100,2],[100,100,100],[8,8,100]])3、数据挖掘模型一般分为(有监督学习)和(无监督学习)两大类4、如果df=pd.DataFrame({'key':['A','B','C','A','B','C','A','B','C'],'data':[0,5,10,5,10,15,10,15,20]}),则df.groupby('key').sum()=?(A:15,B:30,C:45)5、聚类算法根据产生簇的机制不同,主要分成(划分聚类)、(层次聚类)和(密度聚类)三种算法6、如果ser=pd.Series(np.arange(4,0,-1),index=["a","b","c","d"]),则ser.values二?([4,3,2,l]),ser*2=([&6,4,2])7、线性回归最常见的两种求解方法,一种是(最小二乘法),另一种是(梯度下降法)8、对于回归分析中常见的过拟合现象,一般通过引入(正则化)项来改善,最有名的改进算法包括(Ridge岭回归)和(Lasso套索回归)9、Python字符串str='HelloWorld!',print(str[-2])的结果是?(d)10、数据抽取工具ETL主要包括(抽取)、(清洗)、(转换)、(装载)1、数据仓库是一个(面向主题的)、(集成的)、(相对稳定的)、(反映历史变化)的数据集合,通常用于(决策支持的)目的2、数据挖掘模型一般分为(有监督学习)和(无监督学习)两大类3、聚类算法根据产生簇的机制不同,主要分成(划分聚类)、(层次聚类)和(密度聚类)三种算法4、Pandas最核心的三种数据结构,分别是(Series)、(DataFrame)和(Panel)5、在决策树算法中用什么指标来选择分裂属性非常关键,其中ID3算法使用(信息增益),C4.5算法使用(信息增益率),CART算法使用(基尼系数)6、如果ser=pd.Series(np.arange(4,0,-1),index=["a","b","c","d"]),则ser.values二?([4,3,2,1]),ser*2=([&6,4,2])7、对于回归分析中常见的过拟合现象,一般通过引入(正则化)项来改善,最有名的改进算法包括(Ridge岭回归)和(Lasso套索回归)8、数据抽取工具ETL主要包括(抽取)、(清洗)、(转换)、(装载)9、CF是协同过滤的简称,一般分为基于(用户)的协同过滤和基于(商品)的协同过滤10、假如Li二[1,2,3,4,5,6],则Li[::-1]的执行结果是([6,5,4,3,2,1])1如果dfl二pd.DataFrame([[l,2,3],[NaN,NaN,2],[NaN,NaN,NaN],[&&NaN]]), 则dfl.fillna(100)=?([[l,2,3],[100,100,2],[100,100,100],[8,8,100]])2、如果df=pd.DataFrame({'key':['A','B','C','A','B','C','A','B','C'],'data':[0,5,10,5,10,15,10 ,15,20]})则df.groupby('key').sum()=?(A:15,B:30,C:45)3、常见的数据仓库体系结构包括(两层架构)、(独立型数据集市)、(依赖型数据集市和操作型数据存储)、(逻辑型数据集市和实时数据仓库)等四种4、数据挖掘中计算向量之间相关性时一般会用到哪些距离?(欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、杰卡德距离、余弦夹角、相关距离、汉明距离(答对3个即可))等5、OLAP的中文意思是指(在线分析处理)6、线性回归最常见的两种求解方法,一种是(最小二乘法),另一种是(梯度下降法)7、Python字符串str='HelloWorld!',print(str[-2])的结果是?(d)8、数据抽取工具ETL主要包括(抽取)、(清洗)、(转换)、(装载)9、CF是协同过滤的简称,一般分为基于(用户)的协同过滤和基于(商品)的协同过滤10、假如Li二[1,2,3,4,5,6],则Li[::-1]的执行结果是([6,5,4,3,2,1])1、数据挖掘模型一般分为(有监督学习)和(无监督学习)两大类2、聚类算法根据产生簇的机制不同,主要分成(划分聚类)、(层次聚类)和(密度聚类)三种算法3、常见的数据仓库体系结构包括(两层架构)、(独立型数据集市)、(依赖型数据集市和操作型数据存储)、(逻辑型数据集市和实时数据仓库)等四种4、数据挖掘中计算向量之间相关性时一般会用到哪些距离?(欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、杰卡德距离、余弦夹角、相关距离、汉明距离(答对3个即可))等5、如果ser=pd.Series(np.arange(4,0,-1),index=["a","b","c","d"]),则ser.values二?([4,3,2,l]),ser*2=([8,6,4,2])6、对于回归分析中常见的过拟合现象,一般通过引入(正则化)项来改善,最有名的改进算法包括(Ridge岭回归)和(Lasso套索回归)7、Python字符串str='HelloWorld!',print(str[-2])的结果是?(d)8、数据抽取工具ETL主要包括(抽取)、(清洗)、(转换)、(装载)9、CF是协同过滤的简称,一般分为基于(用户)的协同过滤和基于(商品)的协同过滤10、假如Li二[1,2,3,4,5,6],则Li[::-1]的执行结果是([6,5,4,3,2,1])1、数据仓库是一个(面向主题的)、(集成的)、(相对稳定的)、(反映历史变化)的数据集合,通常用于(决策支持的)目的2、如果df=pd.DataFrame({'key':['A','B','C','A','B','C','A','B','C'],'data':[0,5,10,5,10,15,10,15,20]})则df.groupby('key').sum()=?(A:15,B:30,C:45)3、数据挖掘中计算向量之间相关性时一般会用到哪些距离?(欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、杰卡德距离、余弦夹角、相关距离、汉明距离(答对3个即可))等4、在决策树算法中用什么指标来选择分裂属性非常关键,其中ID3算法使用(信息增益),C4.5算法使用(信息增益率),CART算法使用(基尼系数)5、OLAP的中文意思是指(在线分析处理)6、如果ser=pd.Series(np.arange(4,0,-1),index=["a","b","c","d"]),则ser.values二?([4,3,2,1]),ser*2=([&6,4,2])7、线性回归最常见的两种求解方法,一种是(最小二乘法),另一种是(梯度下降法)8、对于回归分析中常见的过拟合现象,一般通过引入(正则化)项来改善,最有名的改进算法包括(Ridge岭回归)和(Lasso套索回归)9、数据抽取工具ETL主要包括(抽取)、(清洗)、(转换)、(装载)10、CF是协同过滤的简称,一般分为基于(用户)的协同过滤和基于(商品)的协同过滤。
apriori算法matlab频繁模式挖掘(含代码,原始数据)
apriori算法matlab频繁模式挖掘对购买记录进行频繁模式挖掘,采用apriori算法本文档附带matlab算法以及一个案例:附件:BASKETS.txt BASKETS.xlsx 在我的文库里首先进行数据BASKETS.txt的预处理:得到BASKETS.xlsx,(第二页)Matlab代码函数:一下是用附件做的案例主函数:结果截图:附原始数据:cardid,value,pmethod,sex,homeown,income,age,fruitveg,freshmeat,dairy,cannedveg,cannedmea t,frozenmeal,beer,wine,softdrink,fish,confectionery39808,42.7123,CHEQUE,M,NO,27000,46,F,T,T,F,F,F,F,F,F,F,T67362,25.3567,CASH,F,NO,30000,28,F,T,F,F,F,F,F,F,F,F,T10872,20.6176,CASH,M,NO,13200,36,F,F,F,T,F,T,T,F,F,T,F26748,23.6883,CARD,F,NO,12200,26,F,F,T,F,F,F,F,T,F,F,F91609,18.8133,CARD,M,YES,11000,24,F,F,F,F,F,F,F,F,F,F,F26630,46.4867,CARD,F,NO,15000,35,F,T,F,F,F,F,F,T,F,T,F62995,14.0467,CASH,F,YES,20800,30,T,F,F,F,F,F,F,F,T,F,F38765,22.2034,CASH,M,YES,24400,22,F,F,F,F,F,F,T,F,F,F,F28935,22.975,CHEQUE,F,NO,29500,46,T,F,F,F,F,T,F,F,F,F,F 41792,14.5692,CASH,M,NO,29600,22,T,F,F,F,F,F,F,F,F,T,F 59480,10.3282,CASH,F,NO,27100,18,T,T,T,T,F,F,F,T,F,T,F 60755,13.7796,CASH,F,YES,20000,48,T,F,F,F,F,F,F,F,F,T,F 70998,36.509,CARD,M,YES,27300,43,F,F,T,F,T,T,F,F,F,T,F 80617,10.2011,CHEQUE,F,YES,28000,43,F,F,F,F,F,F,F,F,T,T,F 61144,10.3736,CASH,F,NO,27400,24,T,F,T,F,F,F,F,F,T,T,F 36405,34.8222,CHEQUE,F,YES,18400,19,F,F,F,F,F,T,T,F,T,F,F 76567,42.248,CARD,M,YES,23100,31,T,F,F,T,F,F,F,F,F,T,F 85699,18.1688,CASH,F,YES,27000,29,F,F,F,F,F,F,F,F,F,T,F 11357,10.753,CASH,F,YES,23100,26,F,F,F,F,F,F,T,F,F,T,F 97761,32.3184,CARD,F,YES,25800,38,T,F,F,T,F,F,F,T,F,T,T 20362,31.72,CASH,M,YES,25100,38,F,F,F,F,F,T,F,F,F,T,F 33173,36.8328,CASH,F,YES,24700,43,F,F,F,F,F,F,F,T,F,F,T 69934,31.1787,CHEQUE,F,YES,21300,41,F,F,F,F,F,F,F,F,F,T,F 14743,21.6813,CASH,M,YES,12400,48,T,T,T,T,T,T,T,T,F,F,F 83071,29.8536,CASH,M,YES,18100,31,F,F,F,F,F,F,T,F,F,F,T 17571,15.27,CARD,F,YES,22900,23,T,F,T,F,F,T,T,F,F,F,F 37917,32.2318,CHEQUE,F,NO,27000,32,F,T,F,F,F,F,F,T,F,F,T 11236,42.5669,CARD,M,YES,26800,34,F,F,F,F,F,F,F,F,F,F,F 47914,44.5913,CASH,F,YES,24700,32,F,T,F,F,F,F,F,T,F,T,T 58154,49.1367,CHEQUE,M,NO,21300,50,F,F,F,F,T,F,F,F,F,F,F 35197,40.3398,CASH,M,NO,27400,38,F,F,F,F,F,T,T,T,F,T,F 64892,38.9995,CASH,F,YES,12900,46,F,F,F,F,F,T,F,T,F,F,F 102467,13.7623,CARD,F,YES,26700,48,F,F,F,T,T,F,T,T,F,F,F 56677,30.3099,CASH,F,NO,27800,42,T,F,F,F,F,F,F,F,F,F,F 94105,10.3719,CARD,M,YES,24100,44,F,T,F,F,F,F,F,F,T,F,F 63817,29.1748,CHEQUE,M,YES,19600,28,F,F,F,F,F,F,F,F,F,F,F 44887,46.8983,CARD,M,YES,28400,41,T,F,F,F,F,F,F,F,F,F,F 69720,13.7837,CARD,F,NO,16600,41,F,T,F,F,F,F,F,F,F,F,F 97267,33.0618,CHEQUE,F,YES,10200,19,F,F,F,F,F,F,F,F,F,T,T 53750,38.5113,CHEQUE,F,YES,24800,23,F,F,F,F,F,F,F,T,F,F,T 109530,37.4844,CARD,M,NO,21100,30,F,T,F,F,F,F,T,F,F,F,F 65493,26.7732,CASH,M,YES,19900,43,F,F,F,F,F,F,F,F,T,F,F 96694,28.2755,CARD,M,NO,16300,28,F,F,F,T,T,T,T,T,F,T,F 46730,41.6178,CARD,F,NO,18700,35,T,F,F,F,T,F,F,F,F,F,F 60499,11.8442,CASH,M,YES,12800,30,T,T,F,F,F,F,F,F,F,F,F 73004,13.0578,CHEQUE,M,YES,23800,18,F,F,F,F,F,F,F,T,F,F,F 21787,19.5369,CASH,M,NO,19700,45,F,F,F,F,F,F,F,F,F,T,F 28314,38.8062,CARD,F,YES,29200,37,F,F,F,F,F,T,F,T,F,F,T 24651,32.1216,CASH,F,NO,22700,37,F,F,F,F,F,F,F,T,T,F,T 29367,43.3149,CHEQUE,M,YES,28800,35,F,F,F,F,F,T,F,F,F,F,F 15072,41.6457,CARD,M,NO,28400,34,F,F,F,F,F,T,F,F,F,F,F 33622,39.2378,CASH,M,NO,26200,25,T,F,F,F,F,F,T,T,F,T,F43550,10.5365,CASH,M,NO,10200,47,F,F,F,T,F,T,T,F,T,F,F 18724,49.1775,CASH,F,NO,13500,17,F,F,T,F,F,F,T,F,F,F,F 91019,48.4029,CARD,M,YES,24100,29,F,F,F,F,F,F,F,T,F,F,F 68193,15.7157,CARD,F,YES,29600,24,T,F,F,F,F,F,F,F,F,F,F 35262,26.2512,CHEQUE,M,YES,18100,22,T,F,F,T,F,F,T,T,F,F,F 93401,45.7963,CARD,F,YES,29700,25,F,F,F,F,F,F,F,T,F,T,T 15177,24.7919,CARD,F,NO,11700,46,F,F,F,F,F,F,F,F,F,F,T 96173,26.3483,CARD,F,NO,13800,31,F,F,F,F,F,F,F,F,T,F,F 50180,35.5435,CASH,M,YES,23700,42,F,F,F,T,T,F,F,F,T,F,T 31828,30.426,CARD,M,NO,12000,17,F,F,T,F,T,F,F,F,F,T,F 62022,42.7131,CASH,F,NO,13300,40,F,F,F,F,F,F,F,T,F,F,T 105225,28.5341,CASH,M,NO,21600,35,T,F,T,F,F,F,F,F,F,F,T 64668,31.2009,CASH,M,NO,11200,49,F,F,T,T,T,T,T,F,T,F,F 53320,46.27,CARD,M,YES,18200,39,F,F,F,F,T,F,F,F,T,T,F 15068,17.8948,CHEQUE,M,YES,21400,50,F,F,F,F,F,F,T,F,F,F,F 99849,37.0252,CASH,F,YES,11400,17,T,F,T,F,F,F,F,F,F,F,F 63694,22.3043,CARD,F,YES,11700,29,T,F,T,T,F,F,F,F,F,F,F 24874,35.938,CASH,F,YES,26700,46,T,T,T,F,F,F,F,T,F,F,T 104988,24.3263,CASH,M,NO,24800,39,F,F,F,F,T,F,F,F,F,F,F 84902,44.9991,CARD,M,YES,29600,50,F,F,F,F,F,T,F,F,F,F,F 96512,37.8721,CARD,F,NO,20500,43,T,F,F,F,F,F,T,T,F,F,T 99575,19.2134,CARD,M,YES,28100,38,F,F,F,F,F,T,F,F,F,T,F 33413,37.9016,CASH,F,NO,20700,39,F,F,F,F,F,T,F,T,F,F,T 57678,47.6595,CHEQUE,M,NO,24900,29,F,F,F,F,F,T,F,F,F,F,F 89425,28.8615,CHEQUE,M,NO,20300,17,T,F,F,T,F,F,T,F,F,T,F 60571,24.6707,CASH,F,NO,18600,29,F,F,F,F,F,T,F,F,F,T,F 76095,28.0024,CHEQUE,M,YES,11000,46,F,F,F,T,F,T,T,F,F,F,F 48247,48.6794,CHEQUE,F,NO,11000,50,F,F,F,F,F,F,F,F,F,F,F 88019,47.3606,CHEQUE,M,YES,23300,41,T,F,F,F,F,F,F,F,F,F,F 30850,17.1818,CASH,F,NO,19900,34,T,F,F,F,F,F,F,F,F,T,F 66117,25.4945,CHEQUE,F,NO,27200,26,F,F,F,F,T,F,F,F,F,T,F 97377,28.263,CARD,F,NO,12700,24,F,F,F,F,F,F,T,F,F,F,F 101722,15.7228,CHEQUE,M,NO,29400,31,F,T,F,F,F,T,F,F,F,T,F 43498,33.6065,CHEQUE,F,YES,17000,44,F,F,F,F,F,F,F,F,F,F,F 44562,13.532,CHEQUE,F,YES,28600,50,F,F,F,F,F,T,F,F,T,F,F 74710,16.3704,CARD,F,YES,27300,30,F,F,F,F,F,F,F,F,F,F,F 85585,36.426,CARD,F,YES,26300,46,F,F,F,F,F,F,F,T,T,F,T 97287,35.3706,CHEQUE,M,NO,13800,49,F,F,F,T,F,T,T,T,F,T,F 19268,25.055,CASH,F,YES,11000,29,F,F,F,F,F,F,F,F,F,F,F 50150,39.5248,CASH,F,NO,18800,27,T,F,F,F,F,F,F,T,T,T,F 67455,18.198,CARD,F,YES,19300,40,F,T,F,F,F,F,T,F,F,F,F 16350,31.8923,CARD,F,YES,22900,16,T,T,F,F,F,F,F,F,F,F,F 42778,35.2808,CASH,M,YES,15500,17,F,F,T,T,F,T,T,F,T,F,F106522,10.007,CHEQUE,M,YES,14500,22,F,F,F,T,F,T,T,F,F,F,F 36278,43.0066,CASH,M,NO,20400,40,F,T,F,F,F,T,F,F,T,F,F 26130,12.6214,CHEQUE,F,NO,18400,45,F,F,F,T,F,F,F,T,F,F,F 57851,29.562,CASH,F,YES,18700,43,T,F,F,F,T,F,T,F,F,F,T 81971,19.3672,CASH,M,NO,28200,17,T,F,T,T,F,F,F,F,F,T,F 57068,22.8535,CHEQUE,M,NO,20900,42,F,F,T,F,F,F,F,F,F,F,F 69122,32.0161,CARD,M,YES,29300,34,F,F,T,F,T,F,F,F,F,F,F 68489,22.5684,CHEQUE,F,YES,24900,18,F,F,F,F,F,T,F,F,F,T,F 46471,25.4795,CHEQUE,M,YES,17100,23,F,F,F,F,F,F,F,F,F,F,F 88359,23.0214,CARD,F,YES,19100,21,T,T,F,F,F,F,F,F,F,F,T 44294,38.5314,CASH,M,NO,16300,18,F,F,T,T,F,T,T,F,F,F,F 95604,23.5058,CHEQUE,M,NO,11600,44,F,F,F,T,T,T,T,T,F,T,F 103596,27.4252,CARD,F,NO,12300,26,F,F,F,F,T,F,F,F,T,F,F 103473,25.0338,CHEQUE,F,YES,12100,26,F,F,F,F,T,T,F,F,F,F,F 94467,18.9589,CASH,M,YES,16600,49,F,F,F,T,F,T,T,F,T,T,F 38097,37.1385,CASH,M,NO,11700,19,T,F,F,T,T,T,T,T,F,T,F 49632,10.7717,CARD,M,NO,21700,21,F,F,F,T,T,F,F,F,F,T,T 82558,10.1074,CARD,F,YES,27500,22,F,T,F,F,F,F,T,T,T,F,F 50324,20.1004,CASH,M,YES,28900,16,F,T,F,F,F,F,F,F,T,T,F 38468,42.7908,CARD,F,YES,18300,23,F,F,F,F,F,F,F,F,F,F,F 38055,14.4497,CARD,F,YES,22600,25,T,F,F,F,F,F,F,F,F,F,F 74876,18.2937,CASH,M,YES,17100,45,F,F,T,F,F,F,T,F,F,F,T 18079,24.816,CARD,M,YES,19800,32,F,F,T,F,F,F,F,T,F,F,F 16316,39.1701,CHEQUE,M,NO,23300,22,T,F,T,F,F,T,F,F,F,T,F 37166,16.4835,CARD,F,NO,21600,23,T,F,F,F,F,F,T,F,F,T,F 18334,42.4343,CASH,F,NO,25900,43,F,F,F,F,F,T,F,T,F,F,T 102645,13.4218,CARD,F,YES,17200,23,F,F,F,T,T,F,F,F,F,F,F 101100,18.9591,CARD,M,YES,16600,42,F,F,F,T,F,T,T,T,F,F,F 64861,18.7711,CASH,M,YES,27200,49,F,F,T,F,F,T,T,F,F,F,T 19041,14.6823,CARD,F,NO,21100,23,T,T,F,T,F,F,F,F,F,T,F 85771,10.0455,CARD,F,NO,15700,36,F,F,F,F,T,F,F,T,F,F,T 79303,39.6497,CASH,M,NO,17000,19,T,F,T,F,F,F,F,F,F,T,F 92675,44.5153,CHEQUE,F,NO,18100,47,F,T,F,F,F,F,F,F,F,F,F 71690,13.6361,CASH,F,NO,29300,18,T,F,F,F,F,F,T,F,T,T,F 86350,12.184,CARD,F,NO,18200,49,F,F,F,F,F,T,F,F,T,F,F 88260,29.7785,CARD,F,NO,12000,34,F,F,T,T,F,F,F,F,F,F,F 86759,48.4566,CARD,F,NO,14800,34,F,F,F,T,F,F,F,F,F,F,F 49861,38.8491,CASH,M,YES,20300,32,F,F,F,F,F,F,T,F,F,F,F 21543,13.9176,CHEQUE,F,NO,28900,27,F,F,F,T,F,T,F,T,T,F,F 70481,31.7001,CHEQUE,M,YES,29800,30,F,F,F,T,F,F,T,F,T,T,F 29944,42.8985,CASH,M,NO,29800,18,T,F,F,F,F,T,T,F,T,T,F 46054,14.2814,CARD,M,NO,15000,46,F,T,F,T,T,T,T,F,T,F,T 61329,26.9282,CARD,F,YES,17200,49,T,F,F,F,F,F,F,F,F,F,F58768,18.0798,CHEQUE,F,YES,10800,16,F,F,F,F,F,F,F,T,T,F,F 71343,48.2751,CASH,M,YES,13700,38,F,F,F,T,F,T,T,F,F,F,F 55418,20.8812,CARD,F,YES,16800,23,T,F,F,F,F,F,F,F,F,F,F 18228,31.7275,CASH,M,NO,17700,41,F,F,F,T,F,F,F,F,F,F,F 37305,33.9607,CARD,M,NO,18200,49,F,F,F,F,F,F,F,F,F,F,F 30243,30.3916,CASH,M,YES,11500,33,F,T,F,T,T,T,T,T,F,F,T 59599,27.4881,CASH,F,YES,18700,28,F,F,F,F,T,T,T,F,F,F,F 61869,31.8011,CASH,M,NO,12100,46,T,F,F,T,F,T,T,T,F,F,F 10360,27.4012,CHEQUE,M,NO,13400,20,F,F,F,T,F,T,T,F,F,T,F 83338,26.2061,CASH,M,NO,18500,41,F,F,F,F,T,F,F,F,F,F,F 39080,18.3878,CARD,F,YES,21000,36,F,F,F,T,F,F,F,F,F,T,F 84799,31.3192,CARD,M,YES,17600,21,F,T,F,F,T,F,F,F,F,F,F 51979,20.5285,CARD,M,YES,11100,16,F,F,F,T,T,T,T,F,F,F,T 40505,43.0394,CARD,F,NO,25400,50,F,T,T,F,F,F,F,T,F,F,T 37098,26.6378,CARD,F,YES,14100,37,T,T,F,F,F,F,F,F,T,F,F 29524,10.7127,CASH,F,YES,25100,37,F,F,F,T,F,F,F,F,F,F,F 63452,17.8916,CASH,M,NO,12000,48,F,F,F,T,T,T,T,F,F,F,F 20158,23.7441,CHEQUE,M,YES,29000,43,F,F,F,F,T,F,F,F,F,T,F 70182,11.3005,CARD,F,YES,12200,18,F,F,F,T,F,T,F,F,F,F,F 56034,41.2711,CASH,M,NO,14100,16,T,T,F,T,F,T,T,F,F,T,F 44235,27.7268,CASH,F,YES,23200,41,F,F,T,F,F,F,T,T,F,F,T 96881,14.6112,CARD,M,YES,11900,39,F,F,F,T,T,T,T,T,F,F,F 27166,13.4513,CASH,F,YES,25100,44,F,F,F,F,F,F,F,F,F,F,F 39884,31.2737,CASH,M,NO,29700,21,F,F,F,F,F,F,F,T,F,F,F 95141,45.3427,CARD,F,YES,20900,37,T,F,F,F,F,F,F,T,F,F,T 28110,27.6974,CARD,M,YES,12100,21,F,F,F,F,F,T,F,F,F,F,F 85259,40.9303,CARD,F,YES,11000,22,T,F,F,F,F,T,T,F,F,F,F 14996,22.2591,CASH,M,YES,26100,17,F,T,T,T,F,T,F,F,F,T,T 55652,41.7166,CARD,M,NO,14100,20,T,F,F,T,F,T,T,F,F,T,F 43964,29.4585,CASH,F,NO,18500,24,T,F,F,T,F,F,F,T,F,F,F 51183,22.3157,CASH,F,NO,23100,25,F,F,F,F,F,F,F,F,F,F,F 29310,49.8459,CASH,M,YES,28900,22,F,F,F,F,F,F,F,T,T,F,F 21187,20.5744,CHEQUE,F,YES,15400,36,F,T,F,F,F,F,T,F,F,F,F 83536,31.9368,CASH,F,NO,11600,22,F,F,F,F,F,F,T,F,T,T,F 95887,43.1964,CASH,M,NO,12500,27,F,F,F,T,T,T,T,F,T,F,F 88176,34.5366,CARD,F,YES,28300,31,F,F,T,F,F,T,F,T,T,F,T 65418,38.6017,CASH,F,YES,24600,48,F,F,F,F,F,F,F,T,F,F,T 27766,40.0773,CARD,F,NO,18900,34,T,F,F,F,F,F,T,F,F,F,F 66191,37.5233,CASH,F,NO,22600,35,T,F,T,F,F,T,T,F,F,F,F 108764,44.6294,CASH,M,YES,10200,27,F,F,F,T,F,T,T,T,F,T,F 12782,31.3296,CHEQUE,F,NO,20300,31,F,F,F,T,F,F,T,F,F,F,F 75118,31.7774,CHEQUE,F,YES,22200,49,F,F,F,F,T,F,F,F,F,F,F 58188,36.0631,CARD,M,NO,29900,19,T,F,F,F,T,F,F,F,F,T,F95479,45.7417,CHEQUE,M,NO,22700,32,F,F,F,T,T,F,F,T,F,F,T 59439,20.7784,CASH,M,YES,22000,24,T,F,F,F,F,F,T,F,F,F,F 104903,34.4437,CASH,F,NO,28200,30,T,F,F,F,F,F,F,T,F,F,T 44825,36.9448,CARD,F,NO,12600,50,F,T,F,F,F,F,F,F,F,T,T 71887,30.067,CASH,M,NO,14700,46,F,T,F,T,F,T,T,T,F,T,T 18708,30.7868,CASH,F,YES,25900,35,F,F,F,T,T,T,T,F,F,T,F 74423,22.3177,CASH,F,YES,20000,18,F,F,F,F,F,F,T,F,F,F,F 97967,11.5144,CASH,F,NO,27600,48,F,F,F,F,F,F,F,F,T,T,F 20386,39.8296,CHEQUE,F,YES,15400,32,F,F,T,F,F,F,F,F,F,F,F 77218,38.2717,CARD,M,NO,16500,34,T,F,F,T,F,T,T,T,F,T,F 80137,12.847,CASH,F,NO,22200,33,F,F,F,F,F,F,F,F,F,F,F 84092,34.8497,CARD,F,NO,22000,48,T,F,T,F,F,T,F,T,T,T,T 58914,28.9163,CARD,F,YES,25500,50,F,F,F,F,F,T,F,F,F,F,F 16287,42.5534,CASH,F,NO,25800,16,T,F,F,F,F,F,F,T,T,F,T 86044,30.5434,CARD,M,NO,13900,30,F,F,F,T,F,T,T,T,T,F,F 36927,20.1812,CHEQUE,M,NO,11100,35,F,F,F,T,F,T,T,F,F,F,T 93304,42.4567,CARD,M,NO,28200,34,F,F,F,F,F,T,F,F,F,F,T 66988,17.9591,CARD,M,YES,12300,43,F,F,F,T,F,T,T,F,F,T,F 55091,40.2274,CASH,M,NO,24400,19,F,F,F,F,T,F,T,F,F,F,F 64215,17.0993,CASH,M,NO,15300,42,T,F,F,T,T,T,T,F,F,F,F 28629,44.8107,CASH,M,NO,26200,31,F,F,F,F,F,F,T,F,F,F,T 98383,33.8642,CASH,M,NO,24500,32,F,F,F,T,T,T,F,F,F,F,T 107505,21.3633,CASH,F,YES,25000,32,F,F,F,F,F,F,F,F,F,F,T 99578,15.7681,CARD,M,NO,24300,27,F,F,F,F,T,F,F,F,T,F,T 28979,35.8494,CHEQUE,F,YES,20100,21,F,F,F,T,F,F,F,T,F,F,T 102733,28.5154,CASH,F,NO,17200,24,T,F,F,F,F,F,F,F,F,T,T 81690,37.3617,CARD,F,NO,23900,36,F,F,F,F,F,F,F,T,F,F,T 25405,36.4166,CARD,M,NO,27600,36,F,F,F,F,T,F,F,F,F,T,F 85348,40.2677,CHEQUE,F,YES,12400,24,F,F,F,F,T,F,F,F,F,F,F 19915,40.0868,CASH,F,NO,15700,21,T,F,F,F,T,F,F,F,F,T,F 99387,10.6184,CASH,F,NO,16500,49,F,T,F,F,T,F,F,F,F,F,T 32380,11.1224,CARD,F,YES,18900,20,T,F,F,T,F,F,F,T,F,F,F 39914,36.7285,CARD,F,YES,13700,26,T,F,T,F,F,F,F,F,F,F,F 57952,35.1487,CHEQUE,F,NO,26900,48,F,F,F,T,F,F,F,T,F,F,T 64239,27.5083,CARD,M,YES,15800,22,F,F,F,T,F,T,T,T,T,F,F 38014,23.331,CHEQUE,F,NO,16000,42,F,T,F,T,T,T,F,F,T,F,F 21875,10.7267,CASH,F,NO,25000,17,T,F,F,F,F,F,F,T,F,T,F 37939,49.7316,CARD,M,YES,28300,18,T,T,F,F,T,F,F,F,T,F,F 109061,37.3485,CASH,F,NO,27800,50,F,T,F,F,F,F,F,T,F,F,T 100754,11.3294,CHEQUE,F,NO,17100,16,T,F,F,T,F,T,F,F,F,T,F 28313,34.8889,CASH,F,NO,27700,48,T,F,F,F,F,F,F,T,F,F,T 82753,37.5762,CHEQUE,F,YES,23200,42,T,T,T,F,F,F,F,T,F,F,T 105412,18.3099,CASH,M,NO,18500,29,F,F,F,F,F,F,T,F,F,F,F 42583,35.6757,CASH,F,YES,13300,24,F,F,F,F,F,F,F,F,F,F,F89233,37.6838,CARD,F,YES,28400,17,F,T,F,F,F,F,F,F,F,F,F 76777,43.748,CARD,F,NO,26900,28,F,F,F,F,F,F,F,T,F,F,T 16220,34.7872,CHEQUE,M,NO,15300,33,F,F,F,T,F,T,T,F,T,F,T 17864,35.6562,CHEQUE,F,NO,28900,18,T,F,T,F,F,F,F,T,F,T,T 87270,31.4868,CHEQUE,M,NO,21300,29,F,F,T,T,T,F,F,T,F,F,F 34593,35.8231,CARD,M,YES,26800,50,F,F,T,F,T,T,F,T,F,F,F 67697,12.9477,CARD,M,NO,18200,44,F,F,T,F,F,T,F,F,F,F,F 32302,33.8303,CARD,F,YES,12500,37,F,F,F,F,F,F,F,F,F,F,F 15663,45.1901,CARD,F,YES,19700,45,F,F,F,F,F,F,T,F,F,F,F 108601,14.1216,CASH,M,NO,17100,49,F,F,F,F,F,F,F,T,F,T,F 55951,15.6793,CARD,M,NO,23600,39,F,F,F,F,F,F,F,T,F,F,T 39817,13.2005,CASH,F,YES,17500,49,F,F,F,F,F,F,T,F,F,F,F 19613,46.1507,CARD,F,YES,11000,45,F,F,F,F,T,F,F,F,F,F,F 71600,47.3234,CHEQUE,M,NO,12400,33,T,F,F,T,T,T,T,T,F,T,F 96561,30.3759,CARD,M,NO,17000,29,F,F,F,F,F,F,F,F,F,F,F 90861,38.2559,CASH,F,YES,18600,29,T,T,F,F,F,F,F,F,F,F,T 68501,15.3726,CHEQUE,F,NO,24000,31,T,T,F,F,F,F,F,F,T,T,F 30132,23.9357,CASH,M,NO,15700,23,T,F,T,T,F,T,T,F,F,T,F 78639,32.0691,CASH,M,NO,27900,48,F,F,F,F,F,F,F,F,F,T,F 46419,45.3239,CARD,F,NO,20000,27,F,F,F,F,F,F,F,F,F,F,T 50633,23.0638,CHEQUE,M,YES,19200,46,F,F,F,F,F,F,F,F,F,F,T 11553,15.1133,CASH,M,NO,28300,27,F,F,F,F,F,F,F,F,F,F,T 65853,20.6815,CASH,M,YES,17500,33,T,F,T,F,F,F,F,F,F,F,F 47547,42.8159,CASH,F,YES,16900,46,F,F,F,F,F,F,F,F,T,F,F 38360,35.0157,CASH,F,YES,14700,27,F,F,F,T,F,F,F,F,F,F,F 107728,16.9603,CHEQUE,F,NO,26800,49,F,T,F,F,F,T,T,T,F,F,F 30390,26.6278,CASH,M,YES,21400,25,F,F,F,F,F,F,F,F,T,F,F 75815,19.1927,CARD,F,YES,19200,40,F,F,F,F,F,T,F,T,F,F,T 106288,10.0926,CHEQUE,F,YES,12300,23,F,F,F,T,F,F,F,F,F,F,T 88596,34.1082,CASH,F,NO,28400,38,F,F,T,F,F,F,F,T,T,F,T 93469,32.7656,CHEQUE,M,NO,24800,16,T,F,T,T,T,T,F,F,T,T,F 34756,15.2704,CARD,F,YES,15900,18,F,F,F,F,F,F,F,F,F,F,F 12584,46.6323,CARD,F,YES,17400,29,T,F,F,F,F,F,T,T,F,F,T 107080,29.4064,CARD,F,NO,25100,43,F,F,F,T,F,F,F,F,F,F,F 73651,14.1309,CASH,M,YES,11700,22,T,T,F,F,F,F,F,F,F,F,F 54180,43.0372,CASH,M,NO,13500,32,F,T,F,T,F,T,T,F,F,F,F 45102,32.5518,CASH,M,NO,28800,16,T,F,F,F,F,T,F,F,F,T,F 85475,37.0037,CARD,M,YES,24500,47,T,F,F,F,F,F,F,T,F,F,F 78363,49.4132,CARD,M,YES,10600,18,T,F,F,T,F,T,T,T,F,F,F 23718,37.8611,CHEQUE,M,YES,29700,37,F,F,F,T,F,T,F,T,F,T,F 54152,20.595,CARD,M,YES,24400,38,F,F,F,F,F,T,T,T,F,F,F 93963,49.1922,CARD,M,YES,25100,21,F,T,F,F,F,F,F,F,F,F,F 35561,34.4236,CASH,M,YES,13300,24,F,F,F,F,F,T,F,F,F,F,T 30371,30.8872,CARD,F,YES,23100,24,T,F,F,F,F,F,F,F,F,F,F93669,27.7032,CHEQUE,F,NO,21600,37,F,F,F,T,F,F,F,T,F,F,T 70858,20.9462,CASH,M,YES,17600,46,T,T,F,T,F,F,F,F,F,T,T 103147,43.8622,CARD,M,YES,18100,28,F,F,F,T,F,F,F,F,F,F,F 80198,34.267,CARD,F,NO,28300,47,F,F,F,F,F,F,T,T,F,F,T 42459,32.6446,CARD,F,YES,23800,47,F,F,F,F,T,T,F,T,T,F,T 36631,27.0515,CASH,M,YES,22100,16,F,F,F,F,F,F,F,F,F,F,F 43800,44.2831,CARD,F,YES,27900,36,F,F,F,T,F,F,T,T,F,F,T 60240,21.9871,CASH,M,YES,23800,45,F,F,F,F,F,F,F,F,F,F,F 29640,28.5955,CASH,F,NO,17800,27,F,F,F,T,T,T,F,T,F,F,F 109000,14.9647,CASH,F,YES,17800,22,F,F,F,T,T,F,F,T,T,F,F 108739,10.9737,CASH,M,NO,20800,29,T,F,F,F,F,F,F,T,T,F,T 104165,32.2963,CARD,M,NO,25400,43,F,F,F,F,F,F,F,T,F,F,F 73630,10.4506,CARD,F,NO,19800,25,F,F,F,T,T,F,F,T,F,F,F 25765,35.6814,CHEQUE,F,YES,30000,25,F,F,F,F,F,F,F,T,F,F,T 84903,32.8053,CARD,F,NO,29600,17,T,F,F,F,F,T,F,F,T,T,F 99347,34.6651,CARD,F,YES,23100,44,F,T,T,T,F,F,F,T,F,F,T 41157,20.2332,CASH,F,NO,15200,40,T,F,T,F,T,T,F,F,T,F,F 20325,15.356,CARD,M,YES,26600,24,F,T,T,F,F,T,F,T,F,F,F 71462,40.9979,CARD,F,YES,26300,42,F,T,F,F,F,F,F,T,F,F,T 91928,12.3639,CARD,F,NO,14300,19,T,F,F,F,T,F,F,T,T,T,T 80306,31.9965,CASH,F,NO,15200,27,F,F,T,F,T,T,T,T,F,F,F 78113,14.3918,CASH,F,YES,23800,22,T,F,F,T,F,F,F,T,F,F,F 95488,11.9753,CARD,F,NO,18100,26,T,F,T,F,F,F,F,F,F,F,F 27720,37.4582,CARD,F,NO,13400,16,F,F,F,F,F,T,F,F,F,T,F 76264,15.99,CHEQUE,M,NO,29700,16,T,T,F,F,F,F,F,F,F,T,F 38477,13.8168,CASH,M,YES,16500,38,F,T,F,F,F,F,F,F,F,F,T 43557,24.5056,CASH,F,YES,10800,25,T,F,F,F,F,F,F,F,F,F,F 10609,14.2389,CHEQUE,F,NO,16700,41,T,F,F,F,F,F,F,F,F,T,F 73259,16.8793,CARD,F,NO,24700,42,T,F,F,F,T,F,F,F,F,F,F 18920,45.3683,CASH,M,NO,15800,49,F,F,F,T,F,F,F,T,T,F,F 39581,29.2526,CASH,F,YES,27900,49,F,F,F,F,F,F,F,F,F,F,F 14912,39.1559,CHEQUE,M,YES,28100,28,F,F,F,T,F,T,T,T,F,F,F 80438,15.8347,CARD,M,NO,19600,38,F,F,F,F,F,F,F,T,F,F,T 81034,20.9511,CHEQUE,M,YES,12800,28,F,T,F,T,T,T,T,F,F,F,F 89250,43.6042,CASH,F,NO,27900,29,F,T,F,F,T,F,F,T,F,F,T 96982,15.4964,CARD,M,YES,15300,49,T,F,F,T,F,T,T,F,F,F,F 89872,15.6822,CARD,F,YES,19100,40,F,F,F,F,F,F,T,F,F,F,F 71140,22.0941,CARD,M,YES,25800,42,F,F,F,F,F,F,T,F,F,F,F 83650,33.5584,CASH,F,YES,27000,22,F,F,F,F,F,F,F,F,F,T,F 14891,18.391,CASH,F,NO,27400,26,F,F,F,T,F,F,F,F,F,F,F 83523,45.8037,CASH,M,NO,17400,40,F,F,F,F,F,F,F,F,F,F,F 48896,30.4368,CASH,F,YES,17200,22,F,F,F,F,F,F,F,F,F,F,F 68438,23.4241,CASH,F,YES,21700,46,T,F,F,F,F,F,F,F,F,F,T 86681,15.0004,CHEQUE,F,NO,13500,50,F,F,F,F,F,F,F,F,F,F,F66267,15.686,CASH,F,NO,27300,21,T,T,T,F,F,F,T,T,F,T,T 87975,27.82,CARD,F,NO,17900,26,F,F,T,F,F,F,F,F,F,T,F 39970,46.7406,CHEQUE,M,YES,13900,22,F,F,F,T,F,T,T,F,F,F,F 104111,27.4529,CARD,F,YES,12300,20,F,F,T,F,F,F,F,F,F,T,T 92209,30.904,CHEQUE,F,YES,22700,17,F,T,T,F,T,F,F,F,F,F,F 66711,41.407,CASH,F,NO,15400,48,F,F,T,F,F,F,F,F,F,F,F 102215,13.1647,CASH,M,YES,14400,47,F,F,F,T,F,T,T,F,F,F,F 34750,21.9036,CARD,F,NO,27800,48,T,F,F,T,T,F,T,F,F,F,F 62060,40.7025,CARD,M,YES,11100,42,F,F,F,T,F,T,T,F,F,F,F 25524,45.9486,CARD,M,NO,25900,36,F,F,F,T,T,T,F,F,F,F,F 45992,13.6452,CASH,F,YES,16500,49,F,F,F,F,F,F,F,F,F,F,F 47341,31.9765,CARD,M,NO,20300,16,T,F,F,F,F,T,F,F,F,T,T 67799,16.9724,CARD,F,NO,21300,16,T,F,F,F,F,T,F,F,F,T,T 47136,22.032,CASH,F,NO,24400,43,F,F,F,F,F,F,F,F,F,T,F 17375,12.7641,CHEQUE,M,YES,21800,22,F,F,F,F,T,F,F,F,F,F,F 40789,11.186,CASH,F,NO,12800,16,T,F,T,F,F,F,F,F,F,T,T 27673,37.5651,CASH,F,YES,29000,36,F,F,T,F,F,T,T,T,F,F,T 45375,39.4947,CARD,M,NO,25100,50,F,F,F,F,T,T,F,F,F,F,F 58341,32.8363,CASH,F,YES,12900,38,F,F,F,T,T,F,F,F,F,F,F 37523,27.6713,CARD,F,NO,25200,16,T,T,T,T,F,F,F,T,T,T,F 84042,18.1849,CASH,M,NO,14200,27,F,T,F,T,T,T,T,F,F,F,F 64561,23.6794,CASH,F,YES,28200,33,F,F,F,F,T,F,F,F,T,F,F 71078,10.8529,CARD,M,YES,23800,31,F,F,F,F,F,F,F,F,F,F,F 43044,29.8836,CASH,M,YES,21700,32,T,T,F,F,F,F,F,F,T,F,F 32369,21.9204,CHEQUE,M,YES,23500,21,F,F,F,T,F,F,F,F,F,F,T 31552,36.2776,CARD,M,YES,23700,17,T,F,T,F,F,F,F,F,F,F,T 41805,48.5787,CASH,M,NO,16300,25,F,F,F,T,F,T,T,F,F,T,T 46686,29.5925,CHEQUE,F,NO,17500,34,F,F,T,F,F,F,F,F,F,F,F 95896,37.2821,CARD,M,YES,29100,21,F,F,F,F,F,F,F,T,F,F,F 63829,29.8575,CARD,F,NO,13100,45,F,F,F,F,F,F,T,F,F,F,T 84180,10.4233,CHEQUE,M,YES,12800,47,F,F,F,T,F,T,T,F,F,F,F 91972,49.1579,CARD,F,NO,26700,18,T,F,F,F,F,T,F,T,F,T,T 40542,44.2289,CARD,F,NO,16300,42,F,F,F,F,F,F,F,F,F,F,F 44452,12.6097,CARD,F,NO,11900,30,T,F,F,F,T,F,T,F,F,F,F 87151,44.1181,CHEQUE,F,NO,21400,30,F,F,T,F,T,T,F,T,F,T,T 23501,10.225,CASH,M,YES,23000,49,F,F,F,F,F,F,F,T,T,T,T 25387,11.4154,CARD,F,YES,14900,36,F,F,F,F,F,F,F,F,F,F,F 96584,17.3355,CASH,M,YES,26600,39,T,F,F,F,F,F,F,F,T,F,F 15306,22.3248,CASH,M,NO,16500,41,F,F,F,T,T,T,T,F,F,F,F 93920,22.5392,CARD,M,YES,16100,18,F,T,F,T,F,T,T,T,F,F,F 103316,29.3125,CASH,M,YES,17900,46,F,T,F,F,F,F,F,F,F,F,T 17110,12.7214,CASH,M,YES,14700,45,F,F,F,T,T,T,T,F,F,F,F 71652,34.0689,CARD,M,YES,13300,29,F,F,T,T,F,T,T,F,F,F,F 67211,16.8537,CARD,F,NO,23600,43,F,F,F,F,F,F,F,F,F,F,F29224,40.9484,CARD,F,NO,24900,16,T,F,F,F,T,F,T,T,F,T,T 46005,30.8594,CARD,M,NO,26200,32,F,F,F,F,F,F,F,F,F,F,F 43111,43.4371,CASH,F,YES,11400,27,F,F,T,T,F,F,F,F,T,F,F 18126,34.7134,CARD,F,NO,14200,19,T,F,F,T,F,F,F,T,T,T,F 87101,23.0974,CHEQUE,M,NO,15000,23,T,F,F,F,T,T,F,F,F,T,T 102934,37.7352,CHEQUE,F,NO,29400,45,T,F,F,F,F,F,F,T,F,F,T 100328,30.4099,CHEQUE,M,YES,10700,36,F,T,F,T,F,T,T,F,F,T,F 94108,21.3634,CASH,M,NO,18500,42,F,F,T,F,F,F,F,T,T,F,F 47913,49.0675,CHEQUE,F,NO,28900,25,F,F,T,F,F,F,F,T,F,F,T 17809,39.6015,CARD,M,YES,27100,20,F,F,F,F,F,F,F,F,F,F,T 45019,47.2341,CARD,M,NO,19800,48,F,T,F,F,F,F,F,F,F,F,F 55552,41.6462,CARD,M,YES,19800,50,T,F,F,F,F,F,F,F,F,T,F 92883,18.8207,CARD,F,NO,24500,27,T,F,F,F,F,F,F,F,F,F,F 89649,26.9621,CHEQUE,F,NO,28200,24,T,F,F,F,F,F,F,F,F,T,T 38063,36.0742,CASH,F,NO,29400,16,T,F,F,F,F,F,F,T,F,T,T 11230,46.279,CASH,M,NO,24400,42,F,F,T,F,F,F,F,F,F,T,T 89302,20.4889,CARD,F,YES,12000,39,F,F,F,F,F,F,F,F,F,T,F 35707,16.5348,CASH,M,NO,25300,42,F,F,F,F,F,F,F,F,T,T,F 90264,10.4971,CARD,M,NO,24300,18,T,F,F,F,F,F,F,F,F,T,F 79875,10.0844,CHEQUE,F,NO,19800,39,F,T,F,F,F,F,F,F,F,F,F 74463,16.7073,CARD,F,YES,25400,36,F,F,F,T,F,T,F,F,T,F,F 56258,21.5804,CARD,F,NO,14500,48,T,F,F,F,F,F,F,T,T,F,F 81836,32.9521,CHEQUE,M,NO,11800,48,F,F,F,F,F,T,F,F,T,T,F 95026,13.4226,CASH,F,YES,13400,29,F,F,T,F,F,F,F,F,F,T,T 87482,40.101,CARD,F,YES,14200,38,T,F,F,F,T,T,F,T,F,F,F 20556,20.4104,CARD,M,NO,13900,18,T,F,F,F,F,F,T,F,F,T,F 68058,49.8863,CASH,F,NO,29000,22,T,F,T,F,F,F,F,T,F,T,T 23845,12.4227,CARD,F,YES,15400,47,F,F,T,F,F,F,T,F,F,F,F 39952,35.3369,CARD,M,NO,15900,37,F,F,F,T,F,T,T,F,T,F,F 33172,31.065,CARD,M,YES,19700,48,F,T,F,F,F,F,F,F,F,F,T 71254,17.1837,CHEQUE,F,YES,29400,45,F,T,F,F,F,T,F,F,F,F,F 36190,28.4132,CHEQUE,M,YES,15500,18,F,F,F,T,F,T,T,F,T,F,F 15099,11.2731,CARD,M,NO,15700,16,T,F,F,T,F,T,T,F,F,T,F 100256,11.9099,CHEQUE,M,NO,12800,33,F,F,F,T,F,T,T,T,F,F,F 51384,14.8697,CASH,F,NO,11200,47,F,F,F,F,F,F,F,F,F,T,F 54190,36.4736,CASH,F,YES,19300,24,F,F,F,F,F,F,F,F,F,F,F 84756,29.1981,CARD,M,YES,28300,32,F,F,F,F,F,F,F,F,F,T,T 28755,43.9948,CHEQUE,F,YES,11000,25,F,F,F,F,F,F,F,F,F,T,T 73480,13.9759,CHEQUE,M,NO,13500,41,F,F,F,T,F,T,T,F,F,F,T 86217,19.5378,CARD,M,YES,14300,43,F,F,F,T,F,T,T,F,F,F,F 91055,24.7818,CARD,F,YES,15200,23,F,F,T,F,F,F,F,F,T,F,F 80297,37.2746,CHEQUE,F,NO,19500,21,T,F,F,F,F,F,F,F,F,T,F 42381,46.0621,CASH,M,NO,13100,31,F,F,F,T,T,T,T,T,F,T,F106531,11.6576,CASH,M,NO,24500,19,T,F,F,F,F,T,F,F,F,T,F 78030,34.6469,CARD,F,NO,22100,38,F,F,F,F,T,F,F,T,F,F,T 103139,18.7964,CASH,F,YES,24400,20,F,T,F,T,F,F,F,T,F,F,F 17939,15.8755,CASH,F,NO,16900,46,F,F,F,F,F,T,F,F,F,F,F 42056,44.8521,CARD,F,YES,13900,30,F,F,F,F,F,F,F,T,F,T,F 23419,15.6201,CASH,F,NO,21000,24,F,F,F,T,T,F,F,T,T,F,F 48783,24.61,CARD,M,NO,16500,50,T,F,F,T,F,T,T,F,F,F,F 98204,18.4421,CHEQUE,M,YES,12700,18,F,F,T,T,F,T,T,F,F,F,F 67063,40.0147,CARD,F,YES,23300,46,F,T,F,F,F,F,F,T,T,T,T 77335,47.8128,CASH,F,NO,29800,40,F,F,F,F,F,F,F,T,T,F,T 32594,20.9057,CARD,F,YES,26200,16,F,F,F,F,F,F,F,F,F,F,F 24493,20.8675,CARD,M,YES,28600,45,T,T,F,F,F,F,F,F,F,T,F 72248,10.8367,CASH,M,YES,17400,28,F,F,F,F,F,F,F,F,F,F,F 79039,12.4456,CARD,M,NO,25400,46,F,F,T,F,F,F,F,F,F,F,F 58803,11.2921,CHEQUE,M,NO,13500,39,F,T,F,T,F,T,T,F,F,F,T 87066,10.8645,CARD,M,YES,25400,23,F,F,T,F,F,F,F,F,F,T,F 60159,43.2178,CARD,M,NO,11600,47,F,F,F,T,F,T,T,F,F,F,F 15629,17.004,CASH,F,YES,27700,37,F,F,F,F,F,T,F,F,F,T,F 38608,42.7334,CARD,M,YES,24400,21,F,T,F,F,F,F,T,F,F,F,F 18143,43.5884,CASH,F,YES,15900,36,T,F,F,F,T,T,F,F,F,F,F 22316,29.7579,CASH,F,YES,18000,20,F,F,F,T,T,F,F,T,T,F,F 40743,25.3732,CARD,M,YES,19200,24,F,F,T,F,F,F,F,F,F,F,F 79305,18.6381,CHEQUE,F,NO,22200,31,F,F,F,F,T,F,F,T,F,F,F 83439,33.4975,CARD,F,YES,24300,43,F,F,F,F,T,F,F,T,F,T,T 16342,46.3814,CARD,M,NO,22700,29,F,F,F,F,F,F,F,F,F,F,F 75971,16.0295,CARD,M,YES,19800,44,T,F,T,F,F,F,F,F,F,F,F 31046,16.5846,CASH,F,YES,19700,25,T,F,F,T,T,T,T,F,F,T,F 13722,36.2168,CARD,M,NO,18100,19,T,T,T,F,F,F,T,F,F,T,F 93467,11.6818,CARD,F,NO,25200,27,F,F,F,F,F,F,F,F,F,F,F 40208,23.167,CASH,F,NO,28900,40,T,T,F,F,T,T,F,F,F,F,F 41132,18.4412,CHEQUE,F,NO,19900,42,F,F,F,T,F,F,F,F,F,F,T 64596,42.1336,CASH,M,YES,24500,28,F,T,T,F,F,F,T,F,F,T,F 46539,38.3992,CHEQUE,M,NO,20400,23,T,F,T,F,T,F,F,F,F,T,F 40690,28.6205,CASH,M,NO,24800,45,F,F,F,T,F,T,F,F,T,F,F 51916,24.7427,CASH,F,NO,14000,23,F,F,T,F,T,F,T,F,T,F,F 21814,22.3741,CARD,M,NO,12200,23,F,F,F,T,T,T,T,F,F,F,F 31011,39.5627,CARD,M,NO,27100,16,T,F,F,T,F,T,T,T,F,T,F 24210,30.4335,CARD,F,YES,18300,50,F,F,F,T,F,T,F,F,F,F,F 10902,26.7182,CARD,M,NO,25300,47,T,F,F,F,F,F,F,T,F,F,F 106649,25.8123,CARD,F,NO,13700,22,T,F,F,F,F,F,T,F,F,T,F 31033,41.5652,CARD,M,NO,17800,47,F,F,T,F,F,F,F,T,F,F,T 68006,11.4931,CARD,M,YES,27800,19,F,T,F,F,F,F,F,F,F,F,F 47638,25.666,CASH,M,YES,10200,41,F,F,F,T,F,T,T,F,F,F,F21347,43.007,CHEQUE,F,YES,15900,24,F,F,F,F,T,T,F,F,F,F,T 38600,47.476,CARD,M,NO,22500,48,F,F,F,F,F,F,F,T,F,F,T 104830,21.4266,CASH,F,NO,13400,28,F,T,F,F,F,F,F,F,F,T,F 56452,20.8234,CHEQUE,M,NO,25700,48,T,T,F,F,T,F,F,F,F,F,T 18030,12.9942,CARD,F,YES,28400,29,T,F,F,F,T,F,F,F,F,F,F 72901,23.9797,CHEQUE,F,NO,13200,39,F,F,F,F,F,F,T,F,F,F,F 104554,19.0629,CASH,M,NO,10900,21,T,F,F,T,F,T,T,F,F,T,F 93162,46.8411,CARD,M,NO,20500,25,F,F,F,F,F,F,F,F,T,T,T 54313,30.6545,CASH,M,NO,27600,22,T,F,F,F,F,F,F,F,T,T,T 89485,18.3222,CASH,M,YES,25300,28,F,F,F,F,T,T,F,F,F,F,F 61309,22.5496,CHEQUE,M,YES,18100,44,F,F,F,F,T,F,F,T,F,F,F 73441,21.3574,CARD,F,NO,12800,20,T,F,F,F,T,F,F,F,F,T,F 10717,47.2705,CARD,M,NO,18900,23,T,T,F,F,F,F,F,F,F,T,F 27694,24.8952,CARD,M,YES,14700,41,F,F,T,T,T,T,T,F,T,F,F 69380,34.0379,CHEQUE,F,NO,21600,40,F,F,F,F,F,F,F,T,F,F,T 26885,33.1864,CASH,M,YES,13200,28,F,F,T,T,F,T,T,F,F,F,F 90730,29.5005,CASH,M,NO,14600,36,F,F,F,T,F,T,T,F,T,F,F 69110,11.8488,CASH,M,NO,14800,16,T,F,F,T,T,T,T,T,F,T,T 86612,29.7839,CARD,M,YES,24900,27,F,T,F,F,F,F,F,F,F,F,F 93353,36.8045,CARD,F,NO,22500,40,F,F,T,T,T,F,F,T,F,F,T 25311,47.5451,CARD,M,YES,29400,24,T,T,F,F,F,F,F,T,F,F,F 81487,20.0766,CHEQUE,M,NO,18500,25,F,F,T,F,F,T,T,F,F,F,F 18331,47.898,CARD,F,YES,27400,20,T,F,F,F,F,T,F,T,F,F,T 84148,49.1791,CHEQUE,F,NO,20900,22,T,F,F,F,F,F,T,T,F,T,T 83500,49.2505,CARD,M,YES,28300,21,F,F,F,T,T,F,F,F,F,T,T 29316,34.5206,CARD,M,NO,10800,39,F,F,F,T,F,T,T,F,T,F,F 82173,15.7511,CASH,F,NO,27800,22,T,F,F,F,T,F,T,F,F,T,F 62264,43.3344,CARD,M,YES,18200,26,F,F,F,F,F,F,F,F,F,F,T 14875,18.5153,CHEQUE,M,YES,29700,36,F,T,F,F,F,F,T,T,F,F,F 73594,13.0883,CHEQUE,F,NO,12100,41,F,F,T,F,F,F,F,F,F,F,F 79384,22.4563,CARD,F,NO,12600,45,F,F,F,F,F,F,F,F,F,T,F 63138,16.9606,CHEQUE,M,NO,17100,22,T,F,F,F,F,T,F,F,F,T,F 58144,28.8307,CARD,F,NO,29100,38,F,F,F,F,T,T,F,F,F,F,F 103446,25.3568,CARD,M,YES,17100,23,F,F,T,F,T,F,F,F,F,F,F 28994,11.2168,CASH,F,NO,18500,18,T,F,F,F,T,F,F,F,F,T,F 72298,41.0628,CASH,M,YES,17600,25,F,F,F,F,F,F,T,F,F,F,F 69884,18.91,CASH,M,YES,21800,30,F,F,F,F,F,F,F,F,T,F,T 68119,15.1803,CHEQUE,F,YES,12900,25,F,F,F,F,T,F,F,F,T,F,T 14692,40.8875,CARD,F,YES,14400,19,F,F,F,T,F,F,F,T,F,F,F 52530,28.0822,CASH,F,NO,18400,35,F,F,F,F,F,F,F,F,T,F,F 28803,41.9003,CHEQUE,M,YES,13200,38,F,F,F,T,F,T,T,F,F,T,F 86983,43.3446,CARD,F,NO,20200,17,T,T,F,F,T,F,F,T,F,T,T 72454,44.1263,CASH,F,YES,25900,27,F,F,F,F,F,F,T,T,F,F,T92868,48.3546,CHEQUE,M,NO,25000,40,F,F,F,T,F,T,F,T,F,F,F 20991,37.5076,CARD,M,YES,10500,25,F,F,F,T,F,T,T,F,F,F,F 98352,46.0629,CARD,F,NO,13300,36,F,F,F,F,T,T,F,F,F,T,F 30239,42.3719,CARD,M,YES,16100,17,T,F,T,F,F,F,F,F,T,F,F 15882,20.7035,CASH,M,YES,14700,20,F,F,F,T,F,T,T,F,F,F,F 30989,25.9133,CARD,F,NO,19900,50,F,F,F,F,F,F,F,F,F,F,T 107499,12.3961,CASH,F,YES,24800,28,F,F,F,F,F,F,F,T,T,F,F 70336,45.3326,CASH,F,YES,12200,20,T,F,T,F,F,F,F,F,F,F,F 47598,42.9427,CARD,F,YES,23900,40,T,F,F,F,F,F,T,T,F,F,T 17590,30.1201,CARD,M,YES,17200,49,F,F,F,F,F,F,F,F,F,F,F 20260,13.1243,CHEQUE,M,YES,21300,21,F,F,F,T,F,F,F,F,F,F,T 50531,37.4002,CARD,F,YES,10700,36,T,T,T,F,F,F,F,F,F,F,F 42653,14.0502,CARD,M,YES,25300,49,F,F,F,F,F,F,F,F,T,F,F 94685,31.7561,CARD,M,YES,25600,29,F,T,T,F,F,F,F,F,F,F,F 11818,31.9051,CARD,F,YES,29200,48,F,T,F,F,F,F,F,F,F,F,F 25668,21.9571,CHEQUE,F,YES,13500,19,F,F,F,F,F,F,F,T,F,F,T 53959,40.8684,CASH,F,YES,16800,27,F,T,T,F,F,F,T,F,T,F,T 55992,17.2856,CASH,M,YES,25700,30,F,F,F,F,T,F,F,F,T,T,F 85081,38.2586,CARD,F,YES,20900,29,T,F,F,F,F,F,T,T,F,F,T 104800,13.2577,CARD,M,NO,26800,29,F,F,F,F,F,F,T,F,F,F,F 92125,15.7945,CARD,F,NO,22800,17,F,F,F,T,F,F,F,F,F,F,F 107314,42.9349,CASH,M,NO,15900,26,F,F,F,T,F,T,T,T,F,F,F 29192,21.2654,CASH,M,NO,21500,29,F,T,F,F,F,F,F,F,F,F,T 90933,26.2117,CARD,M,YES,29900,31,F,F,F,F,F,F,F,F,F,F,F 48749,18.471,CARD,F,YES,21100,30,F,F,F,F,F,F,F,F,F,T,F 49658,17.2076,CARD,M,YES,17600,40,F,T,F,T,F,F,F,F,T,F,T 20521,46.3,CASH,M,NO,28200,44,T,F,F,T,F,F,F,T,F,F,F 75663,20.8372,CARD,F,YES,23400,29,F,T,F,F,T,F,F,F,F,F,F 65425,23.0249,CARD,F,YES,14300,25,F,F,T,F,F,F,T,F,F,F,F 67133,36.6913,CHEQUE,M,NO,11800,39,F,F,F,T,F,T,F,T,F,F,T 62455,35.2522,CARD,F,YES,16800,43,F,F,F,F,F,F,F,F,F,T,F 100255,22.6799,CHEQUE,M,NO,23100,30,F,F,F,F,F,F,F,T,F,F,F 15590,44.0704,CASH,M,NO,20800,41,T,F,F,T,F,F,F,F,F,T,F 46278,34.0079,CARD,M,NO,23400,40,T,T,F,T,F,F,T,F,F,F,F 12582,25.6014,CASH,M,NO,19600,23,T,T,F,F,F,F,T,T,F,T,F 38723,17.159,CHEQUE,F,NO,28400,16,T,F,F,F,F,F,T,F,T,T,F 47251,46.4065,CARD,F,YES,29100,43,T,T,F,T,F,F,F,T,T,T,T 109798,15.133,CASH,M,YES,17300,33,F,F,F,F,F,T,F,F,F,F,F 59349,28.4931,CARD,M,YES,16200,18,T,F,F,T,F,T,T,F,T,F,F 17830,28.0198,CARD,F,NO,15100,47,T,F,F,F,T,F,T,F,F,T,F 69401,36.754,CASH,F,NO,22700,25,T,F,F,F,T,F,F,T,F,F,T 103708,26.061,CASH,F,YES,28000,29,F,F,F,F,F,F,F,T,F,T,F 27664,35.6361,CASH,F,YES,19500,26,T,F,T,F,T,T,F,F,T,T,F。
数据分析知识:数据挖掘中的频繁模式挖掘
数据分析知识:数据挖掘中的频繁模式挖掘数据挖掘中的频繁模式挖掘数据挖掘是一个复杂的过程,需要从庞大的数据集中提取出有价值的信息,这些信息可以用于业务分析、决策支持、市场营销等方面。
而频繁模式挖掘,就是在大量数据中寻找频繁出现的组合,从而发现数据集中的一些结构、规律和特征,帮助人们更好地理解数据,作出可靠的决策。
本文将介绍频繁模式挖掘的概念、算法和应用,并探讨其在实践中的优势和不足之处。
一、频繁模式挖掘的概念频繁模式挖掘是数据挖掘中的一种技术,它通过数据集中的项集来寻找频繁出现的组合,从而发现数据集中的一些规律、结构和特征。
在频繁模式挖掘中,一个项集是指包含若干个属性(或特征)的集合,而频繁项集指在数据集中出现频率较高的项集。
举个例子,某超市的销售数据表格中,每一行代表一次购物,每一列代表某种商品,如果某些商品常常同时被购买,那么这些商品就组成了一个频繁项集。
对于频繁项集的挖掘,可以应用一些经典的算法,如Apriori算法、FP-growth算法等。
这些算法可以从数据集中提取出频繁项集,并进行支持度和置信度的计算,从而评估每个项集的重要性和关联性。
而支持度指项集在数据集中出现的概率,而置信度则是指在包含某项集的条件下,另一个项集出现的概率。
二、频繁模式挖掘的算法1、Apriori算法Apriori算法是频繁项集挖掘领域中的经典算法,它最早由R. Agrawal和R. Srikant于1994年提出。
该算法是基于Apriori原理的,即如果一个项集是频繁的,那么它的所有子集必须也是频繁的。
具体而言,Apriori算法的流程包括:(1)对数据集中的单个项进行扫描,统计每个项的出现次数,得到一个项集L1;(2)对于项集L1中的每一项,计算其支持度,只保留支持度大于等于设定阈值minsup的项,得到一个新的项集L2;(3)对于项集L2中的每两个项,判断它们是否能够组合成一个新的项集,如果满足条件,则进行计数,并得到一个新的项集L3;(4)重复第二步和第三步,直到无法生成新的项集为止。
数据挖掘的常用算法
数据挖掘的常用算法在大数据时代,数据挖掘成为了企业和研究机构中必不可少的一项技术。
它通过从大量数据中发现隐藏的模式、规律和趋势,为决策提供可靠的支持。
数据挖掘的核心是算法,下面将介绍一些常用的数据挖掘算法及其应用。
一、关联规则挖掘算法关联规则挖掘算法是用于发现数据集中项之间的相关性的一种方法。
最常用的关联规则挖掘算法是Apriori算法。
Apriori算法通过扫描数据集来识别频繁项集,然后从频繁项集中生成关联规则。
关联规则的一个典型应用是购物篮分析,通过挖掘购物篮中的关联规则,商店可以制定促销策略。
二、分类算法分类算法是将数据集中的实例分到不同的类别中的一种方法。
常用的分类算法包括决策树、朴素贝叶斯、支持向量机等。
决策树算法通过构建一颗树形结构来进行分类,每个节点代表一个属性,每个分支代表一个取值,通过判断实例在树上的路径来进行分类。
朴素贝叶斯算法基于贝叶斯理论,通过计算后验概率来进行分类。
支持向量机算法通过构建一个超平面将不同类别的实例分开。
三、聚类算法聚类算法是将数据集中的实例分为不同的组别来进行分析的一种方法。
常用的聚类算法包括K-means、DBSCAN、层次聚类等。
K-means算法是一种基于距离的聚类算法,通过在空间中随机选择K个中心点,然后将实例分配到离其最近的中心点所在的簇中,不断迭代直到收敛。
DBSCAN算法是基于密度的聚类算法,通过确定核心对象和直接密度可达来划分簇。
四、预测算法预测算法用于根据已知的数据来预测未来的结果。
常用的预测算法包括线性回归、逻辑回归、神经网络等。
线性回归通过建立一个线性模型来预测数值型的结果。
逻辑回归是一种广义线性模型,适用于分类问题。
神经网络模型是一种模拟人脑神经元工作方式的算法,适用于复杂的非线性问题。
五、异常检测算法异常检测算法用于发现数据集中的异常或离群值。
常用的异常检测算法包括LOF、孤立森林等。
LOF算法通过计算每个实例的局部离群因子来判断其异常程度。
新版数据挖掘第6章--挖掘频繁模式、关联和相关性:基本概念和方法
Apriori算法步骤
Apriori算法由连接和剪枝两个步骤组成。 连接:为了找Lk ,通过Lk -1与自己连接产生候选k-项集的 集合,该候选k项集记为Ck 。
(l1[1] l2 [1]) (l1[2] l2 [2]) ... (l1[k 2] l2 [k 2]) (l1[k 1] l2 [k 1])
age ( X , "30...39" ) buys ( X , " laptop _ computer" ) age ( X , "30...39" ) buys ( X , " computer" )
根据关联挖掘的各种扩充
挖掘最大的频繁模式(该模式的任何真超模式都是非频繁 的) 挖掘频繁闭项集(一个项集c是频繁闭项集,如果不存在 其真超集c’,使得每个包含c的事务也包含c’)
sup port ( A B) P( A B)
Customer buys beer
confidence ( A B) P( B | A) P( A B) / P( A)
– 置信度c是指D中包含A的事 务同时也包含B的百分比
TID 2000 1000 4000 5000
购买的item A,B,C A,C A,D B,E,F
Apriori算法:通过限制 候选产生发现频繁项集
Apriori算法是挖掘布尔关联规则频繁项集的 算法 Apriori算法利用的是Apriori性质:频繁项集 的所有非空子集也必须是频繁的。
– A B 模式不可能比A更频繁的出现 – Apriori算法是反单调的,即一个集合如果不能 通过测试,则该集合的所有超集也不能通过相 同的测试。 – Apriori性质通过减少搜索空间,来提高频繁项 集逐层产生的效率
数据挖掘中的Bagging算法原理解析
数据挖掘中的Bagging算法原理解析数据挖掘是一门通过从大量数据中发现隐藏模式、关系和趋势来提取有用信息的领域。
在数据挖掘中,有许多算法被用于处理和分析数据。
其中之一是Bagging算法,它是一种集成学习方法,通过组合多个分类器来提高预测性能。
Bagging算法的全称是Bootstrap Aggregating,它的核心思想是通过对原始数据集进行有放回抽样(bootstrap sampling),生成多个不同的训练集,并在每个训练集上训练一个基分类器。
最后,通过对这些基分类器的预测结果进行投票或取平均来得到最终的预测结果。
Bagging算法的原理可以通过以下步骤来解析:1. 数据集的有放回抽样:首先,从原始数据集中随机抽取一部分样本,抽样过程中每个样本都有可能被重复选择,形成一个新的训练集。
这个过程称为有放回抽样,它可以保证每个样本都有一定的概率被选中,同时保持了原始数据集的规模。
2. 基分类器的训练:对于每个生成的训练集,使用一个基分类器进行训练。
基分类器可以是任何分类算法,如决策树、支持向量机等。
每个基分类器使用不同的训练集进行训练,因此它们之间具有一定的差异性。
3. 集成预测:当所有的基分类器都训练完成后,使用它们对新的样本进行预测。
对于分类问题,可以通过投票的方式来确定最终的预测结果。
对于回归问题,可以取基分类器预测结果的平均值作为最终的预测结果。
Bagging算法的优势在于它能够减少过拟合的风险,提高模型的泛化能力。
通过对原始数据集进行有放回抽样,Bagging算法可以生成多个训练集,每个训练集都是从原始数据集中独立采样得到的。
这样可以使得每个训练集都具有一定的差异性,从而减少了模型对训练集的过度拟合。
此外,Bagging算法还可以通过并行计算来加速模型的训练过程。
由于每个基分类器都是独立训练的,因此可以将它们分配到不同的计算节点上进行并行计算,从而提高训练速度。
然而,Bagging算法也存在一些限制。
数据挖掘知识竞赛题库及答案
数据挖掘知识竞赛题库及答案1、什么是KDD?A、A.数据挖掘与知识发现B、B.领域知识发现C、C.文档知识发现D、D.动态知识发现答案:A--------------------------------2、数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。
A:对B:错答案:对--------------------------------3、数据挖掘的预测建模任务主要包括哪几大类问题?数据挖掘的预测建模任务主要包括哪几大类问题?()A.分类B.回归C.模式发现D.模式匹配答案:AB--------------------------------4、以下哪些学科和数据挖掘有密切联系?A、统计B、计算机组成原理C、矿产挖掘D、人工智能答案:AD--------------------------------5、离群点可以是合法的数据对象或者值。
答案:√--------------------------------1、下面哪个属于定量的属性类型:在上题中,属于定量的属性类型是:() A标称B序数C区间D相异答案:C--------------------------------2、只有非零值才重要的二元属性被称作:只有非零值才重要的二元属性被称作:()A.计数属性B.离散属性C.非对称的二元属性D.对称属性答案:C--------------------------------3、定量属性可以是整数值或者是连续值。
答案:正确--------------------------------4、中心趋势度量模(mode)是指A、算术平均值B、数据集中出现频率最高的值C、最大值D、最小值答案:数据集中出现频率最高的值--------------------------------5、以下哪些是属于中心趋势的度量A、平均值B、标准差C、五数概括D、中位数答案:平均值■中位数--------------------------------1、数据清洗的方法不包括A、缺失值处理B、噪声数据清除C、一致性检查D、重复数据记录处理答案:D--------------------------------2、对数据进行数据清理、集成、变换、规约是数据挖掘哪个步骤的任务?A、频繁模式挖掘B、分类和预测C、数据预处理D、噪声检测答案:数据预处理--------------------------------3、以下哪项不属于数据规约的方法?A、数据迁移B、维规约C、数据压缩D、数值规约答案:数据迁移--------------------------------4、大数据预处理的方法不包含以下哪个选项?A、数据清洗B、数据变换C、数据采集D、数据规约答案:数据采集--------------------------------5、在噪声数据中,波动数据比离群点数据偏离整体水平更大。
数据挖掘中的SPADE算法原理解析
数据挖掘中的SPADE算法原理解析数据挖掘是一种通过分析大量数据来发现隐藏在其中的模式和关联的技术。
而SPADE(Sequential Pattern Discovery using Equivalence classes)算法是一种常用的序列模式挖掘算法。
本文将对SPADE算法的原理进行解析。
首先,我们需要了解什么是序列模式挖掘。
在数据挖掘中,序列模式指的是一系列事件或项的组合,这些事件或项按照时间顺序排列。
序列模式挖掘的目标是发现这些事件或项之间的关联规律,从而可以预测未来的序列。
SPADE算法的核心思想是将序列数据集划分成多个等价类,然后通过计算等价类的支持度来发现频繁序列模式。
具体而言,SPADE算法通过两个步骤来实现这一目标:预处理和模式生长。
在预处理阶段,SPADE算法将序列数据集划分成多个等价类。
等价类是指具有相同前缀的序列集合,即这些序列的前缀是相同的。
通过将序列划分成等价类,可以减少计算的复杂性,提高算法的效率。
在模式生长阶段,SPADE算法通过计算等价类的支持度来发现频繁序列模式。
支持度是指在序列数据集中出现某个序列的次数。
SPADE算法通过递归地生成候选序列模式,并计算每个候选序列模式的支持度来筛选出频繁序列模式。
具体而言,SPADE算法通过两个关键步骤来实现模式生长:投影和连接。
在投影步骤中,SPADE算法根据等价类和候选序列模式生成新的等价类。
在连接步骤中,SPADE算法将新生成的等价类连接起来,形成新的候选序列模式。
通过不断地进行投影和连接步骤,SPADE算法可以生成频繁序列模式。
频繁序列模式是指在序列数据集中出现频率较高的序列模式。
通过发现频繁序列模式,我们可以了解序列数据中的规律和趋势,从而可以进行预测和决策。
总结起来,SPADE算法是一种常用的序列模式挖掘算法。
它通过将序列数据集划分成等价类,并通过计算等价类的支持度来发现频繁序列模式。
SPADE算法的核心思想是通过投影和连接步骤来生成频繁序列模式。
零售数据分析必备知识购物篮分析
零售数据分析必备知识购物篮分析零售数据分析必备知识--购物篮分析近年来,随着互联网技术的进步和数据时代的到来,零售行业逐渐开始重视数据分析的重要性。
在零售业务中,购物篮分析已经成为一项不可或缺的技术,它可以帮助零售商了解消费者的购买行为、优化产品陈列和促销策略,提升销售额和客户满意度。
然而,购物篮分析并非一件简单的事情,它需要掌握一些基本的概念和技巧。
首先,我们来了解一下购物篮分析的基本概念。
购物篮分析,顾名思义,是通过分析购物篮中各个商品的组合情况,寻找出消费者购买某些商品的规律和潜在关联。
购物篮分析的一个重要概念是“频繁项集”。
频繁项集是指在购物篮中经常同时出现的一组商品,比如经常有消费者同时购买啤酒和尿布。
通过发现频繁项集,零售商可以推断出消费者的购买喜好,从而为他们提供更加个性化的产品和服务。
购物篮分析的一个关键方法是“关联规则挖掘”。
关联规则是指通过购物篮中商品之间的关联性来发现新的知识。
在关联规则挖掘中,有两个重要的指标:支持度和置信度。
支持度是指购物篮中同时包含某些商品的频率,置信度是指购买了某个商品后,再次购买另一个商品的可能性。
通过设置这两个指标的阈值,可以筛选出具有一定关联性的商品组合。
购物篮分析还可以帮助零售商优化产品陈列和促销策略。
通过购物篮分析,零售商可以了解到哪些商品经常被同时购买,从而可以将它们放在相邻的位置,以提高销售量。
此外,通过购物篮分析,还可以了解到不同商品之间的潜在关联,从而可以设计一些搭配销售的促销策略,吸引消费者购买更多的商品。
然而,购物篮分析也存在一些挑战和限制。
首先,购物篮数据的采集和清理是一个相对复杂的过程,零售商需要投入大量的时间和人力进行数据的整理和预处理。
其次,购物篮分析只能在一定的时间范围内进行,无法预测未来的购买行为。
此外,购物篮分析单纯考虑商品之间的关联,未考虑消费者的个人特征和购买意图,因此可能会忽略一些重要的因素。
为了克服这些挑战,零售商可以使用一些先进的分析工具和技术。
数据挖掘算法之关联规则
数据挖掘算法之关联规则关联规则是数据挖掘中广泛应用的一种算法。
它可以用来发现数据集中的关联和规律。
关联规则可以用于市场篮子分析、交叉销售、购物篮分析等多个领域。
关联规则的基本原理是通过分析数据集中的项集之间的关联关系,然后找出频繁项集和关联规则。
频繁项集表示在数据集中同一项的出现频率较高,而关联规则表示项集之间的关联关系。
关联规则通常由两个部分组成,即前件和后件。
前件表示规则的前提条件,而后件表示规则的结论。
关联规则的形式可以被表示为:X->Y,其中X和Y分别是项集。
关联规则的挖掘过程一般包括以下步骤:1.数据预处理:对数据集进行预处理,包括去除不必要的项、数据清洗和去重。
2.生成项集:扫描数据集,找出所有出现频率大于设定阈值的项集。
这些项集被称为频繁项集。
3.生成关联规则:利用频繁项集生成关联规则。
遍历所有频繁项集,以每个频繁项集中的项作为前件,生成关联规则。
4.评估规则:计算关联规则的置信度和支持度。
置信度表示规则的可靠性,支持度表示规则在整个数据集中的频率。
5.选择规则:根据设定的阈值选择有意义的关联规则。
一般来说,置信度和支持度较高的规则更有意义。
关联规则算法的优点是简单有效,可以发现数据集中的隐藏规律,帮助用户做出决策。
然而,关联规则算法也有一些局限性。
首先,它只关注项集之间的关联关系,忽略了其他因素的影响。
其次,算法对大规模数据集的处理效率较低。
为了解决算法的局限性,研究者提出了许多改进的关联规则算法。
例如,Apriori算法是最早的关联规则算法,但它需要多次扫描数据集,效率较低。
FP-growth算法是一种基于频繁模式树的算法,它通过构建一颗FP树来挖掘频繁项集,大大提高了算法的运行效率。
总的来说,关联规则算法是数据挖掘中常用的方法之一、通过关联规则挖掘,有助于发现数据集中的潜在关联关系和规律,从而帮助用户做出更明智的决策。
同时,随着技术的不断发展,关联规则算法也在不断改进和优化,以适应更复杂和大规模的数据分析需求。
数据挖掘算法简介
数据挖掘算法简介数据挖掘算法是一种用于发现和提取大规模数据中有用模式和知识的技术。
它是从海量数据中分析出隐藏的信息,以帮助决策和解决问题的方法。
本文将简要介绍几种常见的数据挖掘算法。
一、关联规则算法关联规则算法用于发现数据集中的项集之间的关系。
其中最经典的算法是Apriori算法。
Apriori算法通过寻找频繁项集来建立关联规则。
频繁项集是指在数据集中经常同时出现的物品集合。
通过挖掘频繁项集,可以找到常见的交易模式或者用户购买行为,从而进行个性化推荐、市场篮子分析等。
二、分类算法分类算法用于将数据集中的实例划分到已知分类标签中的某一类别。
常见的分类算法包括决策树、朴素贝叶斯和支持向量机等。
决策树算法通过构建树形分类模型来实现分类任务,每个节点代表一个特征属性,每个分支代表该属性的取值。
朴素贝叶斯算法基于贝叶斯定理来估计分类概率,并通过选择概率最高的类别进行分类。
支持向量机算法通过构建最优超平面来实现数据的二分类任务。
三、聚类算法聚类算法用于将数据集中的实例划分为不同的类别,使得同一类别内的实例相似度高,类别间的相似度低。
其中最常用的算法是K均值算法。
K均值算法将数据集划分为K个簇,每个簇具有相似特征。
通过迭代的方式,不断优化簇的中心点,直到达到聚类效果最优。
四、回归算法回归算法用于建立输入特征与输出值之间的关系模型。
常用的回归算法包括线性回归、岭回归和逻辑回归等。
线性回归通过线性方程来建立输入特征和输出值之间的关系。
岭回归通过加入正则化参数来避免模型过拟合的问题。
逻辑回归则用于二分类或多分类任务,通过逻辑函数来建立输入特征和输出值之间的关系。
五、时序模型算法时序模型算法用于处理时间序列数据,其中最常用的算法是ARIMA和LSTM。
ARIMA算法基于时间序列的平稳性和自相关性进行建模,能够预测未来一段时间内的数值变化趋势。
LSTM(长短期记忆)模型是一种循环神经网络,能够捕捉时间序列数据中的长期依赖关系,适用于语音识别、自然语言处理等任务。
数据挖掘中的时序数据挖掘方法
数据挖掘中的时序数据挖掘方法数据挖掘是一项利用计算机技术从大量数据中提取有用信息的过程。
在数据挖掘的领域中,时序数据挖掘方法是一种重要的技术,它能够对时间序列数据进行分析和预测,从而帮助我们了解数据的趋势和模式。
时序数据是按照时间顺序排列的数据,例如股票价格、气温变化、交通流量等。
时序数据挖掘方法的目标是通过对这些数据的分析,揭示出数据背后的规律和趋势。
下面将介绍几种常见的时序数据挖掘方法。
首先,时间序列预测是时序数据挖掘中的重要任务之一。
它通过对历史数据的分析,预测未来一段时间内的数值变化。
常见的时间序列预测方法包括自回归移动平均模型(ARMA)、自回归积分移动平均模型(ARIMA)和指数平滑法等。
这些方法基于历史数据的模式和趋势进行预测,可以应用于股票市场的预测、气象预报等领域。
其次,时间序列聚类是将相似的时序数据归为一类的方法。
通过对时间序列数据的相似性度量,可以将数据划分为不同的类别。
常用的时间序列聚类方法包括k-means聚类算法和基于密度的聚类算法。
这些方法可以帮助我们对大量的时序数据进行分类和分组,从而更好地理解数据的结构和特征。
另外,时间序列关联规则挖掘是一种挖掘时序数据中关联规则的方法。
关联规则是指数据中的项之间存在的关联关系,例如购物篮分析中的“如果购买了牛奶,则很可能购买面包”。
时间序列关联规则挖掘可以帮助我们发现时序数据中的关联关系,从而可以进行更精准的预测和推荐。
常用的时间序列关联规则挖掘方法包括序列模式挖掘和频繁模式挖掘等。
此外,时间序列异常检测是一种用于检测异常值的方法。
在时序数据中,异常值往往表示数据中的异常事件或错误。
通过对时序数据的分析和建模,可以识别出异常值并进行处理。
常见的时间序列异常检测方法包括基于统计的方法和基于机器学习的方法。
这些方法可以帮助我们发现数据中的异常情况,从而及时采取措施进行调整和修正。
综上所述,时序数据挖掘方法在大数据时代具有重要的应用价值。
数据清洗数据分析数据挖掘
数据清洗数据分析数据挖掘一、数据清洗数据清洗是数据分析和数据挖掘的前提工作,其目的是去除数据集中的错误、冗余、不完整和不一致的部份,以提高数据的质量和可信度。
数据清洗包括以下几个步骤:1. 缺失值处理:对于数据集中缺失的数据,可以选择删除含有缺失值的样本或者使用插值方法进行填充,如均值填充、中位数填充等。
2. 异常值处理:异常值是指与其他观测值明显不同的数据点,可能是由于测量误差、录入错误等原因导致的。
可以通过箱线图、散点图等方法进行识别,并根据具体情况进行处理,如删除、替换为合理值等。
3. 数据去重:当数据集中存在重复的记录时,需要对其进行去重处理,以避免对分析结果的影响。
可以根据关键字段进行去重,如惟一标识符、时间戳等。
4. 数据格式转换:将数据集中的数据类型进行转换,以便后续的分析和挖掘。
例如,将字符串类型转换为数值型、日期类型转换为时间戳等。
5. 数据归一化:当数据集中的不同特征具有不同的量纲时,需要对其进行归一化处理,以避免不同特征之间的量纲差异对分析结果的影响。
常用的归一化方法有最大最小归一化、标准化等。
二、数据分析数据分析是对已清洗的数据进行统计和分析,以发现其中的规律和趋势,并从中提取有价值的信息。
数据分析可以采用多种方法和技术,包括统计分析、数据可视化、机器学习等。
以下是常用的数据分析方法:1. 描述性统计分析:通过计算数据的中心趋势、离散程度、分布形态等指标,对数据集的基本情况进行描述和总结。
常用的描述性统计指标包括均值、中位数、标准差、方差等。
2. 相关性分析:通过计算不同变量之间的相关系数,判断它们之间的相关性强弱和方向。
常用的相关性分析方法有皮尔逊相关系数、斯皮尔曼相关系数等。
3. 预测分析:通过建立数学模型,对未来的趋势和结果进行预测。
预测分析可以采用回归分析、时间序列分析、神经网络等方法。
4. 聚类分析:将数据集中的样本划分为若干个互不重叠的类别,使得同一类别内的样本相似度较高,不同类别之间的相似度较低。
R语言与关联规则挖掘—购物篮分析
R语⾔与关联规则挖掘—购物篮分析
名词:
挖掘数据集:购物篮数据
挖掘⽬标:关联规则
关联规则:啤酒=>尿布(⽀持度0.02,置信度0.6)
⽀持度:所有数据中有2%的购物记录包含了啤酒和尿布
置信度:所有包含啤酒的购物记录⾥有60%包含尿布
最⼩⽀持度阈值和最⼩置信度阈值。
项集:项(商品)组成的集合
K-项集:k个项组成的集合
频繁项集:满⾜最⼩⽀持度的项集
强关联规则:满⾜最⼩⽀持阈值和最⼩置信度阈值的规则
步骤:
找出所有频繁项集;由频繁项集产⽣强关联规则。
案例:
TID为购物记录,List of item_ID为商品ID,如第T100条购物记录中,包含商品I1,I2,I5。
最后推出的关联规则有:
(以上图⽚来源薛毅⽼师的《r modeling》)
R语⾔操作:
包:arules
数据集:Groceries(内置数据集)
函数:inspect:显检查,⽰⼀个的⽂集或⼀个术语⽂档矩阵的详细信息。
查看数据。
apriori:提取关联规则
代码:
结果如下:
结果展⽰的即为每⼀种消费记录推出同时购买某种商品的⽀持度和置信度。
最右边的lift参数表明该规则的可信度,如果等于1,啧表明前⾯的商品与关联商品是独⽴的。
lift值越⼤,表明规则越可信。
常用数据挖掘算法
常用数据挖掘算法常用数据挖掘算法(2012-02—03 22:55:42)From http://blog。
sina。
/s/blog_68ffc7a40100wnb4。
html本文对数据挖掘的基础理论,做个框架性的总结概要,罗列一些通用的数据挖掘的算法和思路,对于自己来讲是一个回顾,同时也便于自己以后查阅。
频繁模式挖掘,关系挖掘,以及相互关系挖掘所谓频繁模式挖掘,指的是比如在商品交易数据库记录中,找出一起出现的商品集合,这些商品集合出现的频率要高于一个阈值,这些经常出现的商品集合称之为频繁模式.频繁模式的思路很简单,首先统计出每个单个商品出现的次数,这就构成了一个一维表。
然后再根据一维表,商品两两组合产生一个二维表。
然后再由二维表产生三维表,直至到n维表。
其中可以利用apriori,进行剪枝,也就是说一维表中如果出现的频率低于阈值的商品,就可以直接去掉,应为包含该商品的高维商品集合的出现频率不可能高于该阈值,可以直接剪枝去掉。
频繁模式挖掘还有一种更加高效的方式,就是FP Growth,该方法通过扫描一遍数据库,在内存中构造一颗FPtree,基于这棵树就可以产生所有的频繁模式.很显然FP Growth算法的效率要高很多,但是其缺陷也很明显,在内存中维护一颗FPtree的开销也是很大的。
为了解决这个问题,一个直接的思路是将数据库水平分表到各台机器上,在各台机器上执行本地的FPGrowth,然后再将各台机器上的结果汇总起来,得到最终的FP Growth的结果。
所谓关系挖掘,值得是挖掘出各个项目之间的因果关系。
关系挖掘的基础是频繁模式挖掘,通过频繁模式挖掘,很容易得出关系,举例就很容易明白,比如我们得到一个频繁集合:那么通过排列组合可以得到l的子集集合:那么很容易得到下面的推理集合,也就是挖掘出的关系:所有的关系挖掘本质上都是基于频繁模式推导出来的。
在关系挖掘中,有一种非常有用的关系模式挖掘:mining quantitative associationrules.所谓quantitative association rules是这样一种关系模式:该关系模式的挖掘,首先是确定我们所感兴趣的属性:quan1,quan2,cat,然后根据事先确定的间隔,将quan1,quan2按照一定的间隔划分成一定的catorgory,然后进行频繁模式挖掘,得出一些关系,然后将这些关系按照grid进行聚合,生成最后的关系模式。
关联挖掘的过程
关联挖掘的过程关联挖掘的过程主要包含两个阶段:第一阶段必须从原始资料集合中,找出所有高频项目组(Large Itemsets)。
高频的意思是指某一项目组出现的频率相对于所有记录而言,必须达到某一水平。
第二阶段再由这些高频项目组中产生关联规则(Association Rules)。
关联规则是用来表示数据项之间的某种有趣的关系。
在关联挖掘中,还需要注意以下几点:支持度(Support):表示项集在所有事务中出现的频率。
一个项集的支持度是指有多少比例的事务包含这个项集。
例如,项集{啤酒, 尿布}的支持度为3%,这意味着在所有事务中有3%的事务同时购买了啤酒和尿布。
置信度(Confidence):表示在包含项集A的事务中,也包含项集B的比例。
换句话说,置信度可以看作是在购买了项集A 的商品后,再购买项集B的商品的条件概率。
例如,规则{啤酒} -> {尿布}的置信度为60%,这意味着在所有购买了啤酒的事务中,有60%的事务也购买了尿布。
提升度(Lift):表示含有项集A的事务中同时含有项集B的事务的比例,与所有事务中同时含有项集A和项集B的事务的比例之比。
提升度反映了项集A和项集B之间的关联关系是否比随机关系更强。
如果提升度大于1,表示项集A和项集B之间存在正关联;如果提升度小于1,表示项集A和项集B之间存在负关联;如果提升度等于1,表示项集A和项集B之间不存在关联关系。
在关联挖掘的过程中,通常会使用数据挖掘工具提供的算法来发现关联规则,并对这些规则进行可视化显示、理解和评估。
通过关联挖掘,可以帮助商家发现商品之间的潜在联系,从而制定更有效的销售策略和营销方案。