用MATLAB实现数据挖掘的一种算法

合集下载

matlab贝叶斯算法

matlab贝叶斯算法

matlab贝叶斯算法一、引言随着科技的发展,人工智能、数据挖掘等领域的研究日益深入,贝叶斯算法作为一种基于概率推理的方法,在这些领域中得到了广泛的应用。

MATLAB 作为一款强大的数学软件,为贝叶斯算法的实现和应用提供了便利。

本文将介绍贝叶斯算法的原理,以及如何在MATLAB中实现和应用贝叶斯算法。

二、贝叶斯算法的原理1.贝叶斯定理贝叶斯定理是贝叶斯算法的基础,它描述了在已知某条件概率的情况下,求解相关联的逆条件概率。

贝叶斯定理的数学表达式为:P(A|B) = P(B|A) * P(A) / P(B)2.概率论基础贝叶斯算法涉及到的概率论基础包括概率分布、条件概率、独立性等概念。

在实际问题中,我们需要根据已知条件来计算概率分布,从而得出相关联的概率值。

三、MATLAB实现贝叶斯算法的方法1.贝叶斯网络贝叶斯网络是一种基于贝叶斯定理的图形化表示方法,它可以帮助我们构建复杂的问题模型。

在MATLAB中,可以使用Bayes Net Toolbox工具包来创建和计算贝叶斯网络。

2.极大似然估计极大似然估计是一种求解概率模型参数的方法。

在贝叶斯算法中,我们可以通过极大似然估计来优化模型参数,从而提高预测准确性。

在MATLAB中,可以使用统计工具箱中的极大似然估计函数进行计算。

3.朴素贝叶斯分类器朴素贝叶斯分类器是一种基于贝叶斯定理的分类方法,它要求特征之间相互独立。

在MATLAB中,可以使用朴素贝叶斯分类器进行文本分类、故障诊断等任务。

四、实例分析1.故障诊断应用贝叶斯算法在故障诊断领域具有广泛的应用。

通过建立故障诊断模型,可以对设备的故障进行预测和诊断。

例如,在MATLAB中,可以使用朴素贝叶斯分类器对轴承故障数据进行分类。

2.文本分类应用贝叶斯算法在文本分类领域也具有较高的准确率。

通过构建贝叶斯网络模型,可以对文本进行自动分类。

例如,在MATLAB中,可以使用朴素贝叶斯分类器对新闻分类数据进行分类。

matlab模糊c均值聚类算法

matlab模糊c均值聚类算法

matlab模糊c均值聚类算法模糊C均值聚类算法是一种广泛应用于数据挖掘、图像分割等领域的聚类算法。

相比于传统的C均值聚类算法,模糊C均值聚类算法能够更好地处理噪声数据和模糊边界。

模糊C均值聚类算法的基本思想是将样本集合分为K个聚类集合,使得每个样本点属于某个聚类集合的概率最大。

同时,每个聚类集合的中心点被计算为该聚类集合中所有样本的均值。

具体实现中,模糊C均值聚类算法引入了模糊化权重向量来描述每个样本点属于各个聚类集合的程度。

这些权重值在每次迭代中被更新,直至达到预设的收敛精度为止。

模糊C均值聚类算法的目标函数可以表示为:J = ∑i∑j(wij)q||xi-cj||2其中,xi表示样本集合中的第i个样本,cj表示第j个聚类集合的中心点,wij表示第i个样本点属于第j个聚类集合的权重,q是模糊指数,通常取2。

不同于C均值聚类算法,模糊C均值聚类算法对每个样本点都考虑了其属于某个聚类集合的概率,因此能够更好地处理模糊边界和噪声数据。

同时,模糊C均值聚类算法可以自适应地确定聚类的数量,从而避免了事先设定聚类数量所带来的限制。

在MATLAB中,可以使用fcm函数实现模糊C均值聚类算法。

具体来说,fcm函数的使用方法如下:[idx,center] = fcm(data,k,[options]);其中,data表示样本矩阵,k表示聚类数量,options是一个包含算法参数的结构体。

fcm函数的输出包括聚类标签idx和聚类中心center。

MATLAB中的fcm函数还提供了其他参数和选项,例如模糊权重阈值、最大迭代次数和收敛精度等。

可以根据具体应用需求来设置这些参数和选项。

用MATLAB实现大数据挖掘地一种算法

用MATLAB实现大数据挖掘地一种算法

一、数据挖掘的目的数据挖掘(Data Mining)阶段首先要确定挖掘的任务或目的。

数据挖掘的目的就是得出隐藏在数据中的有价值的信息。

数据挖掘是一门涉及面很广的交叉学科,包括器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。

它也常被称为“知识发现”。

知识发现(KDD)被认为是从数据中发现有用知识的整个过程。

数据挖掘被认为是KDD过程中的一个特定步骤,它用专门算法从数据中抽取模式(patter,如数据分类、聚类、关联规则发现或序列模式发现等。

数据挖掘主要步骤是:数据准备、数据挖掘、结果的解释评估。

二、数据挖掘算法说明确定了挖掘任务后,就要决定使用什么样的挖掘算法。

由于条件属性在各样本的分布特性和所反映的主观特性的不同, 每一个样本对应于真实情况的局部映射。

建立了粗糙集理论中样本知识与信息之间的对应表示关系, 给出了由属性约简求约简决策表的方法。

基于后离散化策略处理连续属性, 实现离散效率和信息损失之间的动态折衷。

提出相对值条件互信息的概念衡量单一样本中各条件属性的相关性, 可以充分利用现有数据处理不完备信息系统。

本次数据挖掘的方法是两种,一是找到若干条特殊样本,而是找出若干条特殊条件属性。

最后利用这些样本和属性找出关联规则。

(第四部分详细讲解样本和属性的选择)三数据预处理过程数据预处理一般包括消除噪声、推导计算缺值数据、消除重复记录、完成数据类型转换(如把连续值数据转换为离散型数据,以便于符号归纳,或是把离散型数据转换为连续)。

本文使用的数据来源是名为“CardiologyCategorical”的excel文件中的“源数据”。

该数据表共303行,14个属性。

即共有303个样本。

将该数据表的前200行设为训练样本,剩下后的103行作为测试样本,用基于粗糙集理论的属性约简的方法生成相应的规则,再利用测试样本对这些规则进行测试。

首先对源数据进行预处理,主要包括字符型数据的转化和数据的归一化。

fp-tree算法的matlab程序

fp-tree算法的matlab程序

FP树算法的MATLAB程序示例FP树(频繁模式树)算法是一种用于挖掘频繁模式的数据挖掘算法。

下面是一个基于事实的FP树算法的MATLAB 程序示例:function [frequent_patterns] = fp_tree(data, min_support) % 构建频繁模式树root = create_tree(data);% 获取频繁项集frequent_patterns = mine_patterns(root, min_support);endfunction [root] = create_tree(data)root = struct('item', 'null', 'count', 0, 'children', {});% 统计每个项的计数item_counts = containers.Map();for i = 1:length(data)itemset = data{i};for j = 1:length(itemset)item = itemset{j};if isKey(item_counts, item)item_counts(item) = item_counts(item)+ 1;elseitem_counts(item) = 1;endendend% 删除不满足最小支持度的项items = keys(item_counts);for i = 1:length(items)item = items{i};if item_counts(item) < min_supportremove(item_counts, item);endend% 如果没有满足最小支持度的项,返回空树if isempty(keys(item_counts))return;end% 对每个事务中的项按照支持度降序排序for i = 1:length(data)itemset = data{i};[~, sorted_indices] = sort(cellfun(@(x) item_counts(x), itemset), 'descend');data{i} = itemset(sorted_indices);end% 构建树for i = 1:length(data)itemset = data{i};insert_tree(root, itemset, item_counts);endendfunction [] = insert_tree(node, itemset, item_counts)if isempty(itemset)return;enditem = itemset{1};child = find_child(node, item);if isempty(child)child = struct('item', item, 'count', item_counts(item), 'children', {});node.children{end+1} = child;elsechild.count = child.count + item_counts(item);endinsert_tree(child, itemset(2:end), item_counts);endfunction [child] = find_child(node, item)children = node.children;for i = 1:length(children)if strcmp(children{i}.item, item)child = children{i};return;endendchild = [];endfunction [frequent_patterns] = mine_patterns(root, min_support)frequent_patterns = struct('pattern', {}, 'support', []);if isempty(root.children)return;endfor i = 1:length(root.children)child = root.children{i};pattern = {child.item};support = child.count;frequent_patterns(end+1) = struct('pattern', pattern, 'support', support);subtree_data = get_subtree_data(child);subtree_patterns = fp_tree(subtree_data, min_support);frequent_patterns = [frequent_patterns, subtree_patterns];endendfunction [subtree_data] = get_subtree_data(node)subtree_data = {};if isempty(node.children)return;endsubtree_data = cell(1, node.count);for i = 1:length(node.children)child = node.children{i};for j = 1:child.countsubtree_data{j} = [subtree_data{j}, child.item];endendend这是一个简化的FP树算法的MATLAB实现。

k均值算法matlab -回复

k均值算法matlab -回复

k均值算法matlab -回复【k均值算法matlab】是一种常用的聚类算法,用于将具有类似特征的数据点分组。

聚类是数据挖掘领域中的一项重要任务,它能够揭示数据集中的模式和关系。

k均值算法是一种简单而强大的聚类方法,本文将逐步介绍k均值算法在matlab中的使用。

首先,我们需要明确k均值算法的原理。

k均值算法的目标是最小化数据点到其所属簇中心的欧几里得距离之和。

算法的步骤如下:1. 初始化:选择k个初始中心点,可以随机选择数据集中的k个样本作为初始中心点。

2. 分配:对于每个数据点,计算其到k个中心点的欧几里得距离,将其分配到距离最近的中心点所属的簇。

3. 更新:对于每个簇,计算该簇中所有点的平均值,将其作为新的中心点。

4. 重复2和3步骤,直到收敛。

当中心点不再变化或者达到预定的迭代次数时,停止迭代。

现在,让我们进入matlab中实现k均值算法的过程。

第一步,载入数据集。

假设我们有一个包含n个数据点的m维数据集X,其中每一行表示一个数据点,每一列表示一个特征。

在matlab中,可以用load函数将数据集载入。

第二步,初始化中心点。

使用randperm函数生成一个长度为k的随机排列向量,根据这个向量选择k个初始中心点。

可以使用matlab的randperm函数:matlabk = 3; 假设k=3rand_idx = randperm(n);centers = X(rand_idx(1:k), :); 选择前k个数据点作为初始中心点第三步,进行分配和更新。

使用一个while循环来实现k均值算法的迭代过程。

初始化一个n行1列的矩阵idx,用于存储每个数据点所属的簇的索引。

同时,使用一个变量changed来记录每次迭代中中心点是否发生变化。

代码如下:matlabidx = zeros(n, 1);changed = true;while changedchanged = false;分配for i = 1:ndist = sum((X(i,:) - centers).^2, 2);[min_dist, min_idx] = min(dist);if idx(i) ~= min_idxidx(i) = min_idx;changed = true;endend更新for j = 1:knew_center = mean(X(idx == j, :), 1);if ~isnan(new_center)centers(j, :) = new_center;endendend第四步,对结果进行可视化。

matlab lof离群点检测算法

matlab lof离群点检测算法

matlab lof离群点检测算法离群点检测是数据挖掘和统计学中的一项重要任务,它旨在识别数据集中异常或独特的数据点。

离群点通常表示数据集中潜在的异常模式、错误或欺诈行为。

在许多领域,如金融、医疗、图像处理和自然语言处理,离群点检测都有广泛的应用。

本文将介绍一种基于Matlab的LOF(Local Outlier Factor)离群点检测算法。

一、LOF算法原理LOF算法是一种基于密度的离群点检测方法。

它通过计算每个数据点对本地密度估计的影响来评估其离群程度。

算法的核心思想是,如果一个数据点与邻近数据点的分布不一致,那么它更可能是离群点。

LOF算法通过计算每个数据点对邻近数据点的局部影响,并使用这些影响来评估每个数据点的离群程度。

二、Matlab实现步骤1. 导入数据:首先,将需要检测离群点的数据导入Matlab中。

数据可以来自各种格式,如CSV文件、Excel文件或直接从其他应用程序导入。

2. 创建LOF对象:在Matlab中,可以使用fit方法创建一个LOF对象。

该对象将用于计算每个数据点的离群程度。

3. 拟合模型:使用LOF对象,可以对数据进行多次拟合,以获取每个数据点的离群程度估计。

4. 检测离群点:使用detect方法,可以检测出数据集中离群程度最高的数据点。

这些点可以被视为潜在的异常模式、错误或欺诈行为。

5. 结果可视化:可以使用Matlab的绘图功能,将检测到的离群点可视化,以便更好地理解它们的分布和性质。

三、应用示例假设我们有一组股票价格数据,我们希望检测出价格波动异常的数据点作为潜在的离群点。

首先,我们将数据导入Matlab中,并使用LOF算法创建LOF对象。

然后,我们拟合模型并检测出离群点。

最后,我们将结果可视化,以便更好地理解这些离群点的性质和分布。

四、结论LOF离群点检测算法是一种有效的离群点检测方法,它能够识别出数据集中异常或独特的数据点。

通过在Matlab环境中实现LOF算法,我们可以方便地进行离群点检测,并获得准确的离群程度估计。

蒙特卡洛算法matlab

蒙特卡洛算法matlab

蒙特卡洛算法matlab蒙特卡洛算法(MonteCarloMethod)是一种随机运行算法,它试图解决复杂问题,通过对有限尝试次数和充分大量的数据随机采样,实现预期的目标。

自上世纪30年代以来,蒙特卡洛方法已经广泛应用在金融、经济学、自然科学和社会科学等领域中。

代表性的应用是软件领域中的机器学习和自动化控制研究;在数据挖掘领域,应用更多的是数据挖掘技术。

蒙特卡洛算法在Matlab中的实现分为两个步骤:第一步是算法的建模,第二步是算法的实施。

在建模过程中,首先需要用户定义解决问题的范围,比如要解决什么类型的问题,背景是什么,以及要使用的算法的参数。

建模完成后,就可以使用MATLAB进行算法的实施,包括数据处理、模型搭建和结果输出等。

Matlab中的蒙特卡洛算法的运用非常广泛,从传统的模拟研究到复杂的机器学习应用,都可以使用它来实现。

其中,传统模拟研究要通过建立蒙特卡洛模型来模拟不同变量对系统状态的影响;而复杂机器学习应用,可以使用蒙特卡洛算法来实现自然语义分析,包括文本分析、图像分析以及视频分析等。

Matlab中的蒙特卡洛方法帮助了许多研究人员和工程师解决了许多复杂的研究问题,它展示了强大的计算机技术,使得研究变得更加高效。

同时,Matlab中的蒙特卡洛方法也能节省研究时间和成本,因此它被广泛应用于金融研究、经济学研究以及工程设计中。

此外,Matlab中蒙特卡洛方法还可以应用于数学建模、深度学习和计算机视觉等领域,帮助企业加快计算机技术的发展,以提高企业的效率和盈利能力。

总的来说,Matlab中的蒙特卡洛方法。

是一种非常强大的算法,它可以有效地解决复杂的计算问题。

它的应用范围广泛,可用于金融学,经济学,自然科学等领域,可以极大地提高企业的效率和盈利能力。

因此,在计算机技术日趋复杂的当今时代,Matlab作为一个强大的工具,可以最大限度的发挥其优势,将蒙特卡洛方法发挥到极致。

kmeans算法的matlab代码

kmeans算法的matlab代码

K-means算法是一种常用的聚类算法,在数据挖掘和机器学习领域有着广泛的应用。

它的主要思想是将数据分成K个簇,使得同一簇内的数据相似度较高,不同簇之间的数据相似度较低。

在本文中,我们将介绍K-means算法的原理,并给出其在Matlab中的实现代码。

下面是K-means算法在Matlab中的代码实现:1. 初始化簇中心```function [centroids] = initCentroids(X, K)随机初始化K个簇中心[m, n] = size(X);centroids = X(randperm(m, K), :);end```2. 分配样本到最近的簇```function [idx] = findClosestCentroids(X, centroids)根据当前簇中心,将每个样本分配到最近的簇中K = size(centroids, 1);idx = zeros(size(X,1), 1);m = size(X,1);for i=1:mmin_dist = inf;for j=1:Kdist = sum((X(i,:) - centroids(j,:)).^2);if dist < min_distmin_dist = dist;idx(i) = j;endendendend```3. 更新簇中心```function [centroids] =puteCentroids(X, idx, K) 对每个簇重新计算簇中心[m, n] = size(X);centroids = zeros(K, n);for i=1:Kcentroids(i, :) = mean(X(idx == i, :));endend```4. K-means算法主函数```function [centroids, idx] = runkMeans(X, initial_centroids,max_iters)K-means算法的主函数[m, n] = size(X);K = size(initial_centroids, 1);centroids = initial_centroids;previous_centroids = centroids;idx = zeros(m, 1);for i=1:max_iters计算每个样本到簇中心的最短距离idx = findClosestCentroids(X, centroids);更新簇中心centroids =puteCentroids(X, idx, K);endend```通过以上代码,我们可以在Matlab中实现K-means算法,并对数据进行聚类分析。

apriori算法matlab频繁模式挖掘(含代码,原始数据)

apriori算法matlab频繁模式挖掘(含代码,原始数据)

apriori算法matlab频繁模式挖掘对购买记录进行频繁模式挖掘,采用apriori算法本文档附带matlab算法以及一个案例:附件:BASKETS.txt BASKETS.xlsx 在我的文库里首先进行数据BASKETS.txt的预处理:得到BASKETS.xlsx,(第二页)Matlab代码函数:一下是用附件做的案例主函数:结果截图:附原始数据:cardid,value,pmethod,sex,homeown,income,age,fruitveg,freshmeat,dairy,cannedveg,cannedmea t,frozenmeal,beer,wine,softdrink,fish,confectionery39808,42.7123,CHEQUE,M,NO,27000,46,F,T,T,F,F,F,F,F,F,F,T67362,25.3567,CASH,F,NO,30000,28,F,T,F,F,F,F,F,F,F,F,T10872,20.6176,CASH,M,NO,13200,36,F,F,F,T,F,T,T,F,F,T,F26748,23.6883,CARD,F,NO,12200,26,F,F,T,F,F,F,F,T,F,F,F91609,18.8133,CARD,M,YES,11000,24,F,F,F,F,F,F,F,F,F,F,F26630,46.4867,CARD,F,NO,15000,35,F,T,F,F,F,F,F,T,F,T,F62995,14.0467,CASH,F,YES,20800,30,T,F,F,F,F,F,F,F,T,F,F38765,22.2034,CASH,M,YES,24400,22,F,F,F,F,F,F,T,F,F,F,F28935,22.975,CHEQUE,F,NO,29500,46,T,F,F,F,F,T,F,F,F,F,F 41792,14.5692,CASH,M,NO,29600,22,T,F,F,F,F,F,F,F,F,T,F 59480,10.3282,CASH,F,NO,27100,18,T,T,T,T,F,F,F,T,F,T,F 60755,13.7796,CASH,F,YES,20000,48,T,F,F,F,F,F,F,F,F,T,F 70998,36.509,CARD,M,YES,27300,43,F,F,T,F,T,T,F,F,F,T,F 80617,10.2011,CHEQUE,F,YES,28000,43,F,F,F,F,F,F,F,F,T,T,F 61144,10.3736,CASH,F,NO,27400,24,T,F,T,F,F,F,F,F,T,T,F 36405,34.8222,CHEQUE,F,YES,18400,19,F,F,F,F,F,T,T,F,T,F,F 76567,42.248,CARD,M,YES,23100,31,T,F,F,T,F,F,F,F,F,T,F 85699,18.1688,CASH,F,YES,27000,29,F,F,F,F,F,F,F,F,F,T,F 11357,10.753,CASH,F,YES,23100,26,F,F,F,F,F,F,T,F,F,T,F 97761,32.3184,CARD,F,YES,25800,38,T,F,F,T,F,F,F,T,F,T,T 20362,31.72,CASH,M,YES,25100,38,F,F,F,F,F,T,F,F,F,T,F 33173,36.8328,CASH,F,YES,24700,43,F,F,F,F,F,F,F,T,F,F,T 69934,31.1787,CHEQUE,F,YES,21300,41,F,F,F,F,F,F,F,F,F,T,F 14743,21.6813,CASH,M,YES,12400,48,T,T,T,T,T,T,T,T,F,F,F 83071,29.8536,CASH,M,YES,18100,31,F,F,F,F,F,F,T,F,F,F,T 17571,15.27,CARD,F,YES,22900,23,T,F,T,F,F,T,T,F,F,F,F 37917,32.2318,CHEQUE,F,NO,27000,32,F,T,F,F,F,F,F,T,F,F,T 11236,42.5669,CARD,M,YES,26800,34,F,F,F,F,F,F,F,F,F,F,F 47914,44.5913,CASH,F,YES,24700,32,F,T,F,F,F,F,F,T,F,T,T 58154,49.1367,CHEQUE,M,NO,21300,50,F,F,F,F,T,F,F,F,F,F,F 35197,40.3398,CASH,M,NO,27400,38,F,F,F,F,F,T,T,T,F,T,F 64892,38.9995,CASH,F,YES,12900,46,F,F,F,F,F,T,F,T,F,F,F 102467,13.7623,CARD,F,YES,26700,48,F,F,F,T,T,F,T,T,F,F,F 56677,30.3099,CASH,F,NO,27800,42,T,F,F,F,F,F,F,F,F,F,F 94105,10.3719,CARD,M,YES,24100,44,F,T,F,F,F,F,F,F,T,F,F 63817,29.1748,CHEQUE,M,YES,19600,28,F,F,F,F,F,F,F,F,F,F,F 44887,46.8983,CARD,M,YES,28400,41,T,F,F,F,F,F,F,F,F,F,F 69720,13.7837,CARD,F,NO,16600,41,F,T,F,F,F,F,F,F,F,F,F 97267,33.0618,CHEQUE,F,YES,10200,19,F,F,F,F,F,F,F,F,F,T,T 53750,38.5113,CHEQUE,F,YES,24800,23,F,F,F,F,F,F,F,T,F,F,T 109530,37.4844,CARD,M,NO,21100,30,F,T,F,F,F,F,T,F,F,F,F 65493,26.7732,CASH,M,YES,19900,43,F,F,F,F,F,F,F,F,T,F,F 96694,28.2755,CARD,M,NO,16300,28,F,F,F,T,T,T,T,T,F,T,F 46730,41.6178,CARD,F,NO,18700,35,T,F,F,F,T,F,F,F,F,F,F 60499,11.8442,CASH,M,YES,12800,30,T,T,F,F,F,F,F,F,F,F,F 73004,13.0578,CHEQUE,M,YES,23800,18,F,F,F,F,F,F,F,T,F,F,F 21787,19.5369,CASH,M,NO,19700,45,F,F,F,F,F,F,F,F,F,T,F 28314,38.8062,CARD,F,YES,29200,37,F,F,F,F,F,T,F,T,F,F,T 24651,32.1216,CASH,F,NO,22700,37,F,F,F,F,F,F,F,T,T,F,T 29367,43.3149,CHEQUE,M,YES,28800,35,F,F,F,F,F,T,F,F,F,F,F 15072,41.6457,CARD,M,NO,28400,34,F,F,F,F,F,T,F,F,F,F,F 33622,39.2378,CASH,M,NO,26200,25,T,F,F,F,F,F,T,T,F,T,F43550,10.5365,CASH,M,NO,10200,47,F,F,F,T,F,T,T,F,T,F,F 18724,49.1775,CASH,F,NO,13500,17,F,F,T,F,F,F,T,F,F,F,F 91019,48.4029,CARD,M,YES,24100,29,F,F,F,F,F,F,F,T,F,F,F 68193,15.7157,CARD,F,YES,29600,24,T,F,F,F,F,F,F,F,F,F,F 35262,26.2512,CHEQUE,M,YES,18100,22,T,F,F,T,F,F,T,T,F,F,F 93401,45.7963,CARD,F,YES,29700,25,F,F,F,F,F,F,F,T,F,T,T 15177,24.7919,CARD,F,NO,11700,46,F,F,F,F,F,F,F,F,F,F,T 96173,26.3483,CARD,F,NO,13800,31,F,F,F,F,F,F,F,F,T,F,F 50180,35.5435,CASH,M,YES,23700,42,F,F,F,T,T,F,F,F,T,F,T 31828,30.426,CARD,M,NO,12000,17,F,F,T,F,T,F,F,F,F,T,F 62022,42.7131,CASH,F,NO,13300,40,F,F,F,F,F,F,F,T,F,F,T 105225,28.5341,CASH,M,NO,21600,35,T,F,T,F,F,F,F,F,F,F,T 64668,31.2009,CASH,M,NO,11200,49,F,F,T,T,T,T,T,F,T,F,F 53320,46.27,CARD,M,YES,18200,39,F,F,F,F,T,F,F,F,T,T,F 15068,17.8948,CHEQUE,M,YES,21400,50,F,F,F,F,F,F,T,F,F,F,F 99849,37.0252,CASH,F,YES,11400,17,T,F,T,F,F,F,F,F,F,F,F 63694,22.3043,CARD,F,YES,11700,29,T,F,T,T,F,F,F,F,F,F,F 24874,35.938,CASH,F,YES,26700,46,T,T,T,F,F,F,F,T,F,F,T 104988,24.3263,CASH,M,NO,24800,39,F,F,F,F,T,F,F,F,F,F,F 84902,44.9991,CARD,M,YES,29600,50,F,F,F,F,F,T,F,F,F,F,F 96512,37.8721,CARD,F,NO,20500,43,T,F,F,F,F,F,T,T,F,F,T 99575,19.2134,CARD,M,YES,28100,38,F,F,F,F,F,T,F,F,F,T,F 33413,37.9016,CASH,F,NO,20700,39,F,F,F,F,F,T,F,T,F,F,T 57678,47.6595,CHEQUE,M,NO,24900,29,F,F,F,F,F,T,F,F,F,F,F 89425,28.8615,CHEQUE,M,NO,20300,17,T,F,F,T,F,F,T,F,F,T,F 60571,24.6707,CASH,F,NO,18600,29,F,F,F,F,F,T,F,F,F,T,F 76095,28.0024,CHEQUE,M,YES,11000,46,F,F,F,T,F,T,T,F,F,F,F 48247,48.6794,CHEQUE,F,NO,11000,50,F,F,F,F,F,F,F,F,F,F,F 88019,47.3606,CHEQUE,M,YES,23300,41,T,F,F,F,F,F,F,F,F,F,F 30850,17.1818,CASH,F,NO,19900,34,T,F,F,F,F,F,F,F,F,T,F 66117,25.4945,CHEQUE,F,NO,27200,26,F,F,F,F,T,F,F,F,F,T,F 97377,28.263,CARD,F,NO,12700,24,F,F,F,F,F,F,T,F,F,F,F 101722,15.7228,CHEQUE,M,NO,29400,31,F,T,F,F,F,T,F,F,F,T,F 43498,33.6065,CHEQUE,F,YES,17000,44,F,F,F,F,F,F,F,F,F,F,F 44562,13.532,CHEQUE,F,YES,28600,50,F,F,F,F,F,T,F,F,T,F,F 74710,16.3704,CARD,F,YES,27300,30,F,F,F,F,F,F,F,F,F,F,F 85585,36.426,CARD,F,YES,26300,46,F,F,F,F,F,F,F,T,T,F,T 97287,35.3706,CHEQUE,M,NO,13800,49,F,F,F,T,F,T,T,T,F,T,F 19268,25.055,CASH,F,YES,11000,29,F,F,F,F,F,F,F,F,F,F,F 50150,39.5248,CASH,F,NO,18800,27,T,F,F,F,F,F,F,T,T,T,F 67455,18.198,CARD,F,YES,19300,40,F,T,F,F,F,F,T,F,F,F,F 16350,31.8923,CARD,F,YES,22900,16,T,T,F,F,F,F,F,F,F,F,F 42778,35.2808,CASH,M,YES,15500,17,F,F,T,T,F,T,T,F,T,F,F106522,10.007,CHEQUE,M,YES,14500,22,F,F,F,T,F,T,T,F,F,F,F 36278,43.0066,CASH,M,NO,20400,40,F,T,F,F,F,T,F,F,T,F,F 26130,12.6214,CHEQUE,F,NO,18400,45,F,F,F,T,F,F,F,T,F,F,F 57851,29.562,CASH,F,YES,18700,43,T,F,F,F,T,F,T,F,F,F,T 81971,19.3672,CASH,M,NO,28200,17,T,F,T,T,F,F,F,F,F,T,F 57068,22.8535,CHEQUE,M,NO,20900,42,F,F,T,F,F,F,F,F,F,F,F 69122,32.0161,CARD,M,YES,29300,34,F,F,T,F,T,F,F,F,F,F,F 68489,22.5684,CHEQUE,F,YES,24900,18,F,F,F,F,F,T,F,F,F,T,F 46471,25.4795,CHEQUE,M,YES,17100,23,F,F,F,F,F,F,F,F,F,F,F 88359,23.0214,CARD,F,YES,19100,21,T,T,F,F,F,F,F,F,F,F,T 44294,38.5314,CASH,M,NO,16300,18,F,F,T,T,F,T,T,F,F,F,F 95604,23.5058,CHEQUE,M,NO,11600,44,F,F,F,T,T,T,T,T,F,T,F 103596,27.4252,CARD,F,NO,12300,26,F,F,F,F,T,F,F,F,T,F,F 103473,25.0338,CHEQUE,F,YES,12100,26,F,F,F,F,T,T,F,F,F,F,F 94467,18.9589,CASH,M,YES,16600,49,F,F,F,T,F,T,T,F,T,T,F 38097,37.1385,CASH,M,NO,11700,19,T,F,F,T,T,T,T,T,F,T,F 49632,10.7717,CARD,M,NO,21700,21,F,F,F,T,T,F,F,F,F,T,T 82558,10.1074,CARD,F,YES,27500,22,F,T,F,F,F,F,T,T,T,F,F 50324,20.1004,CASH,M,YES,28900,16,F,T,F,F,F,F,F,F,T,T,F 38468,42.7908,CARD,F,YES,18300,23,F,F,F,F,F,F,F,F,F,F,F 38055,14.4497,CARD,F,YES,22600,25,T,F,F,F,F,F,F,F,F,F,F 74876,18.2937,CASH,M,YES,17100,45,F,F,T,F,F,F,T,F,F,F,T 18079,24.816,CARD,M,YES,19800,32,F,F,T,F,F,F,F,T,F,F,F 16316,39.1701,CHEQUE,M,NO,23300,22,T,F,T,F,F,T,F,F,F,T,F 37166,16.4835,CARD,F,NO,21600,23,T,F,F,F,F,F,T,F,F,T,F 18334,42.4343,CASH,F,NO,25900,43,F,F,F,F,F,T,F,T,F,F,T 102645,13.4218,CARD,F,YES,17200,23,F,F,F,T,T,F,F,F,F,F,F 101100,18.9591,CARD,M,YES,16600,42,F,F,F,T,F,T,T,T,F,F,F 64861,18.7711,CASH,M,YES,27200,49,F,F,T,F,F,T,T,F,F,F,T 19041,14.6823,CARD,F,NO,21100,23,T,T,F,T,F,F,F,F,F,T,F 85771,10.0455,CARD,F,NO,15700,36,F,F,F,F,T,F,F,T,F,F,T 79303,39.6497,CASH,M,NO,17000,19,T,F,T,F,F,F,F,F,F,T,F 92675,44.5153,CHEQUE,F,NO,18100,47,F,T,F,F,F,F,F,F,F,F,F 71690,13.6361,CASH,F,NO,29300,18,T,F,F,F,F,F,T,F,T,T,F 86350,12.184,CARD,F,NO,18200,49,F,F,F,F,F,T,F,F,T,F,F 88260,29.7785,CARD,F,NO,12000,34,F,F,T,T,F,F,F,F,F,F,F 86759,48.4566,CARD,F,NO,14800,34,F,F,F,T,F,F,F,F,F,F,F 49861,38.8491,CASH,M,YES,20300,32,F,F,F,F,F,F,T,F,F,F,F 21543,13.9176,CHEQUE,F,NO,28900,27,F,F,F,T,F,T,F,T,T,F,F 70481,31.7001,CHEQUE,M,YES,29800,30,F,F,F,T,F,F,T,F,T,T,F 29944,42.8985,CASH,M,NO,29800,18,T,F,F,F,F,T,T,F,T,T,F 46054,14.2814,CARD,M,NO,15000,46,F,T,F,T,T,T,T,F,T,F,T 61329,26.9282,CARD,F,YES,17200,49,T,F,F,F,F,F,F,F,F,F,F58768,18.0798,CHEQUE,F,YES,10800,16,F,F,F,F,F,F,F,T,T,F,F 71343,48.2751,CASH,M,YES,13700,38,F,F,F,T,F,T,T,F,F,F,F 55418,20.8812,CARD,F,YES,16800,23,T,F,F,F,F,F,F,F,F,F,F 18228,31.7275,CASH,M,NO,17700,41,F,F,F,T,F,F,F,F,F,F,F 37305,33.9607,CARD,M,NO,18200,49,F,F,F,F,F,F,F,F,F,F,F 30243,30.3916,CASH,M,YES,11500,33,F,T,F,T,T,T,T,T,F,F,T 59599,27.4881,CASH,F,YES,18700,28,F,F,F,F,T,T,T,F,F,F,F 61869,31.8011,CASH,M,NO,12100,46,T,F,F,T,F,T,T,T,F,F,F 10360,27.4012,CHEQUE,M,NO,13400,20,F,F,F,T,F,T,T,F,F,T,F 83338,26.2061,CASH,M,NO,18500,41,F,F,F,F,T,F,F,F,F,F,F 39080,18.3878,CARD,F,YES,21000,36,F,F,F,T,F,F,F,F,F,T,F 84799,31.3192,CARD,M,YES,17600,21,F,T,F,F,T,F,F,F,F,F,F 51979,20.5285,CARD,M,YES,11100,16,F,F,F,T,T,T,T,F,F,F,T 40505,43.0394,CARD,F,NO,25400,50,F,T,T,F,F,F,F,T,F,F,T 37098,26.6378,CARD,F,YES,14100,37,T,T,F,F,F,F,F,F,T,F,F 29524,10.7127,CASH,F,YES,25100,37,F,F,F,T,F,F,F,F,F,F,F 63452,17.8916,CASH,M,NO,12000,48,F,F,F,T,T,T,T,F,F,F,F 20158,23.7441,CHEQUE,M,YES,29000,43,F,F,F,F,T,F,F,F,F,T,F 70182,11.3005,CARD,F,YES,12200,18,F,F,F,T,F,T,F,F,F,F,F 56034,41.2711,CASH,M,NO,14100,16,T,T,F,T,F,T,T,F,F,T,F 44235,27.7268,CASH,F,YES,23200,41,F,F,T,F,F,F,T,T,F,F,T 96881,14.6112,CARD,M,YES,11900,39,F,F,F,T,T,T,T,T,F,F,F 27166,13.4513,CASH,F,YES,25100,44,F,F,F,F,F,F,F,F,F,F,F 39884,31.2737,CASH,M,NO,29700,21,F,F,F,F,F,F,F,T,F,F,F 95141,45.3427,CARD,F,YES,20900,37,T,F,F,F,F,F,F,T,F,F,T 28110,27.6974,CARD,M,YES,12100,21,F,F,F,F,F,T,F,F,F,F,F 85259,40.9303,CARD,F,YES,11000,22,T,F,F,F,F,T,T,F,F,F,F 14996,22.2591,CASH,M,YES,26100,17,F,T,T,T,F,T,F,F,F,T,T 55652,41.7166,CARD,M,NO,14100,20,T,F,F,T,F,T,T,F,F,T,F 43964,29.4585,CASH,F,NO,18500,24,T,F,F,T,F,F,F,T,F,F,F 51183,22.3157,CASH,F,NO,23100,25,F,F,F,F,F,F,F,F,F,F,F 29310,49.8459,CASH,M,YES,28900,22,F,F,F,F,F,F,F,T,T,F,F 21187,20.5744,CHEQUE,F,YES,15400,36,F,T,F,F,F,F,T,F,F,F,F 83536,31.9368,CASH,F,NO,11600,22,F,F,F,F,F,F,T,F,T,T,F 95887,43.1964,CASH,M,NO,12500,27,F,F,F,T,T,T,T,F,T,F,F 88176,34.5366,CARD,F,YES,28300,31,F,F,T,F,F,T,F,T,T,F,T 65418,38.6017,CASH,F,YES,24600,48,F,F,F,F,F,F,F,T,F,F,T 27766,40.0773,CARD,F,NO,18900,34,T,F,F,F,F,F,T,F,F,F,F 66191,37.5233,CASH,F,NO,22600,35,T,F,T,F,F,T,T,F,F,F,F 108764,44.6294,CASH,M,YES,10200,27,F,F,F,T,F,T,T,T,F,T,F 12782,31.3296,CHEQUE,F,NO,20300,31,F,F,F,T,F,F,T,F,F,F,F 75118,31.7774,CHEQUE,F,YES,22200,49,F,F,F,F,T,F,F,F,F,F,F 58188,36.0631,CARD,M,NO,29900,19,T,F,F,F,T,F,F,F,F,T,F95479,45.7417,CHEQUE,M,NO,22700,32,F,F,F,T,T,F,F,T,F,F,T 59439,20.7784,CASH,M,YES,22000,24,T,F,F,F,F,F,T,F,F,F,F 104903,34.4437,CASH,F,NO,28200,30,T,F,F,F,F,F,F,T,F,F,T 44825,36.9448,CARD,F,NO,12600,50,F,T,F,F,F,F,F,F,F,T,T 71887,30.067,CASH,M,NO,14700,46,F,T,F,T,F,T,T,T,F,T,T 18708,30.7868,CASH,F,YES,25900,35,F,F,F,T,T,T,T,F,F,T,F 74423,22.3177,CASH,F,YES,20000,18,F,F,F,F,F,F,T,F,F,F,F 97967,11.5144,CASH,F,NO,27600,48,F,F,F,F,F,F,F,F,T,T,F 20386,39.8296,CHEQUE,F,YES,15400,32,F,F,T,F,F,F,F,F,F,F,F 77218,38.2717,CARD,M,NO,16500,34,T,F,F,T,F,T,T,T,F,T,F 80137,12.847,CASH,F,NO,22200,33,F,F,F,F,F,F,F,F,F,F,F 84092,34.8497,CARD,F,NO,22000,48,T,F,T,F,F,T,F,T,T,T,T 58914,28.9163,CARD,F,YES,25500,50,F,F,F,F,F,T,F,F,F,F,F 16287,42.5534,CASH,F,NO,25800,16,T,F,F,F,F,F,F,T,T,F,T 86044,30.5434,CARD,M,NO,13900,30,F,F,F,T,F,T,T,T,T,F,F 36927,20.1812,CHEQUE,M,NO,11100,35,F,F,F,T,F,T,T,F,F,F,T 93304,42.4567,CARD,M,NO,28200,34,F,F,F,F,F,T,F,F,F,F,T 66988,17.9591,CARD,M,YES,12300,43,F,F,F,T,F,T,T,F,F,T,F 55091,40.2274,CASH,M,NO,24400,19,F,F,F,F,T,F,T,F,F,F,F 64215,17.0993,CASH,M,NO,15300,42,T,F,F,T,T,T,T,F,F,F,F 28629,44.8107,CASH,M,NO,26200,31,F,F,F,F,F,F,T,F,F,F,T 98383,33.8642,CASH,M,NO,24500,32,F,F,F,T,T,T,F,F,F,F,T 107505,21.3633,CASH,F,YES,25000,32,F,F,F,F,F,F,F,F,F,F,T 99578,15.7681,CARD,M,NO,24300,27,F,F,F,F,T,F,F,F,T,F,T 28979,35.8494,CHEQUE,F,YES,20100,21,F,F,F,T,F,F,F,T,F,F,T 102733,28.5154,CASH,F,NO,17200,24,T,F,F,F,F,F,F,F,F,T,T 81690,37.3617,CARD,F,NO,23900,36,F,F,F,F,F,F,F,T,F,F,T 25405,36.4166,CARD,M,NO,27600,36,F,F,F,F,T,F,F,F,F,T,F 85348,40.2677,CHEQUE,F,YES,12400,24,F,F,F,F,T,F,F,F,F,F,F 19915,40.0868,CASH,F,NO,15700,21,T,F,F,F,T,F,F,F,F,T,F 99387,10.6184,CASH,F,NO,16500,49,F,T,F,F,T,F,F,F,F,F,T 32380,11.1224,CARD,F,YES,18900,20,T,F,F,T,F,F,F,T,F,F,F 39914,36.7285,CARD,F,YES,13700,26,T,F,T,F,F,F,F,F,F,F,F 57952,35.1487,CHEQUE,F,NO,26900,48,F,F,F,T,F,F,F,T,F,F,T 64239,27.5083,CARD,M,YES,15800,22,F,F,F,T,F,T,T,T,T,F,F 38014,23.331,CHEQUE,F,NO,16000,42,F,T,F,T,T,T,F,F,T,F,F 21875,10.7267,CASH,F,NO,25000,17,T,F,F,F,F,F,F,T,F,T,F 37939,49.7316,CARD,M,YES,28300,18,T,T,F,F,T,F,F,F,T,F,F 109061,37.3485,CASH,F,NO,27800,50,F,T,F,F,F,F,F,T,F,F,T 100754,11.3294,CHEQUE,F,NO,17100,16,T,F,F,T,F,T,F,F,F,T,F 28313,34.8889,CASH,F,NO,27700,48,T,F,F,F,F,F,F,T,F,F,T 82753,37.5762,CHEQUE,F,YES,23200,42,T,T,T,F,F,F,F,T,F,F,T 105412,18.3099,CASH,M,NO,18500,29,F,F,F,F,F,F,T,F,F,F,F 42583,35.6757,CASH,F,YES,13300,24,F,F,F,F,F,F,F,F,F,F,F89233,37.6838,CARD,F,YES,28400,17,F,T,F,F,F,F,F,F,F,F,F 76777,43.748,CARD,F,NO,26900,28,F,F,F,F,F,F,F,T,F,F,T 16220,34.7872,CHEQUE,M,NO,15300,33,F,F,F,T,F,T,T,F,T,F,T 17864,35.6562,CHEQUE,F,NO,28900,18,T,F,T,F,F,F,F,T,F,T,T 87270,31.4868,CHEQUE,M,NO,21300,29,F,F,T,T,T,F,F,T,F,F,F 34593,35.8231,CARD,M,YES,26800,50,F,F,T,F,T,T,F,T,F,F,F 67697,12.9477,CARD,M,NO,18200,44,F,F,T,F,F,T,F,F,F,F,F 32302,33.8303,CARD,F,YES,12500,37,F,F,F,F,F,F,F,F,F,F,F 15663,45.1901,CARD,F,YES,19700,45,F,F,F,F,F,F,T,F,F,F,F 108601,14.1216,CASH,M,NO,17100,49,F,F,F,F,F,F,F,T,F,T,F 55951,15.6793,CARD,M,NO,23600,39,F,F,F,F,F,F,F,T,F,F,T 39817,13.2005,CASH,F,YES,17500,49,F,F,F,F,F,F,T,F,F,F,F 19613,46.1507,CARD,F,YES,11000,45,F,F,F,F,T,F,F,F,F,F,F 71600,47.3234,CHEQUE,M,NO,12400,33,T,F,F,T,T,T,T,T,F,T,F 96561,30.3759,CARD,M,NO,17000,29,F,F,F,F,F,F,F,F,F,F,F 90861,38.2559,CASH,F,YES,18600,29,T,T,F,F,F,F,F,F,F,F,T 68501,15.3726,CHEQUE,F,NO,24000,31,T,T,F,F,F,F,F,F,T,T,F 30132,23.9357,CASH,M,NO,15700,23,T,F,T,T,F,T,T,F,F,T,F 78639,32.0691,CASH,M,NO,27900,48,F,F,F,F,F,F,F,F,F,T,F 46419,45.3239,CARD,F,NO,20000,27,F,F,F,F,F,F,F,F,F,F,T 50633,23.0638,CHEQUE,M,YES,19200,46,F,F,F,F,F,F,F,F,F,F,T 11553,15.1133,CASH,M,NO,28300,27,F,F,F,F,F,F,F,F,F,F,T 65853,20.6815,CASH,M,YES,17500,33,T,F,T,F,F,F,F,F,F,F,F 47547,42.8159,CASH,F,YES,16900,46,F,F,F,F,F,F,F,F,T,F,F 38360,35.0157,CASH,F,YES,14700,27,F,F,F,T,F,F,F,F,F,F,F 107728,16.9603,CHEQUE,F,NO,26800,49,F,T,F,F,F,T,T,T,F,F,F 30390,26.6278,CASH,M,YES,21400,25,F,F,F,F,F,F,F,F,T,F,F 75815,19.1927,CARD,F,YES,19200,40,F,F,F,F,F,T,F,T,F,F,T 106288,10.0926,CHEQUE,F,YES,12300,23,F,F,F,T,F,F,F,F,F,F,T 88596,34.1082,CASH,F,NO,28400,38,F,F,T,F,F,F,F,T,T,F,T 93469,32.7656,CHEQUE,M,NO,24800,16,T,F,T,T,T,T,F,F,T,T,F 34756,15.2704,CARD,F,YES,15900,18,F,F,F,F,F,F,F,F,F,F,F 12584,46.6323,CARD,F,YES,17400,29,T,F,F,F,F,F,T,T,F,F,T 107080,29.4064,CARD,F,NO,25100,43,F,F,F,T,F,F,F,F,F,F,F 73651,14.1309,CASH,M,YES,11700,22,T,T,F,F,F,F,F,F,F,F,F 54180,43.0372,CASH,M,NO,13500,32,F,T,F,T,F,T,T,F,F,F,F 45102,32.5518,CASH,M,NO,28800,16,T,F,F,F,F,T,F,F,F,T,F 85475,37.0037,CARD,M,YES,24500,47,T,F,F,F,F,F,F,T,F,F,F 78363,49.4132,CARD,M,YES,10600,18,T,F,F,T,F,T,T,T,F,F,F 23718,37.8611,CHEQUE,M,YES,29700,37,F,F,F,T,F,T,F,T,F,T,F 54152,20.595,CARD,M,YES,24400,38,F,F,F,F,F,T,T,T,F,F,F 93963,49.1922,CARD,M,YES,25100,21,F,T,F,F,F,F,F,F,F,F,F 35561,34.4236,CASH,M,YES,13300,24,F,F,F,F,F,T,F,F,F,F,T 30371,30.8872,CARD,F,YES,23100,24,T,F,F,F,F,F,F,F,F,F,F93669,27.7032,CHEQUE,F,NO,21600,37,F,F,F,T,F,F,F,T,F,F,T 70858,20.9462,CASH,M,YES,17600,46,T,T,F,T,F,F,F,F,F,T,T 103147,43.8622,CARD,M,YES,18100,28,F,F,F,T,F,F,F,F,F,F,F 80198,34.267,CARD,F,NO,28300,47,F,F,F,F,F,F,T,T,F,F,T 42459,32.6446,CARD,F,YES,23800,47,F,F,F,F,T,T,F,T,T,F,T 36631,27.0515,CASH,M,YES,22100,16,F,F,F,F,F,F,F,F,F,F,F 43800,44.2831,CARD,F,YES,27900,36,F,F,F,T,F,F,T,T,F,F,T 60240,21.9871,CASH,M,YES,23800,45,F,F,F,F,F,F,F,F,F,F,F 29640,28.5955,CASH,F,NO,17800,27,F,F,F,T,T,T,F,T,F,F,F 109000,14.9647,CASH,F,YES,17800,22,F,F,F,T,T,F,F,T,T,F,F 108739,10.9737,CASH,M,NO,20800,29,T,F,F,F,F,F,F,T,T,F,T 104165,32.2963,CARD,M,NO,25400,43,F,F,F,F,F,F,F,T,F,F,F 73630,10.4506,CARD,F,NO,19800,25,F,F,F,T,T,F,F,T,F,F,F 25765,35.6814,CHEQUE,F,YES,30000,25,F,F,F,F,F,F,F,T,F,F,T 84903,32.8053,CARD,F,NO,29600,17,T,F,F,F,F,T,F,F,T,T,F 99347,34.6651,CARD,F,YES,23100,44,F,T,T,T,F,F,F,T,F,F,T 41157,20.2332,CASH,F,NO,15200,40,T,F,T,F,T,T,F,F,T,F,F 20325,15.356,CARD,M,YES,26600,24,F,T,T,F,F,T,F,T,F,F,F 71462,40.9979,CARD,F,YES,26300,42,F,T,F,F,F,F,F,T,F,F,T 91928,12.3639,CARD,F,NO,14300,19,T,F,F,F,T,F,F,T,T,T,T 80306,31.9965,CASH,F,NO,15200,27,F,F,T,F,T,T,T,T,F,F,F 78113,14.3918,CASH,F,YES,23800,22,T,F,F,T,F,F,F,T,F,F,F 95488,11.9753,CARD,F,NO,18100,26,T,F,T,F,F,F,F,F,F,F,F 27720,37.4582,CARD,F,NO,13400,16,F,F,F,F,F,T,F,F,F,T,F 76264,15.99,CHEQUE,M,NO,29700,16,T,T,F,F,F,F,F,F,F,T,F 38477,13.8168,CASH,M,YES,16500,38,F,T,F,F,F,F,F,F,F,F,T 43557,24.5056,CASH,F,YES,10800,25,T,F,F,F,F,F,F,F,F,F,F 10609,14.2389,CHEQUE,F,NO,16700,41,T,F,F,F,F,F,F,F,F,T,F 73259,16.8793,CARD,F,NO,24700,42,T,F,F,F,T,F,F,F,F,F,F 18920,45.3683,CASH,M,NO,15800,49,F,F,F,T,F,F,F,T,T,F,F 39581,29.2526,CASH,F,YES,27900,49,F,F,F,F,F,F,F,F,F,F,F 14912,39.1559,CHEQUE,M,YES,28100,28,F,F,F,T,F,T,T,T,F,F,F 80438,15.8347,CARD,M,NO,19600,38,F,F,F,F,F,F,F,T,F,F,T 81034,20.9511,CHEQUE,M,YES,12800,28,F,T,F,T,T,T,T,F,F,F,F 89250,43.6042,CASH,F,NO,27900,29,F,T,F,F,T,F,F,T,F,F,T 96982,15.4964,CARD,M,YES,15300,49,T,F,F,T,F,T,T,F,F,F,F 89872,15.6822,CARD,F,YES,19100,40,F,F,F,F,F,F,T,F,F,F,F 71140,22.0941,CARD,M,YES,25800,42,F,F,F,F,F,F,T,F,F,F,F 83650,33.5584,CASH,F,YES,27000,22,F,F,F,F,F,F,F,F,F,T,F 14891,18.391,CASH,F,NO,27400,26,F,F,F,T,F,F,F,F,F,F,F 83523,45.8037,CASH,M,NO,17400,40,F,F,F,F,F,F,F,F,F,F,F 48896,30.4368,CASH,F,YES,17200,22,F,F,F,F,F,F,F,F,F,F,F 68438,23.4241,CASH,F,YES,21700,46,T,F,F,F,F,F,F,F,F,F,T 86681,15.0004,CHEQUE,F,NO,13500,50,F,F,F,F,F,F,F,F,F,F,F66267,15.686,CASH,F,NO,27300,21,T,T,T,F,F,F,T,T,F,T,T 87975,27.82,CARD,F,NO,17900,26,F,F,T,F,F,F,F,F,F,T,F 39970,46.7406,CHEQUE,M,YES,13900,22,F,F,F,T,F,T,T,F,F,F,F 104111,27.4529,CARD,F,YES,12300,20,F,F,T,F,F,F,F,F,F,T,T 92209,30.904,CHEQUE,F,YES,22700,17,F,T,T,F,T,F,F,F,F,F,F 66711,41.407,CASH,F,NO,15400,48,F,F,T,F,F,F,F,F,F,F,F 102215,13.1647,CASH,M,YES,14400,47,F,F,F,T,F,T,T,F,F,F,F 34750,21.9036,CARD,F,NO,27800,48,T,F,F,T,T,F,T,F,F,F,F 62060,40.7025,CARD,M,YES,11100,42,F,F,F,T,F,T,T,F,F,F,F 25524,45.9486,CARD,M,NO,25900,36,F,F,F,T,T,T,F,F,F,F,F 45992,13.6452,CASH,F,YES,16500,49,F,F,F,F,F,F,F,F,F,F,F 47341,31.9765,CARD,M,NO,20300,16,T,F,F,F,F,T,F,F,F,T,T 67799,16.9724,CARD,F,NO,21300,16,T,F,F,F,F,T,F,F,F,T,T 47136,22.032,CASH,F,NO,24400,43,F,F,F,F,F,F,F,F,F,T,F 17375,12.7641,CHEQUE,M,YES,21800,22,F,F,F,F,T,F,F,F,F,F,F 40789,11.186,CASH,F,NO,12800,16,T,F,T,F,F,F,F,F,F,T,T 27673,37.5651,CASH,F,YES,29000,36,F,F,T,F,F,T,T,T,F,F,T 45375,39.4947,CARD,M,NO,25100,50,F,F,F,F,T,T,F,F,F,F,F 58341,32.8363,CASH,F,YES,12900,38,F,F,F,T,T,F,F,F,F,F,F 37523,27.6713,CARD,F,NO,25200,16,T,T,T,T,F,F,F,T,T,T,F 84042,18.1849,CASH,M,NO,14200,27,F,T,F,T,T,T,T,F,F,F,F 64561,23.6794,CASH,F,YES,28200,33,F,F,F,F,T,F,F,F,T,F,F 71078,10.8529,CARD,M,YES,23800,31,F,F,F,F,F,F,F,F,F,F,F 43044,29.8836,CASH,M,YES,21700,32,T,T,F,F,F,F,F,F,T,F,F 32369,21.9204,CHEQUE,M,YES,23500,21,F,F,F,T,F,F,F,F,F,F,T 31552,36.2776,CARD,M,YES,23700,17,T,F,T,F,F,F,F,F,F,F,T 41805,48.5787,CASH,M,NO,16300,25,F,F,F,T,F,T,T,F,F,T,T 46686,29.5925,CHEQUE,F,NO,17500,34,F,F,T,F,F,F,F,F,F,F,F 95896,37.2821,CARD,M,YES,29100,21,F,F,F,F,F,F,F,T,F,F,F 63829,29.8575,CARD,F,NO,13100,45,F,F,F,F,F,F,T,F,F,F,T 84180,10.4233,CHEQUE,M,YES,12800,47,F,F,F,T,F,T,T,F,F,F,F 91972,49.1579,CARD,F,NO,26700,18,T,F,F,F,F,T,F,T,F,T,T 40542,44.2289,CARD,F,NO,16300,42,F,F,F,F,F,F,F,F,F,F,F 44452,12.6097,CARD,F,NO,11900,30,T,F,F,F,T,F,T,F,F,F,F 87151,44.1181,CHEQUE,F,NO,21400,30,F,F,T,F,T,T,F,T,F,T,T 23501,10.225,CASH,M,YES,23000,49,F,F,F,F,F,F,F,T,T,T,T 25387,11.4154,CARD,F,YES,14900,36,F,F,F,F,F,F,F,F,F,F,F 96584,17.3355,CASH,M,YES,26600,39,T,F,F,F,F,F,F,F,T,F,F 15306,22.3248,CASH,M,NO,16500,41,F,F,F,T,T,T,T,F,F,F,F 93920,22.5392,CARD,M,YES,16100,18,F,T,F,T,F,T,T,T,F,F,F 103316,29.3125,CASH,M,YES,17900,46,F,T,F,F,F,F,F,F,F,F,T 17110,12.7214,CASH,M,YES,14700,45,F,F,F,T,T,T,T,F,F,F,F 71652,34.0689,CARD,M,YES,13300,29,F,F,T,T,F,T,T,F,F,F,F 67211,16.8537,CARD,F,NO,23600,43,F,F,F,F,F,F,F,F,F,F,F29224,40.9484,CARD,F,NO,24900,16,T,F,F,F,T,F,T,T,F,T,T 46005,30.8594,CARD,M,NO,26200,32,F,F,F,F,F,F,F,F,F,F,F 43111,43.4371,CASH,F,YES,11400,27,F,F,T,T,F,F,F,F,T,F,F 18126,34.7134,CARD,F,NO,14200,19,T,F,F,T,F,F,F,T,T,T,F 87101,23.0974,CHEQUE,M,NO,15000,23,T,F,F,F,T,T,F,F,F,T,T 102934,37.7352,CHEQUE,F,NO,29400,45,T,F,F,F,F,F,F,T,F,F,T 100328,30.4099,CHEQUE,M,YES,10700,36,F,T,F,T,F,T,T,F,F,T,F 94108,21.3634,CASH,M,NO,18500,42,F,F,T,F,F,F,F,T,T,F,F 47913,49.0675,CHEQUE,F,NO,28900,25,F,F,T,F,F,F,F,T,F,F,T 17809,39.6015,CARD,M,YES,27100,20,F,F,F,F,F,F,F,F,F,F,T 45019,47.2341,CARD,M,NO,19800,48,F,T,F,F,F,F,F,F,F,F,F 55552,41.6462,CARD,M,YES,19800,50,T,F,F,F,F,F,F,F,F,T,F 92883,18.8207,CARD,F,NO,24500,27,T,F,F,F,F,F,F,F,F,F,F 89649,26.9621,CHEQUE,F,NO,28200,24,T,F,F,F,F,F,F,F,F,T,T 38063,36.0742,CASH,F,NO,29400,16,T,F,F,F,F,F,F,T,F,T,T 11230,46.279,CASH,M,NO,24400,42,F,F,T,F,F,F,F,F,F,T,T 89302,20.4889,CARD,F,YES,12000,39,F,F,F,F,F,F,F,F,F,T,F 35707,16.5348,CASH,M,NO,25300,42,F,F,F,F,F,F,F,F,T,T,F 90264,10.4971,CARD,M,NO,24300,18,T,F,F,F,F,F,F,F,F,T,F 79875,10.0844,CHEQUE,F,NO,19800,39,F,T,F,F,F,F,F,F,F,F,F 74463,16.7073,CARD,F,YES,25400,36,F,F,F,T,F,T,F,F,T,F,F 56258,21.5804,CARD,F,NO,14500,48,T,F,F,F,F,F,F,T,T,F,F 81836,32.9521,CHEQUE,M,NO,11800,48,F,F,F,F,F,T,F,F,T,T,F 95026,13.4226,CASH,F,YES,13400,29,F,F,T,F,F,F,F,F,F,T,T 87482,40.101,CARD,F,YES,14200,38,T,F,F,F,T,T,F,T,F,F,F 20556,20.4104,CARD,M,NO,13900,18,T,F,F,F,F,F,T,F,F,T,F 68058,49.8863,CASH,F,NO,29000,22,T,F,T,F,F,F,F,T,F,T,T 23845,12.4227,CARD,F,YES,15400,47,F,F,T,F,F,F,T,F,F,F,F 39952,35.3369,CARD,M,NO,15900,37,F,F,F,T,F,T,T,F,T,F,F 33172,31.065,CARD,M,YES,19700,48,F,T,F,F,F,F,F,F,F,F,T 71254,17.1837,CHEQUE,F,YES,29400,45,F,T,F,F,F,T,F,F,F,F,F 36190,28.4132,CHEQUE,M,YES,15500,18,F,F,F,T,F,T,T,F,T,F,F 15099,11.2731,CARD,M,NO,15700,16,T,F,F,T,F,T,T,F,F,T,F 100256,11.9099,CHEQUE,M,NO,12800,33,F,F,F,T,F,T,T,T,F,F,F 51384,14.8697,CASH,F,NO,11200,47,F,F,F,F,F,F,F,F,F,T,F 54190,36.4736,CASH,F,YES,19300,24,F,F,F,F,F,F,F,F,F,F,F 84756,29.1981,CARD,M,YES,28300,32,F,F,F,F,F,F,F,F,F,T,T 28755,43.9948,CHEQUE,F,YES,11000,25,F,F,F,F,F,F,F,F,F,T,T 73480,13.9759,CHEQUE,M,NO,13500,41,F,F,F,T,F,T,T,F,F,F,T 86217,19.5378,CARD,M,YES,14300,43,F,F,F,T,F,T,T,F,F,F,F 91055,24.7818,CARD,F,YES,15200,23,F,F,T,F,F,F,F,F,T,F,F 80297,37.2746,CHEQUE,F,NO,19500,21,T,F,F,F,F,F,F,F,F,T,F 42381,46.0621,CASH,M,NO,13100,31,F,F,F,T,T,T,T,T,F,T,F106531,11.6576,CASH,M,NO,24500,19,T,F,F,F,F,T,F,F,F,T,F 78030,34.6469,CARD,F,NO,22100,38,F,F,F,F,T,F,F,T,F,F,T 103139,18.7964,CASH,F,YES,24400,20,F,T,F,T,F,F,F,T,F,F,F 17939,15.8755,CASH,F,NO,16900,46,F,F,F,F,F,T,F,F,F,F,F 42056,44.8521,CARD,F,YES,13900,30,F,F,F,F,F,F,F,T,F,T,F 23419,15.6201,CASH,F,NO,21000,24,F,F,F,T,T,F,F,T,T,F,F 48783,24.61,CARD,M,NO,16500,50,T,F,F,T,F,T,T,F,F,F,F 98204,18.4421,CHEQUE,M,YES,12700,18,F,F,T,T,F,T,T,F,F,F,F 67063,40.0147,CARD,F,YES,23300,46,F,T,F,F,F,F,F,T,T,T,T 77335,47.8128,CASH,F,NO,29800,40,F,F,F,F,F,F,F,T,T,F,T 32594,20.9057,CARD,F,YES,26200,16,F,F,F,F,F,F,F,F,F,F,F 24493,20.8675,CARD,M,YES,28600,45,T,T,F,F,F,F,F,F,F,T,F 72248,10.8367,CASH,M,YES,17400,28,F,F,F,F,F,F,F,F,F,F,F 79039,12.4456,CARD,M,NO,25400,46,F,F,T,F,F,F,F,F,F,F,F 58803,11.2921,CHEQUE,M,NO,13500,39,F,T,F,T,F,T,T,F,F,F,T 87066,10.8645,CARD,M,YES,25400,23,F,F,T,F,F,F,F,F,F,T,F 60159,43.2178,CARD,M,NO,11600,47,F,F,F,T,F,T,T,F,F,F,F 15629,17.004,CASH,F,YES,27700,37,F,F,F,F,F,T,F,F,F,T,F 38608,42.7334,CARD,M,YES,24400,21,F,T,F,F,F,F,T,F,F,F,F 18143,43.5884,CASH,F,YES,15900,36,T,F,F,F,T,T,F,F,F,F,F 22316,29.7579,CASH,F,YES,18000,20,F,F,F,T,T,F,F,T,T,F,F 40743,25.3732,CARD,M,YES,19200,24,F,F,T,F,F,F,F,F,F,F,F 79305,18.6381,CHEQUE,F,NO,22200,31,F,F,F,F,T,F,F,T,F,F,F 83439,33.4975,CARD,F,YES,24300,43,F,F,F,F,T,F,F,T,F,T,T 16342,46.3814,CARD,M,NO,22700,29,F,F,F,F,F,F,F,F,F,F,F 75971,16.0295,CARD,M,YES,19800,44,T,F,T,F,F,F,F,F,F,F,F 31046,16.5846,CASH,F,YES,19700,25,T,F,F,T,T,T,T,F,F,T,F 13722,36.2168,CARD,M,NO,18100,19,T,T,T,F,F,F,T,F,F,T,F 93467,11.6818,CARD,F,NO,25200,27,F,F,F,F,F,F,F,F,F,F,F 40208,23.167,CASH,F,NO,28900,40,T,T,F,F,T,T,F,F,F,F,F 41132,18.4412,CHEQUE,F,NO,19900,42,F,F,F,T,F,F,F,F,F,F,T 64596,42.1336,CASH,M,YES,24500,28,F,T,T,F,F,F,T,F,F,T,F 46539,38.3992,CHEQUE,M,NO,20400,23,T,F,T,F,T,F,F,F,F,T,F 40690,28.6205,CASH,M,NO,24800,45,F,F,F,T,F,T,F,F,T,F,F 51916,24.7427,CASH,F,NO,14000,23,F,F,T,F,T,F,T,F,T,F,F 21814,22.3741,CARD,M,NO,12200,23,F,F,F,T,T,T,T,F,F,F,F 31011,39.5627,CARD,M,NO,27100,16,T,F,F,T,F,T,T,T,F,T,F 24210,30.4335,CARD,F,YES,18300,50,F,F,F,T,F,T,F,F,F,F,F 10902,26.7182,CARD,M,NO,25300,47,T,F,F,F,F,F,F,T,F,F,F 106649,25.8123,CARD,F,NO,13700,22,T,F,F,F,F,F,T,F,F,T,F 31033,41.5652,CARD,M,NO,17800,47,F,F,T,F,F,F,F,T,F,F,T 68006,11.4931,CARD,M,YES,27800,19,F,T,F,F,F,F,F,F,F,F,F 47638,25.666,CASH,M,YES,10200,41,F,F,F,T,F,T,T,F,F,F,F21347,43.007,CHEQUE,F,YES,15900,24,F,F,F,F,T,T,F,F,F,F,T 38600,47.476,CARD,M,NO,22500,48,F,F,F,F,F,F,F,T,F,F,T 104830,21.4266,CASH,F,NO,13400,28,F,T,F,F,F,F,F,F,F,T,F 56452,20.8234,CHEQUE,M,NO,25700,48,T,T,F,F,T,F,F,F,F,F,T 18030,12.9942,CARD,F,YES,28400,29,T,F,F,F,T,F,F,F,F,F,F 72901,23.9797,CHEQUE,F,NO,13200,39,F,F,F,F,F,F,T,F,F,F,F 104554,19.0629,CASH,M,NO,10900,21,T,F,F,T,F,T,T,F,F,T,F 93162,46.8411,CARD,M,NO,20500,25,F,F,F,F,F,F,F,F,T,T,T 54313,30.6545,CASH,M,NO,27600,22,T,F,F,F,F,F,F,F,T,T,T 89485,18.3222,CASH,M,YES,25300,28,F,F,F,F,T,T,F,F,F,F,F 61309,22.5496,CHEQUE,M,YES,18100,44,F,F,F,F,T,F,F,T,F,F,F 73441,21.3574,CARD,F,NO,12800,20,T,F,F,F,T,F,F,F,F,T,F 10717,47.2705,CARD,M,NO,18900,23,T,T,F,F,F,F,F,F,F,T,F 27694,24.8952,CARD,M,YES,14700,41,F,F,T,T,T,T,T,F,T,F,F 69380,34.0379,CHEQUE,F,NO,21600,40,F,F,F,F,F,F,F,T,F,F,T 26885,33.1864,CASH,M,YES,13200,28,F,F,T,T,F,T,T,F,F,F,F 90730,29.5005,CASH,M,NO,14600,36,F,F,F,T,F,T,T,F,T,F,F 69110,11.8488,CASH,M,NO,14800,16,T,F,F,T,T,T,T,T,F,T,T 86612,29.7839,CARD,M,YES,24900,27,F,T,F,F,F,F,F,F,F,F,F 93353,36.8045,CARD,F,NO,22500,40,F,F,T,T,T,F,F,T,F,F,T 25311,47.5451,CARD,M,YES,29400,24,T,T,F,F,F,F,F,T,F,F,F 81487,20.0766,CHEQUE,M,NO,18500,25,F,F,T,F,F,T,T,F,F,F,F 18331,47.898,CARD,F,YES,27400,20,T,F,F,F,F,T,F,T,F,F,T 84148,49.1791,CHEQUE,F,NO,20900,22,T,F,F,F,F,F,T,T,F,T,T 83500,49.2505,CARD,M,YES,28300,21,F,F,F,T,T,F,F,F,F,T,T 29316,34.5206,CARD,M,NO,10800,39,F,F,F,T,F,T,T,F,T,F,F 82173,15.7511,CASH,F,NO,27800,22,T,F,F,F,T,F,T,F,F,T,F 62264,43.3344,CARD,M,YES,18200,26,F,F,F,F,F,F,F,F,F,F,T 14875,18.5153,CHEQUE,M,YES,29700,36,F,T,F,F,F,F,T,T,F,F,F 73594,13.0883,CHEQUE,F,NO,12100,41,F,F,T,F,F,F,F,F,F,F,F 79384,22.4563,CARD,F,NO,12600,45,F,F,F,F,F,F,F,F,F,T,F 63138,16.9606,CHEQUE,M,NO,17100,22,T,F,F,F,F,T,F,F,F,T,F 58144,28.8307,CARD,F,NO,29100,38,F,F,F,F,T,T,F,F,F,F,F 103446,25.3568,CARD,M,YES,17100,23,F,F,T,F,T,F,F,F,F,F,F 28994,11.2168,CASH,F,NO,18500,18,T,F,F,F,T,F,F,F,F,T,F 72298,41.0628,CASH,M,YES,17600,25,F,F,F,F,F,F,T,F,F,F,F 69884,18.91,CASH,M,YES,21800,30,F,F,F,F,F,F,F,F,T,F,T 68119,15.1803,CHEQUE,F,YES,12900,25,F,F,F,F,T,F,F,F,T,F,T 14692,40.8875,CARD,F,YES,14400,19,F,F,F,T,F,F,F,T,F,F,F 52530,28.0822,CASH,F,NO,18400,35,F,F,F,F,F,F,F,F,T,F,F 28803,41.9003,CHEQUE,M,YES,13200,38,F,F,F,T,F,T,T,F,F,T,F 86983,43.3446,CARD,F,NO,20200,17,T,T,F,F,T,F,F,T,F,T,T 72454,44.1263,CASH,F,YES,25900,27,F,F,F,F,F,F,T,T,F,F,T92868,48.3546,CHEQUE,M,NO,25000,40,F,F,F,T,F,T,F,T,F,F,F 20991,37.5076,CARD,M,YES,10500,25,F,F,F,T,F,T,T,F,F,F,F 98352,46.0629,CARD,F,NO,13300,36,F,F,F,F,T,T,F,F,F,T,F 30239,42.3719,CARD,M,YES,16100,17,T,F,T,F,F,F,F,F,T,F,F 15882,20.7035,CASH,M,YES,14700,20,F,F,F,T,F,T,T,F,F,F,F 30989,25.9133,CARD,F,NO,19900,50,F,F,F,F,F,F,F,F,F,F,T 107499,12.3961,CASH,F,YES,24800,28,F,F,F,F,F,F,F,T,T,F,F 70336,45.3326,CASH,F,YES,12200,20,T,F,T,F,F,F,F,F,F,F,F 47598,42.9427,CARD,F,YES,23900,40,T,F,F,F,F,F,T,T,F,F,T 17590,30.1201,CARD,M,YES,17200,49,F,F,F,F,F,F,F,F,F,F,F 20260,13.1243,CHEQUE,M,YES,21300,21,F,F,F,T,F,F,F,F,F,F,T 50531,37.4002,CARD,F,YES,10700,36,T,T,T,F,F,F,F,F,F,F,F 42653,14.0502,CARD,M,YES,25300,49,F,F,F,F,F,F,F,F,T,F,F 94685,31.7561,CARD,M,YES,25600,29,F,T,T,F,F,F,F,F,F,F,F 11818,31.9051,CARD,F,YES,29200,48,F,T,F,F,F,F,F,F,F,F,F 25668,21.9571,CHEQUE,F,YES,13500,19,F,F,F,F,F,F,F,T,F,F,T 53959,40.8684,CASH,F,YES,16800,27,F,T,T,F,F,F,T,F,T,F,T 55992,17.2856,CASH,M,YES,25700,30,F,F,F,F,T,F,F,F,T,T,F 85081,38.2586,CARD,F,YES,20900,29,T,F,F,F,F,F,T,T,F,F,T 104800,13.2577,CARD,M,NO,26800,29,F,F,F,F,F,F,T,F,F,F,F 92125,15.7945,CARD,F,NO,22800,17,F,F,F,T,F,F,F,F,F,F,F 107314,42.9349,CASH,M,NO,15900,26,F,F,F,T,F,T,T,T,F,F,F 29192,21.2654,CASH,M,NO,21500,29,F,T,F,F,F,F,F,F,F,F,T 90933,26.2117,CARD,M,YES,29900,31,F,F,F,F,F,F,F,F,F,F,F 48749,18.471,CARD,F,YES,21100,30,F,F,F,F,F,F,F,F,F,T,F 49658,17.2076,CARD,M,YES,17600,40,F,T,F,T,F,F,F,F,T,F,T 20521,46.3,CASH,M,NO,28200,44,T,F,F,T,F,F,F,T,F,F,F 75663,20.8372,CARD,F,YES,23400,29,F,T,F,F,T,F,F,F,F,F,F 65425,23.0249,CARD,F,YES,14300,25,F,F,T,F,F,F,T,F,F,F,F 67133,36.6913,CHEQUE,M,NO,11800,39,F,F,F,T,F,T,F,T,F,F,T 62455,35.2522,CARD,F,YES,16800,43,F,F,F,F,F,F,F,F,F,T,F 100255,22.6799,CHEQUE,M,NO,23100,30,F,F,F,F,F,F,F,T,F,F,F 15590,44.0704,CASH,M,NO,20800,41,T,F,F,T,F,F,F,F,F,T,F 46278,34.0079,CARD,M,NO,23400,40,T,T,F,T,F,F,T,F,F,F,F 12582,25.6014,CASH,M,NO,19600,23,T,T,F,F,F,F,T,T,F,T,F 38723,17.159,CHEQUE,F,NO,28400,16,T,F,F,F,F,F,T,F,T,T,F 47251,46.4065,CARD,F,YES,29100,43,T,T,F,T,F,F,F,T,T,T,T 109798,15.133,CASH,M,YES,17300,33,F,F,F,F,F,T,F,F,F,F,F 59349,28.4931,CARD,M,YES,16200,18,T,F,F,T,F,T,T,F,T,F,F 17830,28.0198,CARD,F,NO,15100,47,T,F,F,F,T,F,T,F,F,T,F 69401,36.754,CASH,F,NO,22700,25,T,F,F,F,T,F,F,T,F,F,T 103708,26.061,CASH,F,YES,28000,29,F,F,F,F,F,F,F,T,F,T,F 27664,35.6361,CASH,F,YES,19500,26,T,F,T,F,T,T,F,F,T,T,F。

Matlab中的关联规则挖掘方法介绍

Matlab中的关联规则挖掘方法介绍

Matlab中的关联规则挖掘方法介绍引言关联规则挖掘是一种数据挖掘技术,它通过分析数据集中的项集之间的频繁关联程度,发现其中的规律和关系。

在商业领域,关联规则挖掘常用于市场篮子分析,帮助企业理解产品间的关联性,从而优化营销策略。

在本文中,我们将介绍如何使用Matlab中的工具包进行关联规则挖掘,并讨论一些应用案例。

一、数据预处理在进行关联规则挖掘之前,必须先对数据进行预处理。

这包括数据清洗、转换和归一化等步骤。

在Matlab中,可以使用数据统计、数据导入和数据清洗工具箱来完成这些任务。

首先,我们需要确认数据集的格式,并使用适当的函数来读取数据。

然后,我们可以使用数据清洗工具箱中的函数来删除重复数据、填充缺失值,并进行必要的数据转换和归一化。

二、关联规则挖掘算法Matlab提供了多种关联规则挖掘算法,包括Apriori算法、Eclat算法和FP-growth算法等。

这些算法可用于发现频繁项集,并利用频繁项集生成关联规则。

以下是对其中几种算法的简要介绍:1. Apriori算法Apriori算法是关联规则挖掘中最常用的算法之一。

它通过逐层搜索频繁项集来发现关联规则。

具体而言,Apriori算法首先生成所有的单个项的频繁项集,再通过连接和剪枝操作生成更高维度的频繁项集,直到不再有频繁项集产生为止。

2. Eclat算法Eclat算法是一种基于垂直数据存储结构的关联规则挖掘算法。

它通过对数据集进行垂直方向的投影来寻找频繁项集。

具体而言,Eclat算法将数据集按照项的不同取值进行分组,并使用交集操作来寻找频繁项集。

3. FP-growth算法FP-growth算法是一种基于前缀树(Prefix Tree)结构的关联规则挖掘算法。

它通过构建一颗FP树(Frequency Pattern Tree)来寻找频繁项集,并利用FP树生成关联规则。

具体而言,FP-growth算法首先扫描数据集,统计每个项的频次,然后根据频次构建FP树,并进行频繁项集的挖掘。

在MATLAB中进行数据挖掘的方法

在MATLAB中进行数据挖掘的方法

在MATLAB中进行数据挖掘的方法MATLAB是一种广泛应用于科学、工程和商业领域中的高级数值计算和数据分析软件。

它被广泛用于数据挖掘,可以帮助用户快速有效地处理和分析大量数据。

本文将探讨在MATLAB中进行数据挖掘的方法,包括数据预处理、特征选择、聚类分析和分类模型构建等。

一、数据预处理数据预处理是数据挖掘的关键步骤之一。

它通过消除噪声和不一致性,对数据进行清洗和转换,为后续的分析和建模提供可靠的数据基础。

在MATLAB中,有许多内置的函数和工具箱可用于数据预处理。

首先,数据清洗是数据预处理的重要环节。

通过使用MATLAB的数据处理函数,可以去除缺失值、重复值、异常值等。

例如,使用"isnan"函数可以识别和删除包含缺失值的数据点,使用"unique"函数可以删除数据中的重复值。

其次,数据转换是数据预处理的另一个重要环节。

通过使用MATLAB的函数,可以对数据进行标准化、规范化、离散化等处理。

例如,使用"zscore"函数可以对数据进行标准化转换,使用"mapminmax"函数可以对数据进行归一化处理。

二、特征选择特征选择是数据挖掘中的重要步骤。

它通过评估和选择最具代表性的特征,降低数据维度,提高数据挖掘的效率和准确性。

在MATLAB中,有多种方法可用于特征选择。

首先,基于统计的方法是常用的特征选择方法之一。

通过计算特征与目标变量之间的相关性,可以选择与目标变量高度相关的特征。

在MATLAB中,可以使用"corrcoef"函数计算特征之间的相关系数,进而选择相关性高的特征。

其次,基于机器学习的方法也是常用的特征选择方法之一。

通过使用机器学习算法,可以评估特征的重要性,并选择最具有区分度的特征。

在MATLAB中,有许多机器学习工具箱可以用于特征选择,如支持向量机、决策树等。

三、聚类分析聚类分析是一种将数据分成不同群体或类别的方法。

MATLAB中的关联规则挖掘方法

MATLAB中的关联规则挖掘方法

MATLAB中的关联规则挖掘方法引言关联规则挖掘作为数据挖掘领域的重要技术之一,在实际应用中发挥着重要的作用。

它可以从大规模数据集中挖掘出隐藏在其中的潜在关联关系,为企业和研究者提供有价值的信息和决策支持。

在本文中,我们将讨论MATLAB中的关联规则挖掘方法,介绍其原理和实际应用。

一、关联规则挖掘简介关联规则挖掘是一种从数据集中发现条目之间关系的技术。

通过分析事务数据集,它可以找出条目之间的相互依赖和频繁出现的组合。

关联规则通常以"If-Then"的形式表示,例如:“如果顾客购买了商品A,那么他们也可能购买商品B”。

关联规则挖掘可以应用于各种领域,如市场营销、销售预测、推荐系统等。

它可以帮助企业发现潜在的市场机会和消费者行为模式,提供个性化的推荐和精确的预测。

同时,它也可用于科学研究,如分析基因组数据,发现基因之间的相互关联等。

二、关联规则挖掘的原理关联规则挖掘的基本原理是基于频繁项集的发现。

频繁项集是指在数据集中经常共同出现的一组项。

通过统计每个项出现的频率,并设定一个最小支持度阈值,我们可以找出频繁项集。

然后,通过频繁项集构建关联规则,并计算规则的置信度和支持度。

最终,我们可以根据置信度和支持度筛选出有意义的关联规则。

MATLAB提供了多种关联规则挖掘方法的实现,如Apriori算法、FP-Growth 算法和Eclat算法等。

这些算法都基于频繁项集的挖掘,并采用不同的数据结构和优化策略,以提高挖掘效率和准确性。

三、1. Apriori算法Apriori算法是关联规则挖掘中最经典的算法之一。

它通过自底向上的方式逐层挖掘频繁项集。

首先,算法建立以单个项为候选集的频繁项集,然后将频繁项集逐步扩展为包含更多项的候选集,直到找到所有频繁项集为止。

MATLAB通过函数apriori()实现了Apriori算法的挖掘过程。

我们可以指定最小支持度和最小置信度的阈值,并根据数据集进行挖掘。

基于MATLAB的数据挖掘技术研究与实践

基于MATLAB的数据挖掘技术研究与实践

基于MATLAB的数据挖掘技术研究与实践数据挖掘技术是一种通过大数据分析来发现规律、趋势和模式的过程。

在当今信息爆炸的时代,数据量呈指数级增长,如何从海量数据中提取有用信息成为了各行各业都面临的挑战。

MATLAB作为一种强大的科学计算软件,被广泛应用于数据挖掘领域。

本文将探讨基于MATLAB的数据挖掘技术研究与实践。

一、数据挖掘技术概述数据挖掘技术是一门跨学科的领域,涉及统计学、机器学习、人工智能等多个学科知识。

其主要任务包括分类、聚类、关联规则挖掘、异常检测等。

通过对数据进行分析和建模,可以帮助人们更好地理解数据背后的规律,为决策提供支持。

二、MATLAB在数据挖掘中的应用MATLAB作为一种强大的科学计算软件,具有丰富的工具箱和函数库,为数据挖掘提供了便利。

在MATLAB中,可以使用各种算法来进行数据挖掘分析,如聚类算法、分类算法、关联规则挖掘算法等。

同时,MATLAB还提供了可视化工具,帮助用户直观地展示分析结果。

三、基于MATLAB的数据预处理在进行数据挖掘之前,通常需要对原始数据进行预处理。

数据预处理包括数据清洗、缺失值处理、异常值检测和特征选择等步骤。

MATLAB提供了丰富的函数和工具箱,可以帮助用户高效地完成数据预处理工作。

四、基于MATLAB的聚类分析聚类分析是一种常用的无监督学习方法,旨在将相似的对象归为一类。

MATLAB中集成了多种聚类算法,如K均值聚类、层次聚类等。

用户可以根据具体需求选择合适的算法,并通过MATLAB快速实现聚类分析。

五、基于MATLAB的分类建模分类建模是一种常见的监督学习方法,旨在根据已知类别对新样本进行分类。

MATLAB提供了多种分类算法,如支持向量机、决策树、神经网络等。

用户可以通过MATLAB构建分类模型,并对模型性能进行评估和优化。

六、基于MATLAB的关联规则挖掘关联规则挖掘是一种发现事务数据库中频繁项集之间关联关系的方法。

MATLAB中提供了适用于关联规则挖掘的函数和工具箱,用户可以快速发现数据中隐藏的规律和趋势。

利用Matlab进行数据挖掘的基本步骤

利用Matlab进行数据挖掘的基本步骤

利用Matlab进行数据挖掘的基本步骤数据挖掘是指从大量的数据中提取出有用的信息和模式的一种技术手段。

而Matlab作为一种功能强大的数学软件,也可以用来进行数据挖掘分析。

本文将介绍利用Matlab进行数据挖掘的基本步骤。

一、数据准备进行数据挖掘之前,首先需要准备好待分析的数据。

数据可以来自各个领域,如金融、医疗、市场营销等。

数据的准备包括数据收集、数据清洗和数据集建立三个步骤。

数据收集是指从各种渠道获取原始数据,包括数据库、文件、传感器等。

Matlab提供了丰富的数据导入函数,如csvread、xlsread等,可以将不同格式的数据导入到Matlab中。

数据清洗是指对原始数据进行预处理,包括缺失值处理、异常值检测和数据转换等。

Matlab提供了一系列函数用于数据清洗,如isnan、isoutlier等,可以帮助用户快速识别和处理数据中的问题。

数据集建立是指将准备好的数据整理成适合进行数据挖掘的数据集。

数据集的建立需要根据具体问题进行设计,包括选择输入变量和输出变量、确定样本和特征的划分方式等。

Matlab提供了数据集划分工具和特征选择函数,可以帮助用户灵活构建数据集。

二、特征选择在进行数据挖掘之前,需要对数据集进行特征选择,即从原始数据中选择出最具代表性和相关性的特征。

特征选择的目的是降低数据的维度,减少冗余信息,提高模型的性能。

Matlab中有多种特征选择方法,如过滤式方法、包裹式方法和嵌入式方法等。

过滤式方法通过计算特征与目标变量之间的相关性来选择特征,如相关系数、互信息等。

包裹式方法通过建立模型来评估特征的重要性,如决策树、逻辑回归等。

嵌入式方法将特征选择嵌入到模型的训练过程中,如Lasso回归、岭回归等。

用户可以根据具体问题选择适合的特征选择方法。

三、模型建立在进行数据挖掘之前,需要选择合适的模型来进行数据分析。

Matlab中提供了丰富的分类、回归、聚类和关联规则挖掘等模型,可以根据具体问题进行选择。

数据挖掘之分类算法---knn算法(有matlab例子)

数据挖掘之分类算法---knn算法(有matlab例子)

数据挖掘之分类算法---knn算法(有matlab例⼦)knn算法(k-Nearest Neighbor algorithm).是⼀种经典的分类算法.注意,不是聚类算法.所以这种分类算法必然包括了训练过程.然⽽和⼀般性的分类算法不同,knn算法是⼀种懒惰算法.它并⾮像其他的分类算法先通过训练建⽴分类模型.,⽽是⼀种被动的分类过程.它是边测试边训练建⽴分类模型.算法的⼀般描述过程如下:1.⾸先计算每个测试样本点到其他每个点的距离.这个距离可以是欧⽒距离,余弦距离等.2.然后取出距离⼩于设定的距离阈值的点.这些点即为根据阈值环绕在测试样本最邻近的点.3.选出这些邻近点中⽐例最⼤的点簇的类.那么就将概测试点归⼊此类.注意:knn算法的开销很⼤,因为要计算每个样本点到其他所有点的距离. knn算法的距离⼀般要根据实际样本点的情况来选取.knn算法的距离阈值要根据样本的分散集中程度来选取.经验⼀般选取样本点集合的均⽅差.下⾯是⼀个matlab中运⽤knn函数分类的例⼦.1 clc;2 clear;34 load 'Train_Data.mat' %载⼊训练数据56 load 'Train_Label.mat' %载⼊训练分类标签789 test_data=[43;10 42;11 192;12 193]; %测试数据1314 %knnclassify为matlab提供的knn分类函数.15 %参数test_data是待分类的测试数据16 %Train_Data是⽤于knn分类器训练的数据17 %Train_Label是训练的分类标签18 %3,即为knn的k值.意思是取某个待分类测试样本点周围三个样本点19 %'cosine'---为距离度量,这⾥采⽤余弦距离20 %'random'---为分类规则.如何对k个临近点进⾏分类.21 % 'k'--即为对测试数据的knn分类结果的类标签2223 k=knnclassify(test_data,Train_Data',Train_Label',3,'euclidean','random');。

matlab k均值 聚类 实现

matlab k均值 聚类 实现

I. 导言在现代数据分析中,聚类是一种常用的数据挖掘技术。

K均值(K-means)聚类算法是最常用的聚类方法之一,它可以将一组数据划分为若干个不同的类别,使得同一类内的数据更加相似,不同类别之间的数据更加不同。

而MATLAB作为一个专门用于科学计算和数据分析的工具箱,提供了丰富的聚类算法实现方法,下面我们将介绍如何在MATLAB中使用K均值聚类算法进行数据分类。

II. K均值聚类算法的基本原理1. 初始化K个聚类中心:首先随机选择K个样本作为初始的聚类中心。

2. 分配样本到最近的聚类中心:对于每个样本,计算它与K个聚类中心的距离,将它分配到距离最近的聚类中心所代表的类别。

3. 更新聚类中心:对于每个类别,重新计算它们的聚类中心,即取该类别所有样本的平均值作为新的聚类中心。

4. 重复步骤2和步骤3,直到聚类中心不再发生变化或者达到最大迭代次数。

III. MATLAB中K均值聚类算法的实现在MATLAB中,K均值聚类算法的实现非常简单,可以通过以下几个步骤完成。

1. 准备数据我们需要准备待聚类的数据。

在MATLAB中,可以使用矩阵或者数据集来表示数据,假设我们有一个N维的数据集X,其中包含M个样本。

X = [x1, x2, ..., xm]2. 初始化K个聚类中心接下来,我们需要随机选择K个样本作为初始的聚类中心。

在MATLAB中,可以使用randperm函数来生成一个随机的样本索引序列,然后取前K个样本作为初始聚类中心。

idx = randperm(M, K);centroids = X(idx, :);3. 分配样本到最近的聚类中心我们需要计算每个样本与K个聚类中心的距离,并将每个样本分配到距离最近的聚类中心所代表的类别。

在MATLAB中,可以使用pdist2函数来计算样本与聚类中心之间的距禂,然后使用min函数找到每个样本距离最近的聚类中心。

distances = pdist2(X, centroids);[~, labels] = min(distances, [], 2);4. 更新聚类中心我们需要重新计算每个类别的聚类中心,即取每个类别所有样本的平均值作为新的聚类中心。

如何使用MATLAB进行数据挖掘与分析

如何使用MATLAB进行数据挖掘与分析

如何使用MATLAB进行数据挖掘与分析使用MATLAB进行数据挖掘与分析引言:数据挖掘与分析是当今科技领域中炙手可热的话题之一。

随着计算能力的提升和数据大爆炸的时代到来,人们迫切需要有效地从大量的数据中提取有用的信息和知识。

MATLAB作为一种强大的数学软件工具,在数据挖掘领域有着广泛的应用。

本文将探讨如何使用MATLAB进行数据挖掘与分析,包括数据预处理、特征选择、建模与评估等方面的内容。

一、数据预处理在进行数据挖掘与分析之前,常常需要对原始数据进行预处理,以便提高数据质量和挖掘效果。

MATLAB提供了一系列工具和函数来帮助我们进行数据预处理。

例如,我们可以使用MATLAB的数据导入工具将各种格式的数据文件导入到MATLAB中,并进行数据清洗、去除异常值、处理缺失值等操作。

此外,MATLAB还提供了丰富的数据可视化工具,可以帮助我们更直观地理解和分析数据。

二、特征选择在进行数据挖掘与分析时,选择合适的特征对于模型的准确性和可解释性至关重要。

MATLAB提供了多种特征选择方法和函数,如相关性分析、主成分分析(PCA)、线性判别分析(LDA)等。

这些方法可以帮助我们从大量的特征中选择出最具代表性和区分性的特征子集,以提高模型的性能和可解释性。

三、建模与评估经过数据预处理和特征选择之后,我们可以开始建立模型并进行数据挖掘与分析。

MATLAB提供了丰富的机器学习和统计分析工具箱,包括分类、回归、聚类、关联规则等方法。

我们可以根据实际需求选择合适的模型,并使用MATLAB的函数和工具进行建模和训练。

在模型建立完成后,我们还需要对模型进行评估和验证。

MATLAB提供了多种评估指标和方法,可以帮助我们评估模型的性能和泛化能力。

四、应用案例为了更好地理解和应用MATLAB进行数据挖掘与分析,我们可以以一个具体的应用案例来说明。

假设我们是一家电信运营商,希望通过数据挖掘来预测用户是否会流失。

我们可以使用MATLAB对用户的个人信息、通话记录、消费情况等数据进行预处理、特征选择和建模。

optics聚类算法matlab -回复

optics聚类算法matlab -回复

optics聚类算法matlab -回复Optics聚类算法在Matlab中的应用引言:聚类是一种常见的数据挖掘技术,它将数据集中的对象分为不同的组或簇。

聚类算法在各个领域都得到了广泛的应用,例如图像分析、生物信息学、市场分析等。

Optics聚类算法是一种基于密度的聚类算法,可以自动发现数据中的群集和异常值。

Matlab作为一种强大的编程语言和数据分析工具,提供了许多用于聚类分析的函数和库。

本文将介绍Optics聚类算法在Matlab中的实现步骤。

一、Optics聚类算法简介Optics聚类算法是一种基于密度的聚类算法,其全称为Ordering Points To Identify the Clustering Structure。

它通过计算数据点之间的距离和密度来确定聚类结构。

Optics算法的优势在于可以识别出不同的密度级别,以及具有不同噪声水平的聚类。

相比于传统的聚类算法,例如K-means和DBSCAN,Optics算法更加灵活和自适应。

二、Matlab中的Optics聚类算法库Matlab提供了丰富的函数和工具箱,可以简化Optics聚类算法的实现过程。

其中最常用的是Statistics and Machine Learning Toolbox。

这个工具箱中包含了许多聚类分析的函数,包括Optics算法。

我们可以使用Matlab中的函数来读取数据、计算距离和密度,并对数据进行聚类。

三、使用Matlab实现Optics聚类算法1. 数据准备和预处理首先,我们需要准备好要进行聚类分析的数据。

数据可以是一个矩阵,每一行代表一个数据点的特征。

在使用Optics算法之前,我们还需要对数据进行预处理。

常见的预处理操作包括数据缩放、特征选择和缺失值处理。

2. 计算距离和密度在执行Optics算法之前,我们需要计算数据点之间的距离和密度。

Matlab 提供了pdist函数用于计算距离矩阵,可以根据具体需求选择不同的距离度量方法,例如欧氏距离、曼哈顿距离或余弦距离。

如何在Matlab中进行数据挖掘

如何在Matlab中进行数据挖掘

如何在Matlab中进行数据挖掘数据挖掘是一种从大量数据中提取出有用信息的技术。

在现代社会中,随着数据量的不断增加,数据挖掘逐渐成为了一项重要的技能。

而Matlab作为一种强大的科学计算软件,也提供了丰富的工具和函数用于数据挖掘。

本文将介绍如何使用Matlab进行数据挖掘的基本步骤和常用方法。

一、数据预处理在进行数据挖掘前,首先需要对数据进行预处理。

这包括数据清洗、数据集成、数据转换和数据规约等步骤。

1. 数据清洗数据清洗是指通过删除重复数据、处理缺失数据和处理异常数据等方法来保证数据的质量。

Matlab提供了许多函数和工具箱来处理这些问题。

比如可以使用“unique”函数来删除重复数据,“nanmean”函数来处理缺失数据(使用平均值填充),“histogram”函数来检查异常数据等。

2. 数据集成数据集成是指将多个数据源的数据合并在一起,形成一个整体的数据集。

在Matlab中,可以使用“vertcat”函数和“horzcat”函数将多个数据矩阵垂直或水平合并在一起,以实现数据集成的目的。

3. 数据转换数据转换是指将数据从一个形式转换为另一个形式,以便更好地使用数据挖掘算法进行分析。

常见的数据转换方法包括数值化、标准化和离散化等。

Matlab提供了一系列函数和工具箱来进行这些转换操作。

例如可以使用“cell2mat”函数将单元格数组转换为普通数组,“zscore”函数将数据标准化为标准正态分布等。

4. 数据规约数据规约是指通过降维或聚类等方法来减少数据维度,以便更好地进行挖掘分析。

在Matlab中,可以使用“pca”函数进行主成分分析降维,使用“kmeans”函数进行聚类分析等。

二、数据挖掘建模在进行数据预处理后,接下来是进行数据挖掘建模。

数据挖掘建模是指利用数学和统计的方法,根据预处理后的数据进行模型的构建和训练。

1. 数据分析数据分析是指对预处理后的数据进行统计分析和可视化分析,以便更好地了解数据的特征和关系。

如何使用MATLAB进行网络数据挖掘与分析

如何使用MATLAB进行网络数据挖掘与分析

如何使用MATLAB进行网络数据挖掘与分析网络数据挖掘与分析是当前信息化社会中非常重要的工作内容之一。

借助先进的计算工具和技术,我们能够更加高效地处理大规模的网络数据,并从中挖掘出有价值的信息和知识。

MATLAB作为一种强大的科学计算工具,不仅可以用于数据分析和可视化,还能够帮助我们进行网络数据挖掘的相关工作。

本文将深入介绍如何使用MATLAB进行网络数据挖掘与分析的方法与技巧。

一、准备工作在开始使用MATLAB进行网络数据挖掘与分析之前,我们首先需要准备一些必要的工作环境。

这包括安装MATLAB软件,并确保其正常运行;获取需要分析的网络数据集,可以是从公开数据库中下载的数据文件,也可以是通过网络爬虫等手段获取的原始数据。

二、数据预处理网络数据挖掘与分析的第一步是对原始数据进行预处理,以便于后续的分析和挖掘工作。

在MATLAB中,我们可以利用其丰富的数据处理函数和工具箱来完成这一步骤。

常见的数据预处理操作包括数据清洗、数据过滤、数据变换等。

例如,我们可以使用MATLAB的数据清洗函数对原始数据进行去噪处理,去除不完整或错误的数据;然后,可以使用数据过滤函数筛选出我们感兴趣的数据子集;最后,可以使用数据变换函数将数据转换为适合进行挖掘的形式,如将文本数据转换为数字特征向量。

三、网络结构分析网络数据挖掘与分析的核心任务之一是对网络结构进行分析。

网络结构分析可以帮助我们了解网络中各节点之间的连接关系以及整体结构的特征。

在MATLAB 中,我们可以利用其图论工具箱来进行网络结构分析。

通过构建网络图谱并应用图论算法,我们可以计算网络中的节点度、节点连通性、节点重要性等指标,并通过可视化工具将这些指标可视化展示出来。

这样,我们可以更加直观地理解和分析网络的结构,并进一步进行下一步的挖掘工作。

四、网络数据挖掘网络数据挖掘是网络数据分析的关键步骤之一。

它通过挖掘网络数据中的隐藏模式、关联规则和异常行为等信息,帮助我们揭示网络中潜在的规律和特征。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、数据挖掘的目的数据挖掘(Data Mining)阶段首先要确定挖掘的任务或目的。

数据挖掘的目的就是得出隐藏在数据中的有价值的信息。

数据挖掘是一门涉及面很广的交叉学科,包括器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。

它也常被称为“知识发现”。

知识发现(KDD)被认为是从数据中发现有用知识的整个过程。

数据挖掘被认为是KDD过程中的一个特定步骤,它用专门算法从数据中抽取模式(patter,如数据分类、聚类、关联规则发现或序列模式发现等。

数据挖掘主要步骤是:数据准备、数据挖掘、结果的解释评估。

二、数据挖掘算法说明确定了挖掘任务后,就要决定使用什么样的挖掘算法。

由于条件属性在各样本的分布特性和所反映的主观特性的不同, 每一个样本对应于真实情况的局部映射。

建立了粗糙集理论中样本知识与信息之间的对应表示关系, 给出了由属性约简求约简决策表的方法。

基于后离散化策略处理连续属性, 实现离散效率和信息损失之间的动态折衷。

提出相对值条件互信息的概念衡量单一样本中各条件属性的相关性, 可以充分利用现有数据处理不完备信息系统。

本次数据挖掘的方法是两种,一是找到若干条特殊样本,而是找出若干条特殊条件属性。

最后利用这些样本和属性找出关联规则。

(第四部分详细讲解样本和属性的选择)三数据预处理过程数据预处理一般包括消除噪声、推导计算缺值数据、消除重复记录、完成数据类型转换(如把连续值数据转换为离散型数据,以便于符号归纳,或是把离散型数据转换为连续)。

本文使用的数据来源是名为“CardiologyCategorical”的excel文件中的“源数据”。

该数据表共303行,14个属性。

即共有303个样本。

将该数据表的前200行设为训练样本,剩下后的103行作为测试样本,用基于粗糙集理论的属性约简的方法生成相应的规则,再利用测试样本对这些规则进行测试。

首先对源数据进行预处理,主要包括字符型数据的转化和数据的归一化。

数据预处理的第一步是整理源数据,为了便于matlab读取数据,把非数字数据转换为离散型数字数据。

生成lisanhua.xsl文件。

这一部分直接在excel工作表中直接进行。

步骤如下:将属性“sex”中的“Male”用“1”表示,“Female”用“2”表示;将属性“chest pain type”中的“Asymptomatic”用“1”表示,“Abnormal Angina”用“2”表示,“Angina”用“3”表示,“NoTang”用“4”表示;将属性“Fasting blood suga<120”与属性“angina”中的“FALSE”用“1”表示,“TRUE”用“2”表示;将属性“resting ecg”中的“Hyp” 用“1” 表示,“Normal”用“2”表示,“Abnormal”用“3”表示;将属性“slope”中的“Down”用“1”表示,“Flat”用“2”表示,“Up”用“3”表示,;将属性“thal”中的“Rev”用“1”表示,“Normal”用“2”表示,“Fix”用“3”表示;将属性“class”中的“Healthy”用“1”表示,“Sick”用“2”表示;数据预处理的第二步:使用dm=xlsread('lisanhua');导入’lisanhua’.xls文件,在MATLAB中对一些连续属性值离散化。

如下:1、[29,48]=1,[48,62]=2,[62,77]=34、[94,110]=1,[110,143]=2,[143,200]=35、[126,205]=1,[205,293]=2,[293,564]=38、[71,120]=1,[120,175]=2,[175,202]=310、[0,1.5]=1,[1.5,2.5]=2,[2.5,6.2]=3。

然后对数据进行归一化处理:由于不同属性之间的属性值相同,所以利用下面语句对一共13个条件属性中的38个属性进行如下赋值,使每条属性唯一确定。

从而得到38个条件属性,只不过38个里面有且只能出现13个。

程序如下:m1=[0,3,2,4,3,3,2,3,3,2,3,3,4,3];k=1;w=m1(k);dm3=dm2;for i=1:3939dm3(i)=dm2(i)+w;if rem(i,303)==0k=k+1;w=w+m1(k);endend从而得到dm(3)矩阵。

而且决策属性分为1:healthy;2:sick。

并且在38个条件属性中没有值为0。

四、挖掘算法1、特殊样本首先在前200条样本中分别找出三条对应两种决策属性的重要样本,样本必须满足在同类决策属性下其他199条的13条决策属性中和它的13条条件属性数目大于等于10的前3条样本。

2、特殊条件属性值其次分别对应两条决策属性值的5条重要条件属性值(在38个条件属性里找),特殊属性值必须满足:(1)在对应相同决策属性下,此决策属性支持率必须在前五,(2)而且如果不同决策属性出现相同条件属性。

如果相同决策属性同时出现在不同决策属性中,删除这条后找支持率第六的条件属性,以此类推。

挖掘算法在MATLAB里列出并做了标注。

五、验证程序1、预处理在验证程序里面分别对测试数据和六条样本做了对比,又对其属性值和特殊属性值做了对比,最后利用加权求和算法判断测试样本的决策属性正确率。

其中:nc,mc代表测试数据分别和两类样本属性中相同数是否大于等于9时的加权值。

ncc,mcc代表测试数据分别和两类特殊属性满足几条数目的加权值。

2、关联规则(1)、如果(nc>=0.9&ncc>=8)|(ncc>=10&nc>=0.6) 得到决策属性healthy(2)、不满足以上条件的话如果(mc>=0.9|mcc>=8)|(mcc>=9&mc>=0.6) 得到决策属性sick。

(3)、不满足以上条件的话如果nc>=(mc+0.3)|ncc>=(mcc+2) 得到决策属性healthy。

(4)、不满足以上条件的话如果mc>nc 得到决策属性为sick。

(5)、不满足以上条件的话如果ncc>mcc 得到决策属性为healthy。

(6)、不满足以上条件的话如果mcc>ncc 得到决策属性为sick。

(7)、不满足以上条件的话得到决策属性为sick。

六、正确率及结果分析正确率为82.5%结果分析:由于采用了两类约束方法,所以效果还可以。

七、程序如下页所示clear;%%%%% 数据预处理程序%%%%%%dm=xlsread('lisanhua'); % 载入数据%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% z1=dm(:,1); % 离散化第一列数据for i=1:303if z1(i)>=29&z1(i)<48z1(i)=1;elseif z1(i)>=48&z1(i)<62z1(i)=2;else z1(i)=3;endendz2=dm(:,2);for i=1:303if z2(i)==0z2(i)=1;else z2(i)=2;endendz3=dm(:,3);for i=1:303z3(i)=z3(i)+1;endz4=dm(:,4);for i=1:303if z4(i)>=94&z4(i)<110z4(i)=1;elseif z4(i)>=110&z4(i)<143z4(i)=2;else z4(i)=3;endendz5=dm(:,5);for i=1:303if z5(i)>=126&z5(i)<205z5(i)=1;elseif z5(i)>=205&z5(i)<293z5(i)=2;else z5(i)=3;endendz6=dm(:,6);for i=1:303z6(i)=z6(i)+1;endz7=dm(:,7);for i=1:303z7(i)=z7(i)+1;endz8=dm(:,8);for i=1:303if z8(i)>=71&z8(i)<120z8(i)=1;elseif z8(i)>=120&z8(i)<175z8(i)=2;else z8(i)=3;endendz9=dm(:,9);for i=1:303z9(i)=z9(i)+1;endz10=dm(:,10);for i=1:303if z10(i)>=0&z10(i)<1.5z10(i)=1;elseif z10(i)>=1.5&z10(i)<2.5z10(i)=2;else z10(i)=3;endendz11=dm(:,11);for i=1:303z11(i)=z11(i)+1;endz12=dm(:,12);for i=1:303z12(i)=z12(i)+1;endz13=dm(:,13);for i=1:303z13(i)=z13(i)+1;endz14=dm(:,14);for i=1:303z14(i)=z14(i)+1;enddm2=[z1,z2,z3,z4,z5,z6,z7,z8,z9,z10,z11,z12,z13,z14];%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%m1=[0,3,2,4,3,3,2,3,3,2,3,3,4,3];k=1;w=m1(k);dm3=dm2;for i=1:3939dm3(i)=dm2(i)+w;if rem(i,303)==0k=k+1;w=w+m1(k);endend%%%%% 预处理结束%%%%%%%%%% 挖掘算法%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 找6条样本前的预处理dm4=zeros(200,14);dm5=zeros(200,14);for i=1:200if dm3(i,14)==1dm4(i,1:13)=dm3(i,1:13);else dm5(i,1:13)=dm3(i,1:13);endenda1=zeros(38,1);a2=zeros(38,1);for k=1:38for i=1:13for j=1:200if dm4(j,i)==k&dm4(j,i)~=0a1(k)=a1(k)+1;endif dm5(j,i)==k&dm5(j,i)~=0a2(k)=a2(k)+1;endendendenda5=a1;a6=a2;a3=zeros(5,1);a4=zeros(5,1);j=1;while j<6a11=0;a11=max(a1);for i=1:38if a1(i)==a11a3(j)=a11;j=j+1;if j>5break;enda1(i)=0;endendendj=1;while j<6a22=0;a22=max(a2);for i=1:38if a2(i)==a22a4(j)=a22;j=j+1;if j>5break;enda2(i)=0;endendend%%%%%%%%%%%%%%%% 构造h1 h2 矩阵h1=zeros(200,14);h2=zeros(1,200);y1=0;y2=0;y3=0;y4=0;for j=1:200x=0;for i=1:200h1(i,1:13)=dm3(j,1:13)==dm3(i,1:13);h1(i,14)=dm3(j,14)==dm3(i,14);if sum(h1(i,1:13))>=10&h1(i,14)==1x=x+1;endendh2(j)=x;end %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 筛选h2 矩阵得到h3 h4矩阵h3=zeros(1,200);h4=zeros(1,200);for i=1:200if z14(i)==1h3(i)=h2(i);else h4(i)=h2(i);endend %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% h5=h3;h6=h4;%%%%%%%%%%%%%% 找六条重要样本%%%%%%%%% y1=max(h5);for i=1:200if h5(i)==y1h5(i)=0;t1=i;endendy2=max(h5);for i=1:200if h5(i)==y2h5(i)=0;t2=i;endendy3=max(h5);for i=1:200if h5(i)==y3h5(i)=0;t3=i;endendy4=max(h6);for i=1:200if h6(i)==y4h6(i)=0;t4=i;endendy5=max(h6);for i=1:200if h6(i)==y5h6(i)=0;t5=i;endendy6=max(h6);for i=1:200if h6(i)==y6h6(i)=0;t6=i;endend%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%% 找特殊样本结束%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 找特殊属性值dm4=zeros(200,14);dm5=zeros(200,14);for i=1:200if dm3(i,14)==1dm4(i,1:13)=dm3(i,1:13);else dm5(i,1:13)=dm3(i,1:13);endenda1=zeros(38,1);a2=zeros(38,1);for k=1:38for i=1:13for j=1:200if dm4(j,i)==k&dm4(j,i)~=0a1(k)=a1(k)+1;endif dm5(j,i)==k&dm5(j,i)~=0a2(k)=a2(k)+1;endendendenda5=a1;a6=a2;a3=zeros(6,1);a4=zeros(6,1); j=1;while j<7a11=0;a11=max(a1);for i=1:38if a1(i)==a11a3(j)=a11;j=j+1;if j>6break;enda1(i)=0;endendendj=1;while j<7a22=0;a22=max(a2);for i=1:38if a2(i)==a22a4(j)=a22;j=j+1;if j>6break;enda2(i)=0;endendendb1=zeros(6,1);b2=zeros(6,1); for j=1:6for i=1:38if a5(i)==a3(j)b1(j)=i;endendendfor j=1:6for i=1:38if a6(i)==a4(j)b2(j)=i;endendendb3(1:5,1)=b1(2:6,1);b4(1:5,1)=b2(1:5,1);%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 寻找结束%%%%%%%%%%%%%%%%%%%%% 验证程序开始h7=zeros(103,14);h8=zeros(103,14);tc=0;for i=1:103h7(i,1:13)=dm3(200+i,1:13);end%%%%%%%%%%%%%%%%%%%%%%%%%% 特殊样本for i=1:103nc=0;mc=0;ncc=0;mcc=0;h8(i,1:13)=h7(i,1:13)==dm3(t1,1:13);if sum(h8(i,1:13))>=9nc=nc+0.3;endh8(i,1:13)=h7(i,1:13)==dm3(t2,1:13);if sum(h8(i,1:13))>=9nc=nc+0.3;endh8(i,1:13)=h7(i,1:13)==dm3(t3,1:13);if sum(h8(i,1:13))>=9nc=nc+0.3;endh8(i,1:13)=h7(i,1:13)==dm3(t4,1:13);if sum(h8(i,1:13))>=9mc=mc+0.3;endh8(i,1:13)=h7(i,1:13)==dm3(t5,1:13);if sum(h8(i,1:13))>=9mc=mc+0.3;endh8(i,1:13)=h7(i,1:13)==dm3(t6,1:13);if sum(h8(i,1:13))>=9mc=mc+0.3;end%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 样本结束%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 特殊属性值ncc=0;mcc=0;for j=1:13if h7(i,j)==b3(1)ncc=ncc+3;else if h7(i,j)==b3(2)ncc=ncc+3;else if h7(i,j)==b3(3)ncc=ncc+2;else if h7(i,j)==b3(4)ncc=ncc+2;else if h7(i,j)==b3(5)ncc=ncc+2;else if h7(i,j)==b4(1)mcc=mcc+3;else if h7(i,j)==b4(2)mcc=mcc+3;else if h7(i,j)==b4(3)mcc=mcc+2;else if h7(i,j)==b4(4)mcc=mcc+2;else if h7(i,j)==b4(5)mcc=mcc+2;endendendendendendendendendendend%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 属性值结束%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 挖掘算法if (nc>=0.9&ncc>=8)|(ncc>=10&nc>=0.6)h7(i,14)=1;else if (mc>=0.9|mcc>=8)|(mcc>=9&mc>=0.6)h7(i,14)=2;else if nc>=(mc+0.3)|ncc>=(mcc+2)h7(i,14)=1;else if mc>nch7(i,14)=2;else if ncc>mcch7(i,14)=1;else if mcc>ncch7(i,14)=2;elseh7(i,14)=2;endendendendendendend %%%%%%%%%%%%%%%%%%%%%%%%% 挖掘结束%%%%%%%%%%%%%%%%%% 计算正确率h9=zeros(103,1);h9=h7(:,14)==dm3(201:303,14);tc=sum(h9)/103 %%%%%%%%%%%%%%%%%%%%%%% 算法完毕。

相关文档
最新文档