排序算法效率分析及总结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
C 语言主流 的 排序算法效率分析及总结
作者:XXX 工作:算法搜集及程序组合,结论总结。
同组者:刘文 工作:程序测试,时间记录以及程序演示 这次我们组主要搜集了冒泡排序
算法,简单排序算法,直接插入排序算法,希尔排序算法,堆排序 算法,快
速排序算法六种常见的排序算法,并对它们的运行效率作了一个简单的测试与分析。
A 冒泡排序
算法思想简单描述:
在要排序的一组数中,对当前还未排好序的范围内的全部数,自上而下对相邻的两个数依次进行比较 和调整,让较大的数往下沉,较小的往上冒。
即:每当两相邻的数比较后发现它们的排序与排序要求相反 时,就将它们互换。
冒泡排序是稳定的。
算法时间复杂度:O(N2)
下面我们来测试一下不同数据量的排序时间:
这是200个乱序随机数:
冒泡排序运行时间为毫秒
这是1000个乱序随机数:
冒泡排序运行时间为毫秒
这是5000个乱序随机数:
冒泡排序运行时间为毫秒
这是20000个乱序随机数:
冒泡排序运行时间为毫秒
从不同数据量的纵向分析来看,
1,在冒泡排序算法里,随着数据量的增加,其运行时间也会越来越长。
2,在两百个数据的时候,其运行时间少到忽略不计,即运算瞬间完成。
这说明冒泡排序在处理小数 据量的时候
还是很给力的
3,当处理的数据量从5000提到20000的时候,冒泡排序的运行时间发生了质的增加。
从几十毫秒到
几千毫秒,运行时间大大增加,从这里可见,冒泡排序在处理稍微大的数据的时候便已经显现岀 了力不从心感,我个人感觉已不大适用。
B 简单选择排序
算法思想简单描述:
在要排序的一组数中,选岀最小的一个数与第一个位置的数交换;然后在剩下的数当中再找最小的与 第二个位置的数交换,如此循环到倒数第二个数和最后一个数比较为止。
选择排序是不稳定的。
时间复杂度:O(N2)
下面我们依然来测试一下简单选择排序在不同数据量的运行时间:
这是200个乱序随机数:
简单选择排序运行时间:毫秒
这是1000个乱序随机数:
简单选择排序运行时间:毫秒
这是5000个乱序随机数:
简单选择排序运行时间:毫秒
班级:计科二班
日期:2016-3-29
星期二
这是20000个乱序随机数:
简单选择排序运行时间:毫秒
从不同数据量的纵向分析来看,
1,其运行时间随着数据量的增加而增加
2,简单选择排序同冒泡排序一样,在处理像200个这样的小数据量的时候,其运行时间可以忽略不计,即瞬间完成
3,当数据量从5000提高到20000的时候,其运行时间也是提高了几十倍。
C直接插入排序
算法思想简单描述:
在要排序的一组数中,假设前面(n-1) [n>=2]个数已经是排好顺序的,现在要把第n个数插到前面的有序数中,使得这n个数也是排好顺序的。
如此反复循环,直到全部排好顺序。
直接插入排序是稳定的。
算法时间复杂度:O(N2)
下面我们来简单测试一下直接插入排序在不同数据量下的运行时间:
这是200个乱序随机数:
直接插入排序运行时间:毫秒
这是1000个乱序随机数:
直接插入排序运行时间:毫秒
这是5000个乱序随机数:
直接插入排序运行时间:毫秒这是20000个乱序随机数:直接插入排序运行时间:毫秒从不同数据量的纵向分析来看:直接插入排序在想200个这样的小数据量的时候执行非常快,效率高。
当数据量增加的20000的时候,运行时间会猛增几十倍,效率呈现下降趋势。
D希尔排序
算法思想简单描述:
在直接插入排序算法中,每次插入一个数,使有序序列只增加1个节点,并且对插入下一个数没有提供任
何帮助。
如果比较相隔较远距离(称为增量)的数,使得数移动时能跨过多个元素,则进行一次比较就可
能消除多个元素交换。
算法先将要排序的一组数按某个增量d分成若干组,每组中记录的下标相差 d.对每
组中全部元素进行排序,然后再用一个较小的增量对它进行,在每组中再进行排序。
当增量减到1时,整个要排序的数被分成一组,排序完成。
希尔排序是不稳定的。
希尔排序时间复杂度:O (平均)最好的O(N)最差的O(N2)
下面我们来简单测试一下希尔排序在不同数据量的运行时间情况:
这是200个乱序随机数:
b
希尔排序运行时间为:毫秒
这是1000个乱序随机数:
希尔排序的运行时间:毫秒这是5000个乱序随机数:
希尔排序的运行时间:毫秒
这是20000个乱序随机数:
希尔排序的运行时间:毫秒
从不同数据量的纵向分析来看:
从200个到20000量的随机数,希尔排序运行的时间都是非常快的,效率极高20000个数据的时候也仅仅只是5毫秒,这说明希尔排序在处理大数据的能力上非常优越。
E堆排序
算法思想简单描述:
堆排序是一种树形选择排序,是对直接选择排序的有效改进。
堆的定义如下:具有n个元素的序列(h1,h2,...,hn),当且仅当满足(hi>=h2i,hi>=2i+1 )或(hi<=h2i,hi<=2i+1) (i=1,2,...,n/2)时称之为堆。
在这里只讨论满足前者条件的堆。
由堆的定义可以看岀,堆顶元素(即第一个元
素)必为最大项。
完全二叉树可以很直观地表示堆的结构。
堆顶为根,其它为左子树、右子树。
初始时把要排序的数的序列看作是一棵顺序存储的二叉树,调整它们的存储顺序,使之成为一个堆,这时堆的根节点的数最大。
然后将根节点与堆的最后一个节点交换。
然后对前面(n-1)个数重新调整使之成为堆。
依此类推,直到只有两个节点的堆,并对它们作交换,最后得到有n个节点的有序序列。
从算法描述来看,堆排
序需要两个过程,一是建立堆,二是堆顶与堆的最后一个元素交换位置。
所以堆排序有两个函数组成。
一是建堆的渗透函数,二是反复调用渗透函数实现排序的函数。
堆排序是不稳定的。
算法时间复杂度:O(nlog2n)。
下面我们测试一下堆排序在不同数据量的运行效果:
这是200个乱序随机数:
堆排序运行时间:毫秒
这是1000个乱序随机数:
堆排序运行时间:毫秒
这是5000个乱序随机数:
堆排序运行时间:毫秒
这是20000个乱序随机数:
堆排序运行时间:毫秒
从不同数据量的纵向分析来看:
堆排序不禁在处理小数据的时候效率非常高,就算处理几万个数据,也几乎是瞬间完成。
从200到20000个数据的运行结果来看,堆排序在处理大数据的能力上还是很强的。
F快速排序
算法思想简单描述:
快速排序是对冒泡排序的一种本质改进。
它的基本思想是通过一趟扫描后,使得排序序列的长度能大幅度地减少。
在冒泡排序中,一次扫描只能确保最大数值的数移到正确位置,而待排序序列的长度可能只减少
1。
快速排序通过一趟扫描,就能确保某个数(以它为基准点吧)的左边各数都比它小,右边各数都比它大。
然后又用同样的方法处理它左右两边的数,直到基准点的左右只有一个元素为止。
显然快速排序可以用递归实现,当然也可以用栈化解递归实现。
快速排序是不稳定的。
最理想情况算法时间复杂度:O(nlog2n),最坏O(n2)
下面我们测试一下快速排序在不同数据量的运行情况:
这是200个乱序随机数:
快速排序运行时间毫秒
这是1000个乱序随机数:
快速排序运行时间:毫秒
这是5000个乱序随机数:
快速排序运行时间毫秒
这是20000个乱序随机数:
快速排序运行时间毫秒
从不同数据量纵向分析来看:
随着数据量的增加,快速排序运行的时间也越来越长
在处理小数据量的时候,快速排序效率非常高
在处理大数据的时候,运行时间所花的也不是很长,是可以接受的,个人认为快速排序是一种比较平衡的算法。
横向分析这6种排序算法的效率:
在处理小数据量的时候,6中排序算法的效率都是非常可观的,都是可以接受的。
但根据算法具体来看,当数据本身信息量较大时,直接插入排序所需的记录移动操作较多,不宜采用。
简单选择排序会更好。
当数据量较大的时候,应采用时间复杂度O或O(nlog2n),即希尔排序,堆排序,快速排序都是极好的
当记录本身信息量较大时,可以采用链表存储。