排序一直以來都是讓我很頭疼的事,以前上《數(shù)據(jù)結(jié)構(gòu)》打醬油去了,整個學(xué)期下來才勉強能寫出個冒泡排序。由于下半年要準(zhǔn)備工作了,也知道排序算法的重要性(據(jù)說是面試必問的知識點),所以又花了點時間重新研究了一下。
排序大的分類可以分為兩種:內(nèi)排序和外排序。在排序過程中,全部記錄存放在內(nèi)存,則稱為內(nèi)排序,如果排序過程中需要使用外存,則稱為外排序。下面講的排序都是屬于內(nèi)排序。
內(nèi)排序有可以分為以下幾類: (1)、插入排序:直接插入排序、二分法插入排序、希爾排序。 (2)、選擇排序:簡單選擇排序、堆排序。 (3)、交換排序:冒泡排序、快速排序。 (4)、歸并排序 (5)、基數(shù)排序
一、插入排序
①直接插入排序(從后向前找到合適位置后插入)
1、基本思想:每步將一個待排序的記錄,按其順序碼大小插入到前面已經(jīng)排序的字序列的合適位置(從后向前找到合適位置后),直到全部插入排序完為止。
2、實例
http://wiki.jikexueyuan.com/project/java-special-topic/images/5.png" alt="" />
3、java 實現(xiàn)
package com.sort;
public class 直接插入排序 {
public static void main(String[] args) {
int[] a={49,38,65,97,76,13,27,49,78,34,12,64,1};
System.out.println("排序之前:");
for (int i = 0; i < a.length; i++) {
System.out.print(a[i]+" ");
}
//直接插入排序
for (int i = 1; i < a.length; i++) {
//待插入元素
int temp = a[i];
int j;
/*for (j = i-1; j>=0 && a[j]>temp; j--) {
//將大于temp的往后移動一位
a[j+1] = a[j];
}*/
for (j = i-1; j>=0; j--) {
//將大于temp的往后移動一位
if(a[j]>temp){
a[j+1] = a[j];
}else{
break;
}
}
a[j+1] = temp;
}
System.out.println();
System.out.println("排序之后:");
for (int i = 0; i < a.length; i++) {
System.out.print(a[i]+" ");
}
}
}
4、分析
直接插入排序是穩(wěn)定的排序。關(guān)于各種算法的穩(wěn)定性分析可以參考 http://www.cnblogs.com/Braveliu/archive/2013/01/15/2861201.html
文件初態(tài)不同時,直接插入排序所耗費的時間有很大差異。若文件初態(tài)為正序,則每個待插入的記錄只需要比較一次就能夠找到合適的位置插入,故算法的時間復(fù)雜度為 O(n),這時最好的情況。若初態(tài)為反序,則第i個待插入記錄需要比較 i+1 次才能找到合適位置插入,故時間復(fù)雜度為 O(n2),這時最壞的情況。
直接插入排序的平均時間復(fù)雜度為 O(n2)。
②二分法插入排序(按二分法找到合適位置插入)
1、基本思想:二分法插入排序的思想和直接插入一樣,只是找合適的插入位置的方式不同,這里是按二分法找到合適的位置,可以減少比較的次數(shù)。
2、實例
http://wiki.jikexueyuan.com/project/java-special-topic/images/2.jpg" alt="" />
3、java 實現(xiàn)
package com.sort;
public class 二分插入排序 {
public static void main(String[] args) {
int[] a={49,38,65,97,176,213,227,49,78,34,12,164,11,18,1};
System.out.println("排序之前:");
for (int i = 0; i < a.length; i++) {
System.out.print(a[i]+" ");
}
//二分插入排序
sort(a);
System.out.println();
System.out.println("排序之后:");
for (int i = 0; i < a.length; i++) {
System.out.print(a[i]+" ");
}
}
private static void sort(int[] a) {
for (int i = 0; i < a.length; i++) {
int temp = a[i];
int left = 0;
int right = i-1;
int mid = 0;
while(left<=right){
mid = (left+right)/2;
if(temp<a[mid]){
right = mid-1;
}else{
left = mid+1;
}
}
for (int j = i-1; j >= left; j--) {
a[j+1] = a[j];
}
if(left != i){
a[left] = temp;
}
}
}
}
4、分析
當(dāng)然,二分法插入排序也是穩(wěn)定的。
二分插入排序的比較次數(shù)與待排序記錄的初始狀態(tài)無關(guān),僅依賴于記錄的個數(shù)。當(dāng) n 較大時,比直接插入排序的最大比較次數(shù)少得多。但大于直接插入排序的最小比較次數(shù)。算法的移動次數(shù)與直接插入排序算法的相同,最壞的情況為 n2/2,最好的情況為 n,平均移動次數(shù)為 O(n2)。
③希爾排序
1、基本思想:先取一個小于 n 的整數(shù) d1 作為第一個增量,把文件的全部記錄分成 d1 個組。所有距離為 d1 的倍數(shù)的記錄放在同一個組中。先在各組內(nèi)進行直接插入排序;然后,取第二個增量 d2<d1 重復(fù)上述的分組和排序,直至所取的增量 dt=1(dt<dt-l<…<d2<d1),即所有記錄放在同一組中進行直接插入排序為止。該方法實質(zhì)上是一種分組插入方法。
2、實例
http://wiki.jikexueyuan.com/project/java-special-topic/images/6.png" alt="" />
3、java 實現(xiàn)
package com.sort;
//不穩(wěn)定
public class 希爾排序 {
public static void main(String[] args) {
int[] a={49,38,65,97,76,13,27,49,78,34,12,64,1};
System.out.println("排序之前:");
for (int i = 0; i < a.length; i++) {
System.out.print(a[i]+" ");
}
//希爾排序
int d = a.length;
while(true){
d = d / 2;
for(int x=0;x<d;x++){
for(int i=x+d;i<a.length;i=i+d){
int temp = a[i];
int j;
for(j=i-d;j>=0&&a[j]>temp;j=j-d){
a[j+d] = a[j];
}
a[j+d] = temp;
}
}
if(d == 1){
break;
}
}
System.out.println();
System.out.println("排序之后:");
for (int i = 0; i < a.length; i++) {
System.out.print(a[i]+" ");
}
}
}
4、分析
我們知道一次插入排序是穩(wěn)定的,但在不同的插入排序過程中,相同的元素可能在各自的插入排序中移動,最后其穩(wěn)定性就會被打亂,所以希爾排序是不穩(wěn)定的。
希爾排序的時間性能優(yōu)于直接插入排序,原因如下:
(1)當(dāng)文件初態(tài)基本有序時直接插入排序所需的比較和移動次數(shù)均較少。 (2)當(dāng) n 值較小時,n 和 n2 的差別也較小,即直接插入排序的最好時間復(fù)雜度 O(n) 和最壞時間復(fù)雜度 0(n2) 差別不大。 (3)在希爾排序開始時增量較大,分組較多,每組的記錄數(shù)目少,故各組內(nèi)直接插入較快,后來增量 di 逐漸縮小,分組數(shù)逐漸減少,而各組的記錄數(shù)目逐漸增多,但由于已經(jīng)按 di-1 作為距離排過序,使文件較接近于有序狀態(tài),所以新的一趟排序過程也較快。 因此,希爾排序在效率上較直接插人排序有較大的改進。 希爾排序的平均時間復(fù)雜度為 O(nlogn)。
二、選擇排序
①簡單的選擇排序 1、基本思想:在要排序的一組數(shù)中,選出最小的一個數(shù)與第一個位置的數(shù)交換;然后在剩下的數(shù)當(dāng)中再找最小的與第二個位置的數(shù)交換,如此循環(huán)到倒數(shù)第二個數(shù)和最后一個數(shù)比較為止。 2、實例
http://wiki.jikexueyuan.com/project/java-special-topic/images/7.png" alt="" />
3、java 實現(xiàn)
package com.sort;
//不穩(wěn)定
public class 簡單的選擇排序 {
public static void main(String[] args) {
int[] a={49,38,65,97,76,13,27,49,78,34,12,64,1,8};
System.out.println("排序之前:");
for (int i = 0; i < a.length; i++) {
System.out.print(a[i]+" ");
}
//簡單的選擇排序
for (int i = 0; i < a.length; i++) {
int min = a[i];
int n=i; //最小數(shù)的索引
for(int j=i+1;j<a.length;j++){
if(a[j]<min){ //找出最小的數(shù)
min = a[j];
n = j;
}
}
a[n] = a[i];
a[i] = min;
}
System.out.println();
System.out.println("排序之后:");
for (int i = 0; i < a.length; i++) {
System.out.print(a[i]+" ");
}
}
}
4、分析
簡單選擇排序是不穩(wěn)定的排序。
時間復(fù)雜度:T(n)=O(n2)。
②堆排序
1、基本思想:
堆排序是一種樹形選擇排序,是對直接選擇排序的有效改進。
堆的定義下:具有n個元素的序列 (h1,h2,...,hn),當(dāng)且僅當(dāng)滿足(hi>=h2i,hi>=2i+1)或(hi<=h2i,hi<=2i+1) (i=1,2,...,n/2)時稱之為堆。在這里只討論滿足前者條件的堆。由堆的定義可以看出,堆頂元素(即第一個元素)必為最大項(大頂堆)。完全二 叉樹可以很直觀地表示堆的結(jié)構(gòu)。堆頂為根,其它為左子樹、右子樹。
思想:初始時把要排序的數(shù)的序列看作是一棵順序存儲的二叉樹,調(diào)整它們的存儲序,使之成為一個 堆,這時堆的根節(jié)點的數(shù)最大。然后將根節(jié)點與堆的最后一個節(jié)點交換。然后對前面(n-1)個數(shù)重新調(diào)整使之成為堆。依此類推,直到只有兩個節(jié)點的堆,并對 它們作交換,最后得到有 n 個節(jié)點的有序序列。從算法描述來看,堆排序需要兩個過程,一是建立堆,二是堆頂與堆的最后一個元素交換位置。所以堆排序有兩個函數(shù)組成。一是建堆的滲透函數(shù),二是反復(fù)調(diào)用滲透函數(shù)實現(xiàn)排序的函數(shù)。
2、實例
初始序列:46,79,56,38,40,84
建堆:
http://wiki.jikexueyuan.com/project/java-special-topic/images/8.png" alt="" />
交換,從堆中踢出最大數(shù)
http://wiki.jikexueyuan.com/project/java-special-topic/images/9.png" alt="" />
依次類推:最后堆中剩余的最后兩個結(jié)點交換,踢出一個,排序完成。
3、java 實現(xiàn)
package com.sort;
//不穩(wěn)定
import java.util.Arrays;
public class HeapSort {
public static void main(String[] args) {
int[] a={49,38,65,97,76,13,27,49,78,34,12,64};
int arrayLength=a.length;
//循環(huán)建堆
for(int i=0;i<arrayLength-1;i++){
//建堆
buildMaxHeap(a,arrayLength-1-i);
//交換堆頂和最后一個元素
swap(a,0,arrayLength-1-i);
System.out.println(Arrays.toString(a));
}
}
//對data數(shù)組從0到lastIndex建大頂堆
public static void buildMaxHeap(int[] data, int lastIndex){
//從lastIndex處節(jié)點(最后一個節(jié)點)的父節(jié)點開始
for(int i=(lastIndex-1)/2;i>=0;i--){
//k保存正在判斷的節(jié)點
int k=i;
//如果當(dāng)前k節(jié)點的子節(jié)點存在
while(k*2+1<=lastIndex){
//k節(jié)點的左子節(jié)點的索引
int biggerIndex=2*k+1;
//如果biggerIndex小于lastIndex,即biggerIndex+1代表的k節(jié)點的右子節(jié)點存在
if(biggerIndex<lastIndex){
//若果右子節(jié)點的值較大
if(data[biggerIndex]<data[biggerIndex+1]){
//biggerIndex總是記錄較大子節(jié)點的索引
biggerIndex++;
}
}
//如果k節(jié)點的值小于其較大的子節(jié)點的值
if(data[k]<data[biggerIndex]){
//交換他們
swap(data,k,biggerIndex);
//將biggerIndex賦予k,開始while循環(huán)的下一次循環(huán),重新保證k節(jié)點的值大于其左右子節(jié)點的值
k=biggerIndex;
}else{
break;
}
}
}
}
//交換
private static void swap(int[] data, int i, int j) {
int tmp=data[i];
data[i]=data[j];
data[j]=tmp;
}
}
4、分析
堆排序也是一種不穩(wěn)定的排序算法。
堆排序優(yōu)于簡單選擇排序的原因:
直接選擇排序中,為了從 R[1..n] 中選出關(guān)鍵字最小的記錄,必須進行 n-1 次比較,然后在 R[2..n] 中選出關(guān)鍵字最小的記錄,又需要做 n-2 次比較。事實上,后面的 n-2 次比較中,有許多比較可能在前面的 n-1 次比較中已經(jīng)做過,但由于前一趟排序時未保留這些比較結(jié)果,所以后一趟排序時又重復(fù)執(zhí)行了這些比較操作。
堆排序可通過樹形結(jié)構(gòu)保存部分比較結(jié)果,可減少比較次數(shù)。
堆排序的最壞時間復(fù)雜度為 O(nlogn)。堆序的平均性能較接近于最壞性能。由于建初始堆所需的比較次數(shù)較多,所以堆排序不適宜于記錄數(shù)較少的文件。
三、交換排序
①冒泡排序
1、基本思想:在要排序的一組數(shù)中,對當(dāng)前還未排好序的范圍內(nèi)的全部數(shù),自上而下對相鄰的兩個數(shù)依次進行比較和調(diào)整,讓較大的數(shù)往下沉,較小的往上冒。即:每當(dāng)兩相鄰的數(shù)比較后發(fā)現(xiàn)它們的排序與排序要求相反時,就將它們互換。
2、實例
http://wiki.jikexueyuan.com/project/java-special-topic/images/10.png" alt="" />
3、java 實現(xiàn)
package com.sort;
//穩(wěn)定
public class 冒泡排序 {
public static void main(String[] args) {
int[] a={49,38,65,97,76,13,27,49,78,34,12,64,1,8};
System.out.println("排序之前:");
for (int i = 0; i < a.length; i++) {
System.out.print(a[i]+" ");
}
//冒泡排序
for (int i = 0; i < a.length; i++) {
for(int j = 0; j<a.length-i-1; j++){
//這里-i主要是每遍歷一次都把最大的i個數(shù)沉到最底下去了,沒有必要再替換了
if(a[j]>a[j+1]){
int temp = a[j];
a[j] = a[j+1];
a[j+1] = temp;
}
}
}
System.out.println();
System.out.println("排序之后:");
for (int i = 0; i < a.length; i++) {
System.out.print(a[i]+" ");
}
}
}
4、分析
冒泡排序是一種穩(wěn)定的排序方法。
②快速排序 1、基本思想:選擇一個基準(zhǔn)元素,通常選擇第一個元素或者最后一個元素,通過一趟掃描,將待排序列分成兩部分,一部分比基準(zhǔn)元素小,一部分大于等于基準(zhǔn)元素,此時基準(zhǔn)元素在其排好序后的正確位置,然后再用同樣的方法遞歸地排序劃分的兩部分。 2、實例
http://wiki.jikexueyuan.com/project/java-special-topic/images/11.png" alt="" />
3、java 實現(xiàn)
package com.sort;
//不穩(wěn)定
public class 快速排序 {
public static void main(String[] args) {
int[] a={49,38,65,97,76,13,27,49,78,34,12,64,1,8};
System.out.println("排序之前:");
for (int i = 0; i < a.length; i++) {
System.out.print(a[i]+" ");
}
//快速排序
quick(a);
System.out.println();
System.out.println("排序之后:");
for (int i = 0; i < a.length; i++) {
System.out.print(a[i]+" ");
}
}
private static void quick(int[] a) {
if(a.length>0){
quickSort(a,0,a.length-1);
}
}
private static void quickSort(int[] a, int low, int high) {
if(low<high){ //如果不加這個判斷遞歸會無法退出導(dǎo)致堆棧溢出異常
int middle = getMiddle(a,low,high);
quickSort(a, 0, middle-1);
quickSort(a, middle+1, high);
}
}
private static int getMiddle(int[] a, int low, int high) {
int temp = a[low];//基準(zhǔn)元素
while(low<high){
//找到比基準(zhǔn)元素小的元素位置
while(low<high && a[high]>=temp){
high--;
}
a[low] = a[high];
while(low<high && a[low]<=temp){
low++;
}
a[high] = a[low];
}
a[low] = temp;
return low;
}
}
4、分析
快速排序是不穩(wěn)定的排序。
快速排序的時間復(fù)雜度為 O(nlogn)。
當(dāng)n較大時使用快排比較好,當(dāng)序列基本有序時用快排反而不好。
四、歸并排序
1、基本思想:歸并(Merge)排序法是將兩個(或兩個以上)有序表合并成一個新的有序表,即把待排序序列分為若干個子序列,每個子序列是有序的。然后再把有序子序列合并為整體有序序列。
2、實例
http://wiki.jikexueyuan.com/project/java-special-topic/images/12.png" alt="" />
3、java 實現(xiàn)
package com.sort;
//穩(wěn)定
public class 歸并排序 {
public static void main(String[] args) {
int[] a={49,38,65,97,76,13,27,49,78,34,12,64,1,8};
System.out.println("排序之前:");
for (int i = 0; i < a.length; i++) {
System.out.print(a[i]+" ");
}
//歸并排序
mergeSort(a,0,a.length-1);
System.out.println();
System.out.println("排序之后:");
for (int i = 0; i < a.length; i++) {
System.out.print(a[i]+" ");
}
}
private static void mergeSort(int[] a, int left, int right) {
if(left<right){
int middle = (left+right)/2;
//對左邊進行遞歸
mergeSort(a, left, middle);
//對右邊進行遞歸
mergeSort(a, middle+1, right);
//合并
merge(a,left,middle,right);
}
}
private static void merge(int[] a, int left, int middle, int right) {
int[] tmpArr = new int[a.length];
int mid = middle+1; //右邊的起始位置
int tmp = left;
int third = left;
while(left<=middle && mid<=right){
//從兩個數(shù)組中選取較小的數(shù)放入中間數(shù)組
if(a[left]<=a[mid]){
tmpArr[third++] = a[left++];
}else{
tmpArr[third++] = a[mid++];
}
}
//將剩余的部分放入中間數(shù)組
while(left<=middle){
tmpArr[third++] = a[left++];
}
while(mid<=right){
tmpArr[third++] = a[mid++];
}
//將中間數(shù)組復(fù)制回原數(shù)組
while(tmp<=right){
a[tmp] = tmpArr[tmp++];
}
}
}
4、分析
歸并排序是穩(wěn)定的排序方法。
歸并排序的時間復(fù)雜度為 O(nlogn)。
速度僅次于快速排序,為穩(wěn)定排序算法,一般用于對總體無序,但是各子項相對有序的數(shù)列。
五、基數(shù)排序
1、基本思想:將所有待比較數(shù)值(正整數(shù))統(tǒng)一為同樣的數(shù)位長度,數(shù)位較短的數(shù)前面補零。然后,從最低位開始,依次進行一次排序。這樣從最低位排序一直到最高位排序完成以后,數(shù)列就變成一個有序序列。
2、實例
http://wiki.jikexueyuan.com/project/java-special-topic/images/13.png" alt="" />
3、java實現(xiàn)
package com.sort;
import java.util.ArrayList;
import java.util.List;
//穩(wěn)定
public class 基數(shù)排序 {
public static void main(String[] args) {
int[] a={49,38,65,97,176,213,227,49,78,34,12,164,11,18,1};
System.out.println("排序之前:");
for (int i = 0; i < a.length; i++) {
System.out.print(a[i]+" ");
}
//基數(shù)排序
sort(a);
System.out.println();
System.out.println("排序之后:");
for (int i = 0; i < a.length; i++) {
System.out.print(a[i]+" ");
}
}
private static void sort(int[] array) {
//找到最大數(shù),確定要排序幾趟
int max = 0;
for (int i = 0; i < array.length; i++) {
if(max<array[i]){
max = array[i];
}
}
//判斷位數(shù)
int times = 0;
while(max>0){
max = max/10;
times++;
}
//建立十個隊列
List<ArrayList> queue = new ArrayList<ArrayList>();
for (int i = 0; i < 10; i++) {
ArrayList queue1 = new ArrayList();
queue.add(queue1);
}
//進行times次分配和收集
for (int i = 0; i < times; i++) {
//分配
for (int j = 0; j < array.length; j++) {
int x = array[j]%(int)Math.pow(10, i+1)/(int)Math.pow(10, i);
ArrayList queue2 = queue.get(x);
queue2.add(array[j]);
queue.set(x,queue2);
}
//收集
int count = 0;
for (int j = 0; j < 10; j++) {
while(queue.get(j).size()>0){
ArrayList<Integer> queue3 = queue.get(j);
array[count] = queue3.get(0);
queue3.remove(0);
count++;
}
}
}
}
}
4、分析
基數(shù)排序是穩(wěn)定的排序算法。
基數(shù)排序的時間復(fù)雜度為 O(d(n+r)),d 為位數(shù),r 為基數(shù)。
總結(jié):
一、穩(wěn)定性:
穩(wěn)定:冒泡排序、插入排序、歸并排序和基數(shù)排序
不穩(wěn)定:選擇排序、快速排序、希爾排序、堆排序
二、平均時間復(fù)雜度
O(n^2):直接插入排序,簡單選擇排序,冒泡排序。
在數(shù)據(jù)規(guī)模較小時(9W 內(nèi)),直接插入排序,簡單選擇排序差不多。當(dāng)數(shù)據(jù)較大時,冒泡排序算法的時間代價最高。性能為 O(n^2) 的算法基本上是相鄰元素進行比較,基本上都是穩(wěn)定的。
O(nlogn):快速排序,歸并排序,希爾排序,堆排序。
其中,快排是最好的, 其次是歸并和希爾,堆排序在數(shù)據(jù)量很大時效果明顯。
三、排序算法的選擇
1.數(shù)據(jù)規(guī)模較小
(1)待排序列基本序的情況下,可以選擇直接插入排序;
(2)對穩(wěn)定性不作要求宜用簡單選擇排序,對穩(wěn)定性有要求宜用插入或冒泡
2.數(shù)據(jù)規(guī)模不是很大
(1)完全可以用內(nèi)存空間,序列雜亂無序,對穩(wěn)定性沒有要求,快速排序,此時要付出 log(N)的額外空間。
(2)序列本身可能有序,對穩(wěn)定性有要求,空間允許下,宜用歸并排序
3.數(shù)據(jù)規(guī)模很大
(1)對穩(wěn)定性有求,則可考慮歸并排序。
(2)對穩(wěn)定性沒要求,宜用堆排序
4.序列初始基本有序(正序),宜用直接插入,冒泡
參考資料:
http://blog.csdn.net/without0815/article/details/7697916 http://gengning938.blog.163.com/blog/static/128225381201141121326346/