合并排序也叫归并排序。在计算机科学中,归并排序(通常拼写为mergesort)是一种高效、通用的, 基于比较的排序算法。大多数实现都会产生一个稳定排序,这意味着输入和输出中相等元素的顺序相同。归并排序是由约翰·冯·诺依曼在1945年发明的一种分治算法。[1]自底向上的归并排序的详细描述和分析在1948年Goldstine和冯·诺依曼的报告中出现。[2]

1 算法编辑


  1. 将未排序的列表分为n个子列表,每个包含一个元素(一个元素的列表被视为有序)。
  2. 反复地归并子列表以产生新的有序子列表,直到只剩下一个子列表。这将是排序后的列表。

1.1 自顶向下的实现


// Array A[] has the items to sort; array B[] is a work array.
void TopDownMergeSort(A[], B[], n)
    CopyArray(A, 0, n, B);           // duplicate array A[] into B[]
    TopDownSplitMerge(B, 0, n, A);   // sort data from B[] into A[]

// Sort the given run of array A[] using array B[] as a source.
// iBegin is inclusive; iEnd is exclusive (A[iEnd] is not in the set).
void TopDownSplitMerge(B[], iBegin, iEnd, A[])
    if(iEnd - iBegin < 2)                       // if run size == 1
        return;                                 //   consider it sorted
    // split the run longer than 1 item into halves
    iMiddle = (iEnd + iBegin) / 2;              // iMiddle = mid point
    // recursively sort both runs from array A[] into B[]
    TopDownSplitMerge(A, iBegin,  iMiddle, B);  // sort the left  run
    TopDownSplitMerge(A, iMiddle,    iEnd, B);  // sort the right run
    // merge the resulting runs from array B[] into A[]
    TopDownMerge(B, iBegin, iMiddle, iEnd, A);

//  Left source half is A[ iBegin:iMiddle-1].
// Right source half is A[iMiddle:iEnd-1   ].
// Result is            B[ iBegin:iEnd-1   ].
void TopDownMerge(A[], iBegin, iMiddle, iEnd, B[])
    i = iBegin, j = iMiddle;
    // While there are elements in the left or right runs...
    for (k = iBegin; k < iEnd; k++) {
        // If left run head exists and is <= existing right run head.
        if (i < iMiddle && (j >= iEnd || A[i] <= A[j])) {
            B[k] = A[i];
            i = i + 1;
        } else {
            B[k] = A[j];
            j = j + 1;

void CopyArray(A[], iBegin, iEnd, B[])
    for(k = iBegin; k < iEnd; k++)
        B[k] = A[k];

1.2 自底向上的实现


// array A[] has the items to sort; array B[] is a work array
void BottomUpMergeSort(A[], B[], n)
    // Each 1-element run in A is already "sorted".
    // Make successively longer sorted runs of length 2, 4, 8, 16... until whole array is sorted.
    for (width = 1; width < n; width = 2 * width)
        // Array A is full of runs of length width.
        for (i = 0; i < n; i = i + 2 * width)
            // Merge two runs: A[i:i+width-1] and A[i+width:i+2*width-1] to B[]
            // or copy A[i:n-1] to B[] ( if(i+width >= n) )
            BottomUpMerge(A, i, min(i+width, n), min(i+2*width, n), B);
        // Now work array B is full of runs of length 2*width.
        // Copy array B to array A for next iteration.
        // A more efficient implementation would swap the roles of A and B.
        CopyArray(B, A, n);
        // Now array A is full of runs of length 2*width.

//  Left run is A[iLeft :iRight-1].
// Right run is A[iRight:iEnd-1  ].
void BottomUpMerge(A[], iLeft, iRight, iEnd, B[])
    i = iLeft, j = iRight;
    // While there are elements in the left or right runs...
    for (k = iLeft; k < iEnd; k++) {
        // If left run head exists and is <= existing right run head.
        if (i < iRight && (j >= iEnd || A[i] <= A[j])) {
            B[k] = A[i];
            i = i + 1;
        } else {
            B[k] = A[j];
            j = j + 1;    

void CopyArray(B[], A[], n)
    for(i = 0; i < n; i++)
        A[i] = B[i];

1.3 使用列表的自顶向下实现


function merge_sort(list m)
    // Base case. A list of zero or one elements is sorted, by definition.
    if length of m ≤ 1 then
        return m

    // Recursive case. First, divide the list into equal-sized sublists
    // consisting of the first half and second half of the list.
    // This assumes lists start at index 0.
    var left := empty list    var right := empty list    for each x with index i in m do
        if i < (length of m)/2 then
            add x to left        else
            add x to right

    // Recursively sort both sublists.
    left := merge_sort(left)
    right := merge_sort(right)

    // Then merge the now-sorted sublists.    return merge(left, right)

在本例中 merge 函数归并左右子列表。

function merge(left, right)    var result := empty list    while left is not empty and right is not empty do
        if first(left) ≤ first(right) then
            append first(left) to result
            left := rest(left)        else
            append first(right) to result
            right := rest(right)

    // Either left or right may have elements left; consume them.
    // (Only one of the following loops will actually be entered.)
    while left is not empty do
        append first(left) to result
        left := rest(left)    while right is not empty do
        append first(right) to result
        right := rest(right)    return result

1.4 使用列表的自底向上实现

对于自底向上的归并排序算法伪代码如下,它使用一个固定大小的节点引用数组,其中array[i]是对大小为2的列表的引用i 或者node是指向节点的引用或指针。merge()函数类似于自顶向下合并列表示例中的merge函数,它归并两个已经排序的列表,并处理空列表。在这种情况下,merge()将使用node输入参数和返回值。

function merge_sort(node head)
    // return if empty list    if (head == nil)        return nil    var node array[32]; initially all nil    var node result    var node next    var int  i
    result = head
    // merge nodes into array    while (result != nil)
         next =; = nil         for(i = 0; (i < 32) && (array[i] != nil); i += 1)
              result = merge(array[i], result)
              array[i] = nil
         // do not go past end of array         if (i == 32)
               i -= 1
         array[i] = result
         result = next
    // merge array into single list
    result = nil    for (i = 0; i < 32; i += 1)
         result = merge(array[i], result)    return result

2 自然归并排序编辑

自然归并排序类似于自底向上的归并排序,输入中任何自然发生的运行步骤(排序的序列)都被利用。利用列表(或等价的磁带或文件)等方便的数据结构(用作先进先出队列或者后进先出堆栈),单调和双调(交替上/下)运行步骤都可以使用。[3]在自底向上的归并排序中,起始点假定每次运行步骤都是一个项目长。实际上,随机输入的数据中会有许多恰好有序的序列进行短期运行步骤。在典型情况下,自然归并排序可能不需要那么多遍,因为要归并的运行步骤较少。在最好的情况下,输入已经有序(即一次运行),所以自然归并排序只需要遍历一次数据。在许多实际情况下,存在长的自然运行步骤,因此自然归并排序被用作 Timsort。如:

开始        :  3  4  2  1  7  5  8  9  0  6
选择运行    : (3  4)(2)(1  7)(5  8  9)(0  6)
归并       : (2  3  4)(1  5  7  8  9)(0  6)
归并       : (1  2  3  4  5  7  8  9)(0  6)
归并       : (0  1  2  3  4  5  6  7  8  9)


3 分析编辑


在排序n个对象中,归并排序拥有O(n log n)的平均性能和最坏情况下的性能。如果对长度为n的列表进行归并排序的运行时间为T(n),那么按照算法的定义(将算法应用于原始列表一半大小的两个列表,并加上合并得到的两个列表的n步),递推公式为T(n)=2T(n/2)+n。相近的形式源于分治算法的主定理。

在最坏的情况下,归并排序的比较次数由排序数字给出。这些数字等于或略小于(n ⌈lg n⌉2⌈lg n + 1),介于(n lg nn + 1)和(n lg n + n + O(lg n))之间。[4]

对于大的 n 和随机顺序的输入列表,归并排序的预期(平均)比较次数α'n 少于最坏的情况。    

最差情况下,归并排序的比较次数比快速排序在平均情况下的比较次数少39%。就移动次数而言,归并排序的最坏情况复杂度是O(n log n)—与quicksort的最佳情况下的复杂度相同,归并排序的最佳情况需要的迭代次数大约是最差情况的一半。[来源请求]


归并排序最常见的实现并非在原列表中偏序;[5] 因此,必须为存储有序序列输出分配内存(只需n/2的额外空间的版本见下文)。

4 变体编辑


将空间开销减少到n/2的简单替代方案是维护左右 节点作为组合结构,仅将m的左侧部分复制到临时存储空间,引导归并 过程使其将归并输出放入m。在这个版本中,最好将临时空间分配给归并过程,因此只需要一次分配。前面提到的过度复制也得到缓解,因为回送结果 语句(函数merge 在上面的伪代码中)变得多余。


  • Katajainen等人提出一种需要恒定工作内存的算法:用足够的存储空间来容纳输入数组中的一个元素,以及额外的空间来容纳O(1)空间复杂度的输入数组中的指针。他们实现了O(n log n) 带有小常数的时间复杂度,但是他们的算法并不稳定。[6]
  • 创造可以与标准(自上而下或自下而上)归并排序相结合,以产生原地归并排序算法的原地归并算法已经有了许多尝试。在这种情况下,“原地”的概念可以放宽到意味着“占用对数堆栈空间”,因为标准的归并排序需要为其自己的堆栈使用留出一定的空间。格弗特等人表示,使用恒定的暂存空间的情况下,在O(n log n)时间复杂度内的稳定原地归并算法是可能的,但是它们的算法很复杂,并且具有很高的常数因子:归并长度分别为nm的数组将进行 5n + 12m + o(m) 次移动。这种高常数因子和复杂的原地算法变得更简单、更容易理解。[7] Bing-Chao Huang和Michael A. Langston[8]提出了一种简单的线性时间算法,实际原地归并 算法,使用固定数量的额外空间归并排序列表。他们都使用了克朗罗德和其他人的作品。它融入线性时间和恒定的额外空间。该算法比标准的归并排序算法花费的平均时间少一点,可以自由利用0(n)个临时额外存储单元,不到原空间的2倍。虽然该算法在实际应用中要快得多,但对于某些列表来说也是不稳定的。但是使用类似的概念,他们已经能够解决这个问题。其他原地算法包括符号归并,它总共花费O((n + m) log (n + m)) 的总时间,并且是稳定的。[9] 将这样的算法插入归并排序增加了非线性的复杂度,但仍然是拟线性的,复杂度为O(n (log n)2)
  • 现代稳定的线性原地归并是块归并排序。


5 与磁带机一起使用编辑

归并排序类型的算法允许在现代标准下具有小容量随机存储器的早期计算机上对大量数据进行排序。记录存储在磁带上并在磁带驱动器组上处理,例如图中的IBM 729.

当要排序的数据太大而无法容纳时,在光盘或者磁带驱动器上进行外部归并排序非常实用。 外部排序解释如何用磁盘驱动器实现归并排序。典型的磁带机类型使用四个磁带机。所有的输入/输出都是顺序的(除了每一遍结束时的倒带)。一个最小的实现只需要两个记录缓冲区和几个程序变量就可以完成。

将四个磁带机命名为A、B、C、D,原始数据在A上,并且只使用两个记录缓冲区,算法类似于 ,使用成对的磁带机而非内存中的阵列。基本算法可以描述如下:

  1. 合并A中的记录对;交替向C和D写入两个记录的子列表
  2. 将两个记录的子列表从C和D合并成四个记录的子列表;把这些交替写入A和B
  3. 将A和B的四个记录子列表合并为八个记录子列表;交替地把这些写入C和D
  4. 重复以上步骤,直到您有一个包含所有数据的列表,在log2(n)遍中就可以完成排序。


有了更高级的算法,上述算法可以修改为使用三个磁带。使用两个队列,或一个栈和一个队列,或三个栈也可以达到On log n)的运行时间。另一方面,使用k(k>2)个磁带(内存中有O(k)个项),利用k/2路归并,我们可以将磁带操作数量减少到O(log k)次。


6 优化归并排序编辑


在现代计算机上, 参考点在 软件优化方面至关重要,因为使用了多级内存层次结构。利用高速缓存的归并排序算法已被提出,该算法明确选择最小化存储器高速缓存中页面调入调出的移动次数。例如,平铺归并排序算法在子阵列达到大小为S时停止划分子阵列,其中S是适合于中央处理器高速缓存的数据项的数量。这些子阵列中的每一个都用原地排序算法进行排序,例如插入排序,以避免内存交换,然后以标准递归方式完成普通的归并排序。该算法在受益于缓存优化的机器上表现出了更好的性能[示例请求]。 ()



7 并行归并排序编辑

由于使用了分治法,归并排序并行性很好。 科曼、莱瑟森、瑞文斯特和斯坦的第三版算法导论讨论了几个平行的变体。[11] 其中的第一个可以很容易地用伪代码表达分支合并关键词:

// Sort elements lo through hi (exclusive) of array A.algorithm mergesort(A, lo, hi) is
    if lo+1 < hi then  // Two or more elements.
        mid = ⌊(lo + hi) / 2⌋        fork mergesort(A, lo, mid)
        mergesort(A, mid, hi)        join
        merge(A, lo, mid, hi)

这个算法是对串行版本的一个微不足道的修改,它的加速并不令人印象深刻:当在无限数量的处理器上执行时,它运行的时间复杂度为Θ(n),这只是一个Θ(log n) 串行版本的改进。使用并行归并算法可以获得更好的结果,这给出了并行下 Θ(n / (log n)2)的时间复杂度,这意味着如果有足够的处理器可用的时间,这种类型的并行归并排序运行的复杂度为


[11] 当与快速稳定的顺序排序相结合时,这种排序在实践中可以表现良好,例如插入排序和快速顺序归并作为归并小阵列的基本情况。[12]

归并排序是最早实现的最佳速度的排序算法之一,理查德·科尔使用巧妙的二次采样算法来确保O(1)归并。[13] 其他复杂度的并行排序算法可以在较低的常数时间内实现相同或更好的时间界限。例如,在1991年,大卫·鲍尔斯描述了一个并行化的快速排序(和一个相关的基数排序)可以在具有n个处理器的CRCW并行随机存取机(PRAM)上通过隐式执行分区在O(log n)时间复杂度内运行。[14]鲍尔斯[15]还展示了一个在蝴蝶排序网络上时间复杂度为O((log n)2)的Batcher的双调归并排序算法,比起在PRAM上运行的O(log n)复杂度,它实际上更快,他详细讨论了比较、基数和并行排序中隐藏的开销。

8 与其他排序算法的比较编辑


截至 Perl 5.8,归并排序是它的默认排序算法(它在早期版本的Perl中是快速排序)。在Java中,Arrays.sort() 方法根据数据类型使用归并排序或优化的快速排序,并且为了高效实现,当排序的数组元素少于7个时切换为插入排序。[16] Linux内核对其链表使用归并排序。[17] Python使用Timsort,这是归并排序和插入排序的另一种优化混合,已成为 Java SE 7(对于非基元类型的数组)[18], 安卓平台[19] 和 GNU Octave[20]中的标准排序算法。

