Методы сортировки данных - презентация. Методы сортировки в программировании: сортировка "пузырьком"

В данной статье рассматриваются алгоритмы сортировки массивов. Для начала представляются выбранные для тестирования алгоритмы с кратким описанием их работы, после чего производится непосредственно тестирование, результаты которого заносятся в таблицу и производятся окончательные выводы.

Алгоритмы сортировок очень широко применяются в программировании, но иногда программисты даже не задумываются какой алгоритм работает лучше всех (под понятием «лучше всех» имеется ввиду сочетание быстродействия и сложности как написания, так и выполнения).

В данной статье постараемся это выяснить. Для обеспечения наилучших результатов все представленные алгоритмы будут сортировать целочисленный массив из 200 элементов. Компьютер, на котором будет проводится тестирование имеет следующие характеристики: процессор AMD A6-3400M 4x1.4 GHz, оперативная память 8 GB, операционная система Windows 10 x64 build 10586.36.

Для проведения исследования были выбраны следующие алгоритмы сортировки:

Selection sort (сортировка выбором) – суть алгоритма заключается в проходе по массиву от начала до конца в поиске минимального элемента массива и перемещении его в начало. Сложность такого алгоритма O(n2).

Bubble sort (сортировка пузырьком) – данный алгоритм меняет местами два соседних элемента, если первый элемент массива больше второго. Так происходит до тех пор, пока алгоритм не обменяет местами все неотсортированные элементы. Сложность данного алгоритма сортировки равна O(n^2).

Insertion sort (сортировка вставками) – алгоритм сортирует массив по мере прохождения по его элементам. На каждой итерации берется элемент и сравнивается с каждым элементом в уже отсортированной части массива, таким образом находя «свое место», после чего элемент вставляется на свою позицию. Так происходит до тех пор, пока алгоритм не пройдет по всему массиву. На выходе получим отсортированный массив. Сложность данного алгоритма равна O(n^2).

Quick sort (быстрая сортировка) – суть алгоритма заключается в разделении массива на два под-массива, средней линией считается элемент, который находится в самом центре массива. В ходе работы алгоритма элементы, меньшие чем средний будут перемещены в лево, а большие в право. Такое же действие будет происходить рекурсивно и с под-массива, они будут разделяться на еще два под-массива до тех пор, пока не будет чего разделать (останется один элемент). На выходе получим отсортированный массив. Сложность алгоритма зависит от входных данных и в лучшем случае будет равняться O(n×2log2n). В худшем случае O(n^2). Существует также среднее значение, это O(n×log2n).

Comb sort (сортировка расческой) – идея работы алгоритма крайне похожа на сортировку обменом, но главным отличием является то, что сравниваются не два соседних элемента, а элементы на промежутке, к примеру, в пять элементов. Это обеспечивает от избавления мелких значений в конце, что способствует ускорению сортировки в крупных массивах. Первая итерация совершается с шагом, рассчитанным по формуле (размер массива)/(фактор уменьшения), где фактор уменьшения равен приблизительно 1,247330950103979, или округлено до 1,3. Вторая и последующие итерации будут проходить с шагом (текущий шаг)/(фактор уменьшения) и будут происходить до тех пор, пока шаг не будет равен единице. Практически в любом случае сложность алгоритма равняется O(n×log2n).

Для проведения тестирования будет произведено по 5 запусков каждого алгоритма и выбрано наилучшее время. Наилучшее время и используемая при этом память будут занесены в таблицу. Также будет проведено тестирование скорости сортировки массива размером в 10, 50, 200 и 1000 элементов чтобы определить для каких задач предназначен конкретный алгоритм.

Полностью неотсортированный массив:

Частично отсортированный массив (половина элементов упорядочена):

Результаты, предоставленые в графиках:

В результате проведенного исследования и полученных данных, для сортировки неотсортированного массива, наиболее оптимальным из представленных алгоритмов для сортировки массива является быстрая сортировка. Несмотря на более длительное время выполнения алгоритм потребляет меньше памяти, что может быть важным в крупных проектах. Однако такие алгоритмы как сортировка выбором, обменом и вставками могут лучше подойти для научных целей, например, в обучении, где не нужно обрабатывать огромное количество данных. При частично отсортированном массиве результаты не сильно отличаются, все алгоритмы сортировки показывают время примерно на 2-3 миллисекунды меньше. Однако при сортировке частично отсортированного массива быстрая сортировка срабатывает намного быстрее и потребляет меньшее количество памяти.

Если вы программируете и ваш код уходит дальше написания калькулятора, ты вы не раз столкнётесь или сталкивались с необходимостью отсортировать тот или иной массив данных. Существует множество способов сортировки. В этой статье мы разберём основные из них и сделаем акцент на быстрой сортировке.

Понятие быстрой сортировки

Быстрая сортировка - Quick Sort или qsort. По названию становится понятно, что это и для чего. Но если не понятно, то это алгоритм по быстрой сортировке массива, алгоритм имеет эффективность O(n log n) в среднем. Что это значит? Это значит, что среднее время работы алгоритма повышается по той же траектории, что и график данной функции. В некоторых популярных языках имеются встроенные библиотеки с этим алгоритмом, а это уже говорит о том, что он крайне эффективен. Это такие языки, как Java, C++, C#.

Алгоритм

Метод быстрой сортировки использует рекурсию и стратегию "Разделяй и властвуй".

1. В массиве ищется некий опорный элемент, для простоты лучше взять центральный, но если вы хотите поработать над оптимизацией, то придётся попробовать разные варианты.

2. Слева от опоры ищется элемент больший, чем опорный, справа - меньший, чем опорный, затем меняем их местами. Делаем это, пока максимальный справа не будет меньше, чем минимальный слева. Таким образом, все маленькие элементы кидаем в начало, большие - в конец.

3. Рекурсивно применяем данный алгоритм к левой и правой части нашего алгоритма отдельно, затем ещё и ещё, до достижения одного элемента или определённого количества элементов. Что же это за количество элементов? Есть ещё один способ оптимизировать данный алгоритм. Когда сортируемая часть становится примерно равной 8 или 16, то можно обработать её обычной сортировкой, например пузырьковой. Так мы повысим эффективность нашего алгоритма, т.к. маленькие массивы он обрабатывает не так быстро, как хотелось бы.

Таким образом, будет обработан и отсортирован весь массив. А теперь наглядно изучим данный алгоритм

Эффективность быстрой сортировки

Является ли быстрая сортировка самым быстрым алгоритмом сортировки? Однозначно нет. Сейчас появляется всё больше и больше сортировок, на данный момент самая быстрая сортировка - это Timsort, она работает крайне быстро для массивов, изначально отсортированных по-разному. Но не стоит забывать, что метод быстрой сортировки является одним из самых простых в написании, это очень важно, ведь, как правило, для рядового проекта нужно именно простое написание, а не громадный алгоритм, который сам ты и не напишешь. Timsort - тоже не самый сложный алгоритм, но звание самого простого ему точно не светит.

Реализация алгоритма

Ну вот мы и дошли до самого "вкусного". Теперь разберём, как реализовывается данный алгоритм. Как говорилось ранее, он не слишком сложен в реализации, скорее, даже прост. Но мы всё равно полностью разберём каждое действие нашего кода, чтобы вы поняли, как работает быстрая сортировка.

Наш метод называется quickSort. В нём запускается основной алгоритм, в который мы передаём массив, первый и последний его элементы. Запоминаем в переменные i и k первый и последний элемент сортируемого отрезка, чтобы не изменять эти переменные, так как они нам нужны. Затем проверяем расстояние между первым и последним проверяемым: оно больше или равно единице? Если нет, значит, мы пришли к центру и нужно выйти из сортировки этого отрезка, а если да, то продолжаем сортировку.

Затем за опорный элемент берём первый элемент в сортируемом отрезке. Следующий цикл делаем до того момента, пока не дойдём до центра. В нём делаем ещё два цикла: первый - для левой части, а второй - для правой. Их мы выполняем, пока есть элементы, подходящие под условие, или пока не дойдём до опорного элемента. Затем, если минимальный элемент всё же справа, а максимальный - слева, меняем их местами. Когда цикл заканчивается, меняем первый элемент и опорный, если опорный меньше. Затем мы рекурсивно делаем наш алгоритм для правого и левого участка массива и так продолжаем, пока не дойдём до отрезка длиной в 1 элемент. Тогда все наши рекурсивные алгоритмы будут return, и мы полностью выйдем из сортировки. Также внизу имеется метод swap - вполне стандартный метод при сортировке массива заменами. Чтобы несколько раз не писать замену элементов, пишем один раз и меняем элементы в данном массиве.

В заключение можно сказать, что по соотношению "качество-сложность" быстрая сортировка находится на лидирующей позиции среди всех алгоритмов, поэтому вам стоит однозначно взять метод на заметку и использовать при необходимости в своих проектах.

Оценка алгоритма сортировки

Алгоритмы сортировки оцениваются по скорости выполнения и эффективности использования памяти:

Классификация алгоритмов сортировки

  • Устойчивость (stability) - устойчивая сортировка не меняет взаимного расположения равных элементов.
  • Естественность поведения - эффективность метода при обработке уже упорядоченных, или частично упорядоченных данных. Алгоритм ведёт себя естественно, если учитывает эту характеристику входной последовательности и работает лучше.

Ещё одним важным свойством алгоритма является его сфера применения. Здесь основных типов упорядочения два:

  • Внутренняя сортировка оперирует с массивами, целиком помещающимися в оперативной памяти с произвольным доступом к любой ячейке. Данные обычно упорядочиваются на том же месте, без дополнительных затрат.
    • В современных архитектурах персональных компьютеров широко применяется подкачка и кэширование памяти. Алгоритм сортировки должен хорошо сочетаться с применяемыми алгоритмами кэширования и подкачки.
  • Внешняя сортировка оперирует с запоминающими устройствами большого объёма, но с доступом не произвольным, а последовательным (упорядочение файлов), т. е. в данный момент мы "видим" только один элемент, а затраты на перемотку по сравнению с памятью неоправданно велики. Это накладывает некоторые дополнительные ограничения на алгоритм и приводит к специальным методам упорядочения, обычно использующим дополнительное дисковое пространство. Кроме того, доступ к данным на носителе производится намного медленнее, чем операции с оперативной памятью.
    • Доступ к носителю осуществляется последовательным образом: в каждый момент времени можно считать или записать только элемент, следующий за текущим.
    • Объём данных не позволяет им разместиться в ОЗУ.

Также алгоритмы классифицируются по:

  • потребности в дополнительной памяти или её отсутствии
  • потребности в знаниях о структуре данных, выходящих за рамки операции сравнения, или отсутствии таковой

Список алгоритмов сортировки

В этой таблице n - это количество записей, которые необходимо упорядочить, а k - это количество уникальных ключей.

Алгоритмы устойчивой сортировки

  • Сортировка пузырьком (англ. Bubble sort ) - сложность алгоритма: O(n 2) ; для каждой пары индексов производится обмен, если элементы расположены не по порядку.
  • Сортировка перемешиванием (Шейкерная, Cocktail sort, bidirectional bubble sort) - Сложность алгоритма: O(n 2)
  • Сортировка вставками (Insertion sort) - Сложность алгоритма: O(n 2); определяем где текущий элемент должен находиться в упорядоченном списке и вставляем его туда
  • Блочная сортировка (Корзинная сортировка, Bucket sort) - Сложность алгоритма: O(n ); требуется O(k ) дополнительной памяти и знание о природе сортируемых данных, выходящее за рамки функций "переставить" и "сравнить".
  • Сортировка подсчётом (Counting sort) - Сложность алгоритма: O(n +k ); требуется O(n +k ) дополнительной памяти (рассмотрено 3 варианта)
  • Сортировка слиянием (Merge sort) - Сложность алгоритма: O(n log n ); требуется O(n ) дополнительной памяти; выстраиваем первую и вторую половину списка отдельно, а затем - сливаем упорядоченные списки
  • In-place merge sort - Сложность алгоритма: O(n 2), O(n log 2 n ) или O(n log n ) в зависимости от применяемого алгоритма слияния.
  • Двоичное дерево сортировки (Binary tree sort) - Сложность алгоритма: O(n log n ); требуется O(n ) дополнительной памяти
  • Цифровая сортировка (Сортировка по отделениям, Pigeonhole sort) - Сложность алгоритма: O(n +k ); требуется O(k ) дополнительной памяти
  • Гномья сортировка (Gnome sort) - Сложность алгоритма: O(n 2)

Алгоритмы неустойчивой сортировки

  • Сортировка выбором (Selection sort) - Сложность алгоритма: O(n 2); поиск наименьшего или наибольшего элемента и помещения его в начало или конец упорядоченного списка
  • Сортировка Шелла (Shell sort) - Сложность алгоритма: O(n log 2 n ); попытка улучшить сортировку вставками
  • Сортировка расчёской (Comb sort) - Сложность алгоритма: O(n log n )
  • Пирамидальная сортировка (Сортировка кучи, Heapsort) - Сложность алгоритма: O(n log n ); превращаем список в кучу, берём наибольший элемент и добавляем его в конец списка
  • Плавная сортировка (Smoothsort) - Сложность алгоритма: O(n log n )
  • Быстрая сортировка (Quicksort) - Сложность алгоритма: O(n log n ) - среднее время, O(n 2) - худший случай; широко известен как быстрейший из известных для упорядочения больших случайных списков; с разбиением исходного набора данных на две половины так, что любой элемент первой половины упорядочен относительно любого элемента второй половины; затем алгоритм применяется рекурсивно к каждой половине
  • Introsort - Сложность алгоритма: O(n log n ), сочетание быстрой и пирамидальной сортировки. Пирамидальная сортировка применяется в случае, если глубина рекурсии превышает log(n).
  • Patience sorting - Сложность алгоритма: O(n log n + k ) - наихудший случай, требует дополнительно O(n + k ) памяти, также находит самую длинную увеличивающуюся подпоследовательность
  • Обменная поразрядная сортировка - Сложность алгоритма: O(n ·k ); требуется O(k ) дополнительной памяти

Непрактичные алгоритмы сортировки

  • Bogosort - O(n ·n !) в среднем. Произвольно перемешать массив, проверить порядок.
  • Сортировка перестановкой - O(n ·n !) - худшее время. Генерируются всевозможные перестановки исходного массива и для каждой осуществляется проверка верного порядка.
  • Глупая сортировка (Stupid sort) - O(n 3); рекурсивная версия требует дополнительно O(n 2) памяти
  • Bead Sort - O(n ) or O(√n
  • Блинная сортировка (Pancake sorting) - O(n ), требуется специализированное аппаратное обеспечение

Алгоритмы, не основанные на сравнениях

  • Блочная сортировка (Корзинная сортировка, Bucket sort)
  • Лексикографическая или поразрядная сортировка (Radix sort)
  • Сортировка подсчётом (Counting sort)

Остальные алгоритмы сортировки

См. также

  • Ёмкостная сложность алгоритма
  • Сортирующие сети (сравнение)
  • Сравнивание
  • Трансформация Шварца
  • Параллельная сортировка

Литература

  • Дональд Кнут Искусство программирования, том 3. Сортировка и поиск = The Art of Computer Programming, vol.3. Sorting and Searching. - 2-е изд. - М.: «Вильямс» , 2007. - С. 824. - ISBN 0-201-89685-0
  • Томас Х. Кормен, Чарльз И. Лейзерсон, Рональд Л. Ривест, Клиффорд Штайн Алгоритмы: построение и анализ = INTRODUCTION TO ALGORITHMS. - 2-е изд. - М.: «Вильямс» , 2006. - С. 1296. - ISBN 0-07-013151-1
  • Роберт Седжвик Фундаментальные алгоритмы на C. Анализ/Структуры данных/Сортировка/Поиск = Algorithms in C. Fundamentals/Data Structures/Sorting/Searching. - СПб.: ДиаСофтЮП, 2003. - С. 672. - ISBN 5-93772-081-4

Ссылки

  • Анимированное сравнение алгоритмов сортировки (англ.)

Wikimedia Foundation . 2010 .

Смотреть что такое "Методы сортировки" в других словарях:

    класс сортировки - Классификация контролируемого изделия в одном диапазоне или в нескольких диапазонах требуемых характеристик, например твердости, состава материала или размеров. [Система неразрушающего контроля. Виды (методы) и технология неразрушающего контроля … Справочник технического переводчика

    ГОСТ Р ИСО 14644-3-2007: Чистые помещения и связанные с ними контролируемые среды. Часть 3. Методы испытаний - Терминология ГОСТ Р ИСО 14644 3 2007: Чистые помещения и связанные с ними контролируемые среды. Часть 3. Методы испытаний оригинал документа: 3.2.11 U дескриптор (U descriptor): Полученное или заданное количество частиц, включая ультрамелкие… …

    ГОСТ Р ИСО 2859-5-2009: Статистические методы. Процедуры выборочного контроля по альтернативному признаку. Часть 5. Система последовательных планов на основе AQL для контроля последовательных партий - Терминология ГОСТ Р ИСО 2859 5 2009: Статистические методы. Процедуры выборочного контроля по альтернативному признаку. Часть 5. Система последовательных планов на основе AQL для контроля последовательных партий оригинал документа: 3.36… … Словарь-справочник терминов нормативно-технической документации

    У этого термина существуют и другие значения, см. Триаж (значения). Триаж во Франции, Первая мировая война. Медицинская сортир … Википедия

    - (Selection sort) алгоритм сортировки. Может быть реализован и как устойчивый и как неустойчивый. На массиве из n элементов имеет время выполнения в худшем, среднем и лучшем случае Θ(n2), предполагая что сравнения делаются за постоянное… … Википедия

Сортировка Шелл.

Представляет собой модификацию метода вставок. Используются сравнения и перестановки элементов, но в отличие от метода вставок, в сравнении участвуют не соседние, а отстоящие друг от друга на определенном расстоянии элементы. При необходимости перестановки, элементы перемещаются скачком на данное расстояние, а не на одну позицию.

В одной из модификаций метода (в случае, предложенном Д. Шеллом) шаг кратен степеням двойки. Вначале последовательность из N элементов делится на N/2 групп, если N – четно, и на (N-1)/2 групп, если N – нечетно. Каждая группа содержит по два элемента, если количество элементов было нечетным, одна из групп содержит три элемента. Элементы каждой группы отстоят друг от друга на расстоянии N/2 или (N-1)/2. В течение первого прохода осуществляется упорядочение элементов каждой группы методом вставок. Для осуществления следующего прохода шаг уменьшается вдвое (как и число групп), по отношению к предыдущему шагу (у дробных чисел берется целая часть). Процесс повторяется до тех пор, пока шаг не станет равным единице. В этом случае методом вставок сортируется весь список (одна группа). С точки зрения программной реализации потребуется неоднократный вызов сортировки вставками с указанием, в качестве параметров (помимо исходного списка и числа элементов), индекса начального элемента группы и шага. Приблизительное число сравнений составляет N log 2 N.

// Функция сортировки Шелла целочисленного массива

// Аргументы:

// arr - сортируемый массив

// size - размер сортируемого массива

void SortShell(int* arr, int size) {

int step = size / 2;

while (step != 0) {

// Сортируем группы элементов отстоящих друг от друга на значение шага вставками

for (int i = step; i < size; ++i) {

int tmp = arr[i];

for (j = i - step; j >= 0 && arr[j] > tmp; j -= step)

arr = arr[j];

arr = tmp;

Сортировка выбором

В процессе первого прохода в исходном массиве находятся минимальный элемент, который помещается на место первого элемента. Первый элемент помещается на место минимального. На втором и последующих проходах поиск и обмен повторяются для оставшихся после предыдущего прохода элементов (с позициями: на втором проходе – со второй по последнюю, на третьем проходе – с третьей по последнюю и т.д.) до тех пор, пока не будет отсортирована вся последовательность. Общее число сравнений составляет приблизительно 0,5 N 2 , N – здесь и далее число элементов.

void selectSort(int a, long size) {

for(i=0; i < size; i++) { // i - номер текущего шага

for(j=i+1; j < size; j++) // цикл выбора наименьшего элемента

if (a[j] < x) {

k=j; x=a[j]; // k - индекс наименьшего элемента

a[k] = a[i]; a[i] = x; // меняем местами наименьший с a[i]

Сортировка пузырьком

В процессе сортировки производится попарное сравнение соседних элементов. Если порядок следования соседних элементов нарушен, то они меняются местами. В процессе первого прохода максимальный элемент попадает на последнее место и, следовательно, в последующих сравнениях не участвует. Остальные элементы "всплывают" на одну позицию вверх (поэтому метод часто называют сортировкой "пузырьком"). На каждом следующем проходе рассматривается последовательность для N-1, N-2 и т.д. элементов. Если при каком-либо проходе не было произведено ни одной перестановки, последовательность отсортирована. Максимальное число сравнений составляет приблизительно 0,5 N 2 , среднее число сравнений пропорционально 0,25 N 2 , среднее число обменов – 0,25 N 2 .

void bubbleSort(int a, long size) {

for(i=0; i < size; i++) { // i - номер прохода

for(j = size-1; j > i; j--) { // внутренний цикл прохода

if (a > a[j]) {

x=a; a=a[j]; a[j]=x;

Сортировка вставками

Первый элемент исходного списка считается отсортированным списком длины 1. Двухэлементный отсортированный список создается добавлением второго элемента исходного списка в нужное место одноэлементного списка, содержащего первый элемент. В целом, каждый новый элемент вставляется в подходящее место среди ранее упорядоченных элементов. Среднее число сравнений пропорционально N 2 .

void insertSort(int a, long size) {

for (i=0; i < size; i++) { // цикл проходов, i - номер прохода

// поиск места элемента в готовой последовательности

for (j=i-1; j>=0 && a[j] > x; j--)

a = a[j]; // сдвигаем элемент направо, пока не дошли

// место найдено, вставить элемент

Метод подсчёта

Метод основан на том, что k+1-ый элемент упорядоченной последовательности превышает ровно k элементов, и следовательно занимает k+1-ую позицию. В процессе сортировки на каждом i-ом проходе i-ый элемент исходной последовательности попарно сравнивается со всеми остальными элементами. Инициализированный нулем перед началом прохода счетчик k увеличивается, если i-ый элемент оказался больше текущего. Таким образом, порядковый номер i-го элемента, по окончанию i-го прохода, равен k+1. Для сортировки последовательности из N элементов требуется N проходов, на каждом из которых выполняется N сравнений. Число сравнений равно N 2 . Приведенный метод подсчета можно использовать,

void insertSort(int a, long size)

int *b=new int;

for (int i=0;i

for (int j=0;j

if (a[i]>a[j]){

Сортировка по дереву (6)

Процесс сортировки состоит из: фазы построения двоичного дерева поиска и фазы обхода. Структура двоичного дерева задается с помощью связного списка, каждый элемент которого может иметь, максимум, двух потомков (две ссылки). Двоичное дерево формируется по всем исходным элементам, по следующему правилу. Первый элемент исходной последовательности является первым узлом дерева. Следующий элемент последовательности сравнивается со значениями в узлах строящегося дерева, начиная с корня. Если значение текущего элемента больше значения элемента в узле дерева, следует переместиться вниз по правой ссылке от текущего узла, в противном случае – по левой ссылке. Перемещение по дереву продолжается до тех пор, пока не будет достигнута свободная ссылка, после чего осуществляется вставка элемента в дерево. После формирования дерева необходимо провести процедуру смешанного обхода. Он заключается в рекурсивном посещении (чтении) узлов, начиная с корня: левого поддерева, узла, правого поддерева. В результате получается отсортированная последовательность. Среднее число сравнений aN log 2 N, 1 < a < 2.

Сбалансированное N-ленточное слияние

Общей формой внешней сортировки является N-ленточное слияние. Для N-ленточного слияния потребуется 2N магнитных лент и 2N лентопротяжных устройств (которые можно заменить 2N файлами на устройстве внешней памяти). Исходная неупорядоченная последовательность размещается на первой магнитной ленте. Затем она разносится на N магнитных лент по следующему правилу: первая запись – на первую из N лент, вторая – на вторую, (N+1)-ая – снова на первую из N лент.

Сбалансированное N-ленточное слияние осуществляется в два этапа. На первом этапе из записей, хранящихся на каждой магнитной ленте, формируются упорядоченные цепочки. Так как все цепочки имеют одинаковую длину, слияние называется сбалансированным. Упорядочение цепочки происходит в оперативной памяти одним из методов внутренней сортировки. Упорядоченные цепочки размещаются на N свободных магнитных лентах, после чего начинается второй этап сортировки – слияние. Процесс слияния осуществляется в несколько циклов. После каждого цикла слияния длина упорядоченных цепочек увеличивается на N. В конечном итоге, формируется упорядоченная последовательность из N составляющих. Собственно слияние осуществляется следующим образом. Пусть имеются две цепочки длиной l , изначально упорядоченные. Необходимо получить одну упорядоченную цепочку. Для этого: сравниваются первые элементы двух цепочек, меньшая переписывается в результирующую цепочку; операция осуществляется с помощью трех счетчиков; после записи в результирующую последовательность увеличивается на единицу счетчик результирующей последовательности и счетчик последовательности, в которой был обнаружен меньший элемент; действие повторяется до тех пор, пока один из счетчиков исходной последовательности не достигнет значения конца последовательности, после чего оставшиеся элементы другой последовательности дописываются в конец результирующей. Таким образом, будут упорядочены каждая из N магнитных лент.

МОУ СОШ С. КАМЫШКИ

ТВОРЧЕСКАЯ РАБОТА

Методы сортировки данных

в курсе ОИВТ

Выполнила:

учитель информатики

На I квалификационную категорию

с. Ал-Гай, 2006

Введение. 3

1. Необходимость изучения темы "Методы сортировки данных". 4

2. Подготовительная работа к теме "Методы сортировки данных". 4

3.Методы сортировок. 7

4. Более сложные и более эффективные методы сортировки. 10

5. Сравнительная характеристика методов сортировки. 11

Заключение. 12

ЛИТЕРАТУРА.. 13

Приложение. 14

Приложение. 15

Приложение. 16

Приложение. 20

Приложение. 21

Приложение. 24

Приложение. 26

Приложение. 28

Приложение. 29

Приложение. 34

Приложение. 37

Приложение. 42

Введение

В этой работе рассматривается большая тема "методы сортировки данных", которая является обязательной в курсе ОИВТ
Изучение табличных величин и методов сортировки - неотъемлемая часть любого курса информатики. Это видно хотя бы по тому факту, что эта тема рассматривается во всех распространенных сегодня учебниках, несмотря на различия в идейных и методических установках их авторов.
Процессом сортировки называют действия по упорядочению некоторых данных (таблицу) по ключу. Ключи могут быть разными. Например, преобразовать
1) таблицу чисел по возрастанию,
2) таблицу фамилий - по алфавиту , причем только по первой букве,
3) элементы, стоящие только на четных местах таблицы в убывающем порядке.
Очевидно, что с "отсортированными" данными работать легче и быстрее, чем с произвольно расположенными. Когда элементы "отсортированы", проще найти, например, телефон товарища в телефонной книге на 500 страниц, быстрее найти слово в словаре на 700 страниц.

Важность темы "сортировки" определяется и особой ролью таблиц. Все применения ЭВМ основаны на их способности к быстрой и точной обработке больших объемов информации, а это возможно только когда информация однородна и отсортирована. Таким образом, таблицы как основное средство представления однородной информации неизбежно используются во всех реальных компьютерных программах.
На табличном принципе основана и архитектура современных ЭВМ: память машины можно рассматривать как большой массив байтов, адреса которых располагаются по возрастанию. Следовательно, без понимания информационной сущности таблиц и основных алгоритмов их обработки невозможно формирование полноценных представлений о возможностях ЭВМ и принципах их работы. Отсюда вытекает необходимость темы "Сортировки " в общеобразовательном курсе информатики. Абсолютно необходима эта тема и в углубленном курсе информатики. Для построения сколько-нибудь сложных и содержательных программ необходимо уверенное владение общими принципами применения таблиц и базовыми приемами их обработки.
Элементы сортировки данных излагаются во многих работах различных авторов (см.). Это указывает на актуальность темы "сортировка", изучение их методов, разработки методики преподавания тем из курса ОИВТ, связанных с сортировкой данных.
В МОУ СОШ с. Камышки информатика преподается на протяжении многих лет. За эти годы нам не раз приходилось изменять программу. Иногда приходилось изменять методику изложения и содержание материала, что частично связано с развитием вычислительной техники и появляющимися в связи с этим новыми возможностями и новыми технологиями .

Тема "сортировки" является неотъемлемой частью программы. У учителя имеется большое количество заготовленных алгоритмов решения тех или иных задач. В процессе изучения темы оказывается эффективным: выполнение учеником готовых алгоритмов и программ самому, "вместо компьютера", выполнение "трассировки" алгоритма для тех или иных исходных данных, подбор таких данных, для которых алгоритм будет выполнять наибольшее или наименьшее возможное количество действий. Для каждой темы такая работа не только с компьютером, но и с тетрадью дает, по мнению автора, положительный результат.
Целью данной работы является изложение методики преподавания в 10-11 классах темы "Сортировки элементов", а также тем, связанных с сортировкой данных.
Кроме того, на примере этой темы хотелось бы продемонстрировать ту методику преподавания, которая используется и при преподавании многих других тем.
Методы "быстрой" сортировки, которые являются более сложными для понимания, изучаются на факультативных занятиях.

1. Необходимость изучения темы "Методы сортировки данных"

Изучение любой темы следует начинать с того, чтобы подвести ученика к необходимости этого, показать потребность в решении соответствующего круга проблем, привести доступные для понимания учеников примеры, продемонстрировать использование элементов сортировки в прикладных задачах (на практике, в окружающем нас мире).
Как только мы дали еще интуитивное понятие смысла "сортировки" данных, мы говорим на уроках ОИВТ о ее необходимости, например, сортировки данных по какому-либо признаку. Мы приводим примеры организации личных записных книжек, словарей, телефонных справочников , математических таблиц, энциклопедий. Трудно себе представить, как пользоваться перечисленными объектами, если информация в них не была бы отсортирована.
В словарях слово "сортировка" определяется как распределение, отбор по сортам, качеству, размерам, по сходным признакам, в программировании это слово традиционно используется в более узком смысле.
Под сортировкой в курсе ОИВТ обычно понимают процесс размещения элементов заданного множества объектов в некотором определенном порядке, как правило, в порядке возрастания или убывания (когда сортируемыми элементами являются числа) или в алфавитном порядке (при сортировке текстовой информации).
Очевидно, что отсортированными данными легче пользоваться, чем произвольно расположенными данными. Когда элементы отсортированы, их проще отыскать, проще производить с ними различные операции. В отсортированных данных легче определить, имеются ли пропущенные элементы. Для двух отсортированных таблиц легче найти общие элементы.
Сортировка также является мощным средством ускорения работы практически любого алгоритма, в котором возникает необходимость частого обращения к определенным элементам. Как пишет один из классиков теории программирования Д. Кнут в [ 4 ] "Даже если бы сортировка была почти бесполезна, нашлась бы масса причин заняться ею! Изобретательные методы сортировки говорят о том, что она и сама по себе интересна как объект исследования". Анализ этих методов очень полезен и с точки зрения обучения, так как с их помощью можно наглядно проиллюстрировать самые разные ситуации. По словам создателя языка Паскаль, Н. Вирта, "создается впечатление, что можно построить целый курс программирования, выбирая примеры только из задач сортировки" [ 5 ].
Интересен этот класс алгоритмов еще и тем, что на нем наглядно демонстрируются богатейшие возможности программирования: насколько разными путями можно прийти к одной цели - получение упорядоченного массива! На множестве алгоритмов сортировки становится понятной необходимость сравнительного анализа алгоритмов и оценки их качества, критериями которого являются увеличение быстродействия и экономии памяти. Недаром вопросы, связанные с сортировкой, занимают важное место в школьном курсе информатики

2. Подготовительная работа к теме "Методы сортировки данных".

Поиск и сортировка относятся к табличным и другим сложным структурам данных, поэтому возникает необходимость, прежде всего, в изучении этих сложных структур данных, например, линейных и прямоугольных массивов (таблиц).
Структуру для представления однородной информации в программировании принято называть массивом. (Фактически термины таблица и массив в данном контексте - полные синонимы).
В 10 классе вводится понятие таблицы как новый способ хранения информации. Новые понятия лучше всего воспринимаются учениками в тех случаях, когда они возникают не случайно, а как необходимость при решении каких-либо новых задач. Новое понятие возникает в результате решения специально-подобранной вводной задачи. Фактически ученики сами изобретают недостающие средства, а учитель должен направить формирование этих средств в нужное русло.

Возможная вводная задача для темы "Таблицы" - нахождение периметра многоугольника с известными длинами сторон изложена в приложение 1. Эта задача подводит учеников к основным свойствам табличных величин: таблица состоит из множества простых переменных, к которым можно обращаться не по уникальным именам, а по общему имени таблицы с указанием номера элемента.

После такого введения ученики понимают, зачем нужны таблицы, они готовы разбираться в таких понятиях, как элемент, индекс, обращение к элементу и т. д.

Важный вопрос, на который надо отвечать при решении реальных задач, - когда следует и когда не следует объединять простые переменные в таблицы. Ключ к ответу - понимание таблицы как составной величины, хранящей однородную информацию.

Однородность означает, что все элементы таблицы равноправны: имеют одинаковый, содержательный смысл, при обработке над ними совершаются одинаковые операции.

Чтобы научить школьника решать задачи, необходимо, не только познакомить его с типовыми приемами, но и показать те ситуации, в которых срабатывает тот или иной прием.

Хорошая классификация должна помогать этому, ее применение должно сокращать путь от условия до решения. Для этого необходимо объединить в группы задачи, обладающие одновременно схожими условиями и принципами решения.(см. приложение №2)

Общность условий обеспечивает распознавание задачи учеником, отнесение ее к конкретному типу, то есть создает возможность реального применения классификации.
Общность решений помогает ученику сделать следующий шаг - подобрать метод решения, то есть обеспечивает результативность классификации.
Таким образом, в основу классификации должен лечь некий признак, явно видимый из условия задачи и существенно влияющий на ее решение. В качестве такого признака предлагается рассматривать информационную роль таблицы в алгоритме, то есть вид табличной величины.
Очевидно, что таблица может быть результатом алгоритма(заполнение), аргументом (обработка) и аргументом-результатом (модификация). При более внимательном рассмотрении становится ясно, что обработка (таблица - аргумент) включает слишком большой класс задач, решаемых разными методами. Среди них можно выделить две большие группы: задачи анализа и задачи поиска. В задачах анализа требуется просмотреть всю таблицу и определить какие-то ее характеристики (сумма, произведение, количество элементов с заданным свойством и т. д.) В задачах поиска требуется найти в таблице элемент, обладающий нужным свойством, причем просматривать всю таблицу для этого необязательно.
С другой стороны, многие задачи модификации не требуют освоения специальных приемов и сводятся к комбинации анализа и заполнения. Это, например, известная задача о корректировке отчета (элементы, меньшие100, заменить на 100) и ей подобные. Поэтому выделять модификацию как отдельный класс задач не стоит.
Реальный интерес представляют задачи перестановки, в которых необходимо переставить элементы заданной таблицы в соответствии с какими-то требованиями. Эти задачи не сводятся к другим и могут рассматриваться как самостоятельная группа. Главная задача перестановки - это сортировка элементов массива, то есть элементы массива необходимо переставить так, чтобы они располагались, например, по возрастанию. Задача сортировки массивов не падает с неба, а относится к одной из групп задач на табличные величины. Окончательно получаем такие группы задач:
1. Заполнение
2. Анализ
3. Поиск
4. Перестановка.
Серия задач для каждой группы приведена в приложении 3.

Фактически все основные приемы построения алгоритмов формируются на линейных таблицах. Обработка прямоугольных таблиц приводит к количественному, но не качественному усложнению. Линейная таблица - это основное, первичное понятие, а прямоугольная таблица может быть построена как линейная таблица, состоящая из линейных таблиц. Поэтому в общеобразовательном курсе достаточно рассмотреть только линейные таблицы, быть может, упоминая, но не разбирая подробно, прямоугольные. При реализации углубленного курса изучение прямоугольных таблиц необходимо, но и в этом случае сначала нужно твердо усвоить основные принципы обработки линейных таблиц.
По нашему школьному предмету ОИВТ, фактически, нет сборников задач и опубликованного дидактического материала. Учителю информатики приходится постоянно заниматься подбором и систематизацией условий задач.

Опыт работы за многие годы показал, что кроме составления алгоритмов и программ учителем и учениками желательно уделять большое внимание выполнению готовых алгоритмов.
Учащиеся при этом "обязаны":
1) выполнить алгоритм,
2) определить, что получается при его выполнении на конкретных данных,
3) восстановить условие задачи по готовому алгоритму,
4) проанализировать количество "элементарных" действий при выполнении алгоритма, что отражает скорость работы алгоритма или время его выполнения,
5) подобрать такие данные, для которых количество "элементарных" действий будет минимальным и такие данные, для которых он будет максимальным.

С готовыми алгоритмами можно работать в различных формах, например:
1. при объяснении всем учащимся одного и того же алгоритма;
2. при работе с учеником индивидуально;
3. при объяснении отдельной темы, ученикам, которые пропустили тему, например, по причине болезни;
4. при уяснении темы с теми учащимися, которые не всегда с первого раза усваивают материал.
Работа в различных формах с готовыми алгоритмами позволяет:
1. учитывать индивидуальные особенности учеников;
2. учитывать психологию, их различную по времени реакцию;
3. развивать их логические, алгоритмические способности;
4. углубить знания по соответствующей теме, так как для получения результата он обязан сам, как исполнитель выполнить алгоритм, а значит закрепить все конструкции, глубже понять, как они выполняются, какие особенности имеют.

Еще одним элементом подготовительной работы к теме "сортировка" является исследование массивов переменной размерности в языках программирования. В приложении 4 приведены задания, предлагаемые учащимся для решения.
Подготовительная работа, проведенная с учащимися в 10-х классах, позволяет далее перейти непосредственно к изучению методов сортировки.

Итак в первый год обучения (в 10 классе) заложен фундамент изучения таблиц, проработкой серии задач и алгоритмов на выбор максимальных и минимальных элементов, перестановку элементов и т. д.
В 11-ом классе - мы вплотную подходим к методам сортировки, опираясь на изученные алгоритмы обработки таблиц.
Рассматриваются задачи поиска нужного элемента, составление словарей, справочников, составление лотерейных таблиц, списка учеников в журнале.
Для решения многих задач удобно сначала упорядочить данные по определенному признаку.
Данные, например, элементы массива, можно отсортировать:
по возрастанию - каждый следующий элемент больше предыдущего:
а[ 1 ] < a < a[n];
по неубыванию - каждый следующий элемент не меньше предыдущего:
а <= а <=. . .<= а[n];
по убыванию - каждый следующий элемент меньше предыдущего:
а [ 1 ]> а> ... >а[n],
по невозрастанию - каждый следующий элемент не больше предыдущего:
а [ 1 ] >= а >= ... >=a[n].

3.Методы сортировки

Существует довольно много различных методов сортировки, отличающихся друг от друга степенью эффективности, под которой понимается количество сравнений и количество обменов, произведенных в процессе сортировки, время выполнения и объем занимаемой ОП. Рассмотрим подробно некоторые из указанных методов. Сначала приведены четыре простых метода. Каждый учитель может выбирать любой порядок изучения указанных методов, если предложенный порядок не устраивает.
Однако, перед тем как рассматривается любой из метод сортировки необходимо повторить отдельных уже изученных алгоритмов, на которые этот метод опирается.
Сначала рассмотрим два метода сортировки:
сортировку выбором (или линейную) и сортировку обменом (или пузырьковую).
Оба метода не очень эффективны и на практике используются крайне редко. Но тогда почему ими нужно вообще заниматься? Во-первых, во многих простых случаях (например, когда требуется отсортировать всего 20-25 чисел) они вполне удовлетворительны. Во-вторых, эти методы интересны для нас тем, что в них моделируется естественное поведение человека, осуществляющего сортировку в ручную. Именно эти два метода легче всего описываются в форме четких алгоритмов и приводят к простой программной реализации.

Рассмотрим сортировку выбором.

Сортировка выбором состоит в том, что сначала в неупорядоченной последовательности выбирается минимальный элемент. Этот элемент исключается из дальнейшей обработки, а оставшаяся последовательность элементов принимается за исходную, и процесс повторяется до тех пор, пока все элементы не будут выбраны. Очевидно, что выбранные элементы образуют упорядоченную последовательность. Выбранный в исходной последовательности минимальный элемент размещается на предназначенном ему месте упорядоченной последовательности несколькими способами:
1. Минимальный элемент после i-го просмотра перемещается на i-е место (i=1, 2 , 3, другого массива, а в старом, исходном, на месте выбранного размещается какое-то очень большое число, превосходящее по величине любой элемент сортируемого массива. Измененный таким образом массив принимается за исходный, и осуществляется следующий просмотр. Очевидно, что при этом размер обрабатываемого массива на 1 меньше размера предыдущего.
2. Минимальный элемент после i-го просмотра перемещается на i-ое место (i=1, 2, 3, заданного массива, а элемент с i-го места - на место выбранного. После каждого просмотра упорядоченные элементы (от первого до элемента с индексом i) исключаются из дальнейшей обработки, т. е. размер каждого последующего обрабатываемого массива на 1 меньше размера предыдущего.
Этот метод сортировки обычно применяется для массивов, не содержащих повторяющихся элементов. Для достижения поставленной цели можно действовать следующим образом:
1) выбрать максимальный элемент массива;
2) поменять его местами с последним элементом (после этого наибольший элемент будет стоять на своем месте);
3) повторить пункты. 1-2 с оставшимися п-1 элементами, то есть рассмотреть часть массива, начиная с первого элемента до предпоследнего, найти в ней максимальный элемент и поменять его местами с предпоследним; (п-1)-м элементом массива и так далее, пока не останется один элемент, уже стоящий на своем месте.
Всего потребуется п-1 раз выполнить эту последовательность действий. В процессе сортировки будет увеличиваться отсортированная часть массива, а не отсортированная, соответственно, уменьшаться.

Итак, этот метод основывается на нахождении максимального (минимального) значения и перестановках. Причем эти алгоритмы уже отработаны и мы просто на них опираемся. Поэтому перед тем, как рассматривать данный метод сортировки необходимо вспомнить решение этих задач. Единственная трудность, возникающая при составлении алгоритма, это то, что мы работаем с частью табличной величины. На примере данного алгоритма можно продемонстрировать использование вспомогательных алгоритмов или процедур, так как поиск максимального значения можно выделить как самостоятельную программу, то есть как процедуру.

Алгоритмы, реализующие этот метод, рассмотрены в приложении 5.
Можно предложить ученикам:
1. Подсчитать количество произведенных сравнений типа А[I] < AF.
2. Подсчитать количество произведенных перестановок типа Swap (A, B).
Проанализировав первый и второй способы с точки зрения эффективности алгоритма, который выражается в наименьшем количестве выполняемых пересылок и сравнений, вместе с учениками следует записать ещё один, третий способ сортировки выбором (см. приложение 5).
Ход сортировки третьим способом для сортировки массива 30, 17, 73, 47, 22, 11, 65, 54 отразим в таблице

На последующих уроках информатики следует закрепить изученный метод сортировки выбором.

Возвращаясь ещё раз к вопросу об эффективности алгоритмов сортировки выбором, установим, что наименьшее количество действий будет выполняться для исходного массива, уже отсортированного уже в нужном порядке. Наибольшее количество действий будет выполняться для исходного массива, отсортированного в "противоположном смысле".

Рассмотрим сортировку обменом (метод "Пузырька").

Сортировка обменом - метод, при котором все соседние элементы массива попарно сравниваются друг с другом и меняются местами в том случае, если предшествующий элемент больше последующего. В результате этого максимальный элемент постепенно смещается вправо и, в конце концов, занимает свое крайне правое место в массиве, после чего он исключается из дальнейшей обработки. Затем процесс повторяется, и свое место занимает второй по величине элемент, который также исключается из дальнейшего рассмотрения. Так продолжается до тех пор, пока вся последовательность не будет упорядочена.
Если последовательность сортируемых чисел расположить вертикально (первый элемент - внизу) и проследить за перемещениями элементов (рис. 2 в приложении 6), то можно увидеть, что большие элементы, подобно пузырькам воздуха в воде, "всплывают" на соответствующую позицию. Поэтому "сортировку", таким образом, называют еще сортировкой методом "пузырька", или "пузырьковой" сортировкой.
Сортировка методом простого обмена может быть применена для любого массива.
Итак, в сортировке "обменом" все соседние элементы попарно сравниваются друг с другом и меняются местами, если предшествующий элемент больше последующего. То есть мы опять основываемся на уже отработанных алгоритмах перестановки элементов.
Описание этого метода подробнее в приложении 6.

"Шейкер" - сортировка.

Несмотря на все сделанные выше усовершенствования, "пузырьковая" сортировка следующего (почти упорядоченного!) массива 5, 7, 12, 28, 36, 85, 2 будет проведена за семь проходов. Это связано с тем, что при сортировке, рассматриваемым методом, за один проход элемент не может переместиться влево больше чем на одну позицию. Так что если минимальный элемент массива находится в его правом конце (как в рассматриваемом примере), то придется выполнить максимальное число проходов. Поэтому естественно напрашивается еще одно улучшение метода "пузырьковой" сортировки - попеременные проходы массива в обоих направлениях, а не только от его начала к концу. В этом случае время сортировки может несколько сократиться. Такой метод сортировки называется "шейкер"-сортировкой (от английского слова shake - трясти, встряхивать). Его работа показана на примере сортировки массива из 8 элементов (на рис. 3 в приложении 7). Алгоритмы этого метода подробно изложены в приложении 7.

Сортировка подсчетом

Этот простой и легкий для понимания метод заключается в том, что каждый элемент массива сравнивается со всеми остальными. Место каждого элемента в отсортированном массиве зависит от числа элементов, меньших его. Иными словами, если некоторый элемент превышает 13 других, то его место в упорядоченной последовательности - 14. Следовательно, для сортировки необходимо сравнить попарно все элементы и подсчитать, сколько из них меньше каждого отдельного элемента. После этого все элементы исходного массива можно разместить на соответствующих им местах в новом, специально созданном массиве. Алгоритм сортировки подсчетом подробно изложен в приложении 8.

Сортировка вставками (методом прямого включения).

Сортировка вставками, так же как и сортировка методов простого выбора, обычно применяется для массивов, не содержащих повторяющихся элементов. Сортировка методом прямого включения, как и все описанные выше, производится по шагам. На k-м шаге считается, что часть массива, содержащая первые k-1 элементов, уже упорядочена, то есть a < a< . . . < a. Далее необходимо взять k-й элемент и подобрать для него такое место в отсортированной части массива, чтобы после его вставки упорядоченность не нарушилась, то есть надо найти такое j (1<=j<=k-1), что a<=a[k]

Более подробно этот метод рассмотрен в приложении 9

4. Более сложные и более эффективные методы сортировки.

При решении более сложных задач, в том числе олимпиадных, приходится обрабатывать большие наборы данных. Применение простых для понимания, но медленно работающих методов сортировки, изложенных в предыдущем разделе, становится нецелесообразно. Ученики начинают искать другие методы сортировки. Именно, когда ученикам недостает более эффективных методов сортировки и рассматриваются эти более сложные методы.
Преследуемая цель: знакомство с эффективными алгоритмами сортировки и поиска; реализация рекурсивных процедур и функций. Изучение быстрых методов сортировки проводится на кружках и факультативных занятиях.

Обменная сортировка с разделением (сортировка Хоара)

Сортировка методом простого обмена (методом "пузырька") является в среднем самой неэффективной. Это обусловлено самой идеей метода, который требует в процессе сортировки сравнивать и обменивать между собой только соседние элементы. Можно существенно улучшить метод сортировки, основанный на обмене. Это улучшение приводит к самому лучшему на сегодняшний день методу сортировки массивов, который можно назвать обменной сортировкой с разделением. Он основан на сравнениях и обменах элементов, стоящих на возможно больших расстояниях друг от друга. Предложил этот метод Ч. в 1962 году. Поскольку производительность этого метода впечатляюща, автор назвал его "быстрой сортировкой".
Более подробно этот метод рассмотрен в приложении 10.

Сортировка методом слияний

Существует еще один метод сортировки элементов массива, эффективность которого сравнительно велика, - метод слияний.
Перед тем как давать этот метод сортировки, ученикам модно предложить следующую задачу, которая когда-то была олимпиадной, а теперь решается на обычных уроках.:
Причем с минимальным количеством сравнений. На алгоритме этой задачи, которую могут решить сами ученики без подсказки учителя, и построен метод слияния.
Конечно, можно решить задачу, используя метод вставок - каждый элемент массива А разместить на соответствующем ему месте в массиве В. Однако, при этом количество сравнений превысит n+m.
Способ решения задачи изложен в приложении11.

Метод сортировки "слиянием" состоит в разбиении данного массива на несколько частей, которые сортируются по отдельности и впоследствии "сливаются" в одну.

Пусть массив а разбивается на части длиной k, тогда первая часть - a[I], a , . . ., a [k], вто-рая - a, a,..., a и так далее. Если n не делится на k, то в последней части будет менее k элементов.
После того как массивы-части упорядочены, можно объединить их в упорядоченные массивы-части, состоящие не более чем из 2k элементов, которые далее объе-динить в упорядоченные массивы длиной не более 4k, и так далее, пока не получится один упорядоченный массив. Таким образом, чтобы получить отсортированный массив этим методом, нужно многократно " сливать" два упорядоченных отрезка массива в один упорядоченный отрезок. При этом другие части массива не затрагиваются. Более подробно этот метод как факультативный материал рассмотрен в приложении 12.

5. Сравнительная характеристика методов сортировки.

Вспомним один из простых методов - метод подсчета. Поскольку этот метод, несмотря на усовершенствование, требует сравнения всех пар элементов, то продолжительность сортировки массива из n элементов будет пропорциональна n2. Несколько лучшие показатели имеют методы сортировки вставками, обменом и выбором, однако и в них продолжительность работы процедур также пропорциональна n2. Вместе с тем можно показать, что время, затрачиваемое на упорядочивание массива такими методами, как, например, быстрая сортировка или пирамидальная сортировка, пропорционально n log2n, т. е. значительно меньше. Поэтому все рассмотренные методы сортировки подразделяют на простые (n2) и усовершенствованные, или "логарифмические" (n log2n) .
Подробный анализ основных методов сортировки проведен в работах . В качестве показателей для оценки того или иного метода в них используются количество сравнений и количество перемещений элементов в ходе сортировки. Однако эти характеристики не учитывают затрат времени на другие операции, такие, как управление циклами, и др. Очевидно, что критерием для сравнения различных методов является время, затрачиваемое на сортировку. Данные о времени выполнения процедур сортировки получены Н. Виртом .
Конечно, современные компьютеры работают значительно быстрее, чем тогда, когда были проведены расчеты, т. е. данные, приведенные в , устарели. В то же время относительные показатели различных методов в целом не изменились. В приложении 12 представлены относительные характеристики девяти вариантов методов сортировки, полученные на основе результатов, приведенных Н. Виртом.
Приведенные данные демонстрируют явное различие методов: n2 и n log2n. Из таблицы 1 видно, что наилучшим среди простых методов является сортировка вставками, среди усовершенствованных - быстрая сортировка.
Н. Вирт отмечает также следующее:
- "пузырьковая" сортировка является наихудшей среди всех сравниваемых методов. Ее улучшенный вариант - "шейкер" - сортировка - все-таки хуже, чем сортировка простыми вставками и сортировка выбором;
- особенностью быстрой сортировки является то, что она сортирует массив с элементами, расположенными в обратном порядке практически так же, как и отсортированный в прямом порядке.
Следует добавить, что приведенные результаты были получены при сортировке числовых массивов. Если же значением элементов массива являются данные типа "запись", в которых сопутствующие поля (компоненты) занимают в 7 раз больше памяти, чем числовое поле, по которому проводится сортировка, то картина изменится.
В таблице 2 даны сравнительные характеристики методов сортировки массивов данных типа "запись".
Видно, что
1) сортировка выбором дает существенный выигрыш и оказывается лучшим из простых методов;
2) "пузырьковая" сортировка по-прежнему является наихудшим методом;
3) быстрая сортировка даже укрепила свою позицию в качестве самого быстрого метода и оказалась действительно лучшим алгоритмом сортировки.




Top