avva | два опорных элемента по цене одного

(эта запись будет интересна программистам и сочувствующим)

Владимир Ярославский из Сана придумал новый вариант Квиксорта, работающий быстрее обычного. Основная идея проста до безобразия: вместо одного опорного элемента (pivot) выбираем два, распихиваем элементы в три подмассива: меньше первого опорного, между первым и вторым, и больше второго, и спускаемся рекурсивно три раза вместо обычных двух.

Трудно представить, что эта идея до сих пор никому не приходила в голову. И тем не менее, может, это так и есть, и тогда это - прекрасный, особенно убедительный пример "очевидности задним умом". Но может быть и по-другому: многие об этом думали, но никто не доводил дело до серьезного анализа.

Автор алгоритма доказывает, путем довольно сложных и скучных выкладок, которые я не проверял, что его Dual-Pivot Quicksort теоретически должен быть быстрее обычного Quicksort в следующем смысле: он делает - на типичных входных данных - примерно столько же сравнений (comparisons), но на 20% меньше обменов элементами (swaps). Его практические измерения подверждают теорию. Интересно, что он специально упоминает, что не может предоставить простое объяснение, почему это так, т.е. почему два опорных элемента должны быть лучше одного. В чем-то лучше, в чем-то хуже, разные факторы балансируют друг против друга и в итоге - согласно Ярославскому - два опорных выигрывают, но простой картинки нет.

P.S. Обнаружилась заявка на патент 2005-го года, "Multiple Pivot Sorting Algorithm". Основная идея та же, но опорных точек там выбирают много (от 3 до 7), и их надо в свою очередь сортировать между собой. Раскладка элементов по подмассивам требует сравнения каждого элемента со всеми опорными меньше его. Мне это кажется довольно дорогим удовольствием: требует намного больше сравнений, чем в теоретически оптимальном двоичном поиске среди отсортированных опорных элементов, каковой реализовать в данном случае невозможно без дополнительного копирования подмассивов. Поэтому мне кажется маловероятным, что этот алгоритм с большим числом опорных точек лучше алгоритма Ярославского; а в частном случае двух опорных точек он точно хуже его. Но никаких проверок я не запускал.

Flat | Top-Level Comments Only

(deleted comment)

From:

lykac.livejournal.com

http://ru.wikipedia.org/wiki/Quicksort

From:

deadkittten.livejournal.com

Возможно тут дело аналогично многоленточной сортировке -- увеличение числа лент увеличивает один вид затрат, уменьшение -- другой. И основной вопрос, какое соотношение окажется оптимальным...

From:

doktor-gradus.livejournal.com

Тогда, очевидно, нужно каким-то образом оценивать входную выборку на предмет выбора оптимального алгоритма сортировки. Хмм...

From: (Anonymous)

Сравнивать теперь надо не с одним опорным элементом, а с двумя, то есть количество сравнений на один проход проход получается в среднем в полтора раза больше, чем в классическом алгоритме. Почему общее число сравнений в конечном итоге будет таким же, а не в 1.5 раза больше? Неочевидно ;)

From:

avva.livejournal.com

Потому что уровней рекурсии меньше. На каждом уровне рекурсии мы сравниваем (игнорируя мелкие оптимизации) каждый элемент с опорным в классическом алгоритме, или, как вы верно заметили, в полтора раза больше в новом. Но в классическом число уровней рекурсии равно логарифму по основанию 2 от начального размера, а в новом логарифму по основанию 3. С трудом вспомнив формулы из старших классов школы ;), заметим, что log_2(x)/log_3(x) = log_2(3) = примерно 1.58, что довольно близко к 1.5...

(...)

два опорных элемента по цене одного

Page Summary

Style Credit

Expand Cut Tags