avva | задача математическая, часть 3-я

Решение задачи, предложенной вчера.

Итак, пусть у нас есть алфавит из k символов; мы хотим доказать, что существует максимальная длина хорошей строки над этим алфавитом.

Предположим обратное: нет такой максимальной длины, то есть существуют сколь угодно длинные хорошие строки. Иными словами (ввиду конечности алфавита это одно и то же), существует бесконечно много хороших строк. Покажем вначале, что из этого следует существование хорошей строки бесконечной длины; т.е. строки x₁x₂...x_n... бесконечной длины, такой, что в ней ни одна под-строка вида x_i...x_2*i не является под-последовательностью другой под-строки такого вида.

Как мы это покажем? Мы построим эту строку бесконечной длины по индукции следующим образом.

Начнём с пустой строки. Выберем такой символ x₁ из нашего алфавита, что существует бесконечно много хороших строк, начинающихся с x₁. Такой символ x₁ обязан существовать, т.к. если бы его не было и для всех символов x из алфавита существовало бы только конечное кол-во хороших строк, начинающихся с x, то и вообще всего хороших строк было бы конечное кол-во (заметим, что в этом месте мы используем тот факт, что наш алфавит конечного размера), а это противоречит нашему первоначальному допущению. Поэтому такой символ x₁ имеется; если есть несколько, отвечающих этому условию, выберем любой из них.

Далее, выберем такой символ x₂, что существует бесконечное кол-во хороших строк, начинающихся с x₁x₂; опять-таки мы можем это сделать, т.к. в противном случае, суммируя кол-во хороших строк, начинающихся с x₁x для всех x в алфавите, мы получили бы конечное кол-во хороших строк, начинающихся с x₁, что противоречит выбору x₁.

Далее, выбираем x₃ так, что существует бесконечное кол-во хороших строк, начинающихся с x₁x₂x₃... и так далее по индукции. В общем случае выбираем x_n так, что существует бесконечное кол-во хороших строк, начинающихся с x₁x₂...x_n-1x_n.

Таким образом мы получаем строку бесконечной длины x₁x₂...x_n... . Более того, это - хорошая строка. Действительно, если есть какие-то под-строки вида x_i...x_2*i и x_j...x_2*j, то выберем какой-то n больше, чем 2*i и 2*j; тогда согласно построению, есть бесконечно много хороших строк, начинающихся с x₁x₂...x_n, значит, есть хотя бы одна; и из этого следует, что внутри этой строки x_i...x_2*i не является под-последовательностью x_j...x_2*j; значит, и в нашей бесконечной строке это так.

Итак, у нас есть бесконечная хорошая строка. Осталось доказать, что это невозможно, и мы получим желаемое противоречие. Для этого, однако, необходимо от рассмотрения последовательностей символов перейти к рассмотрению последовательностей строк символов.

Расставим символы из нашей строки в виде следующей бесконечной последовательности:

x₁x₂
x₂...x₄
x₃...x₆
x₄...x₈
x₅...x₁₀
...
x_n...x_2*n
...

Мы получили бесконечный ряд строк, причём ни одна строка в этом ряду не является под-последовательностью более поздней строки. (это как раз и есть условие "хорошести", которое мы доказали). Теперь докажем отдельно лемму, которая показывается, что такая ситуация невозможна, и на этом наше доказательство будет окончено.

Лемма: не существует бесконечной последовательности строк y₁,y₂,... над алфавитом из k символов, такой, что в ней для любых i<j строка y_i не является под-последовательностью строки y_j.

Доказательство леммы: Назовём свойство, которое отрицает лемма, "удобностью" последовательности: последовательность строк "удобна", если ни одна строка в ней не является под-последовательностью более поздней строки.

Предположим обратное тому, что хотим доказать: предположим, что существует хотя бы одна бесконечная "удобная" последовательность строк. Тогда выберем из всех таких последовательностей какую-нибудь одну с минимальной возможной длиной первой строки. Пусть первая строка в ней будет какая-то y₁. Теперь из всех возможных "удобных" последовательностей, начинающихся с y₁ (а есть хотя бы одна такая), выберем одну с минимальной возможной длиной второй строки, и пусть эта вторая строка будет y₂. Затем... и так далее по индукции мы строим последовательность y₁,y₁,...y_n... , которая минимальна в том смысле, что каждый y_i был выбран в качестве элемента минимальной длины из всех, которые могут продолжить, не нарушая "удобства", уже выбранные y₁...y_i-1.

Легко видеть, что полученная таким образом "минимальная" последовательность y₁,y₂,...y_n... в свою очередь "удобна": ни одна y_i не является под-последовательностью y_j при i<j, т.к. существуют "удобные" последовательности, начинающиеся с y₁...y_j (что напрямую следует из выбора y_j во время построения).

Далее, ясно из определения, что любая под-последовательность "удобной" последовательности в свою очередь "удобна". Возьмём нашу последовательность y₁,y₂... и найдём в ней бесконечную под-последовательность строк, начинающихся на один и тот же символ. Это всегда возможно, т.к. не может быть, чтобы из всего бесконечного кол-ва строк последовательности на каждый из k символов начиналось только конечное кол-во строк. Пусть тот одинаковый символ, с которого они все начинаются, будет какой-то x, а сама бесконечная под-последовательность пусть будет y_{i_1},y_{i_2},...,y_{i_n},... Она расположена "внутри" нашей минимальной последовательности, начиная с какого-то индекса i_1, и вовсе необязательно "подряд".

Эта под-последовательность в свою очередь "удобна". Каждый y_{i_n} можно записать в виде xy'_{i_n}, т.е. начального символа x и остатка y' . Если мы теперь отбросим начальные символы сразу у всех членов под-последовательности, то получим
y'_{i_1},y'_{i_2},...,y'_{i_n},... ,
и эта последовательность тоже будет "удобной" (действительно, если бы в ней какая-то строка была под-последовательностью более поздней строки, то при восстановлении начальных x-ов это свойство сохранилось бы).

Теперь посмотрим на ряд
y₁,y₂,...,y_{i_1-1},y'_{i_1},y'_{i_2},.....

Иными словами, сначала мы ставим в него все строки из нашей "минимальной" последовательности вплоть до первой строки нашей под-последовательности, в которой все строки начинаются с одного символа; а потом мы продолжаем вставлять все члены этой под-последовательности, только уже с удалённым первым символом x, и так до бесконечности (при этом все y_n, которые были в "минимальной" последовательности между членами под-последовательности, не попадая в неё, мы просто забываем).

Этот ряд, в свою очередь, "удобен". Как это доказать? Начиная с члена y'_{i_1}, он полностью повторяет нашу "укороченную" под-последовательность, к-я, как мы показали, удобна. Значит, надо показать только, что ни один из членов рядa y₁...y_{i_1-1} не является под-последовательностью более позднего; но если бы это было так, если бы какая-то y_i была под-последовательностью какой-то y', это свойство сохранилось бы и при восстановлении удалённого первого x в такой строке y', и тогда "неудобной" была бы и первоначальная "минимальная" последовательность -- противоречие.

Итак, этот ряд "удобен". Но его член y'_{i_1} на единицу меньше по длине, чем y_{i_1} (т.к. в нём удалён первый символ x); в то же время мы выбрали y_{i_1} так, чтобы он был минимален по длине из всех возможных продолжений y₁...y_{i_1-1}, приводящих к "удобным" рядам. Мы получаем противоречие минимальности длины y_{i_1}, следовательно наше первоначальное предположение о существовании "удобных" рядов неверно, что и требовалось доказать.

Flat | Top-Level Comments Only

From:

khatul.livejournal.com

Зачем на глаз? Программочку, программочку. Причем используя удивительные возможности языка Перл. Например, если n<=10, мы можем использовать такой критерий для того, является ли одна последовательность подпоследовательностью другой в том смысле, в котором это указано в задаче:

sub IsSubSeq
{
local $first = join('.*',@{shift @_});
local $second = join('',@{shift @_});
return 1 if $second =~ $first;
return 0;
}

Если n>10 (правда, мощности моего компа и на троечку не хватает), можно сделать такой трюк:

sub Pad
{
return "x".join('xx',@_)."x";
}

sub SubPad
{
return "x".join('x.*x',@_)."x";
}

sub IsSubSeq
{
local $first = &SubPad(@{shift @_});
local $second = &Pad(@{shift @_});
return 1 if $second =~ $first;
return 0;
}

И хоть мульон символов в алфавите - все едино.

Дальше - как нам узнать, "хороша" ли строка? (Внимание - эта функция НЕ будет использована, я ее привожу только для объяснения образа мышления):

sub IsGood
{
local $Seq = shift @_;
foreach $i (0..((scalar @$Seq)/2 - 2))
{
local @inner = @$Seq[$i..(2*$i + 1)];
foreach $j (($i+1)..((scalar @$Seq)/2 - 1))
{
local @outer = @$Seq[$j..(2*$j + 1)];
return 0 if &IsSubSeq(\@inner,\@outer);
}
}
return 1;
}

Но нам-то надо не выяснить, какая строка хорошая. Нам надо ПОСТРОИТЬ хорошую строку максимального размера. Поэтому мы будем ДОСТРАИВАТЬ строку, удлиняя ее на ДВА новых элемента, и проверять только, ОСТАЁТСЯ ли она хорошей, т.е. не включена ли одна из последовательностей в НОВУЮ подпоследовательность. Это делается так:

sub IsStillGood
{
local $Seq = shift @_;
local $j = (scalar @$Seq)/2 - 1;
local @outer = @$Seq[$j..(2*$j + 1)];
foreach $i (0..((scalar @$Seq)/2 - 2))
{
local @inner = @$Seq[$i..(2*$i + 1)];
return 0 if &IsSubSeq(\@inner,\@outer);
}
return 1;
}

Теперь мы можем спокойно допустить, что ПЕРВЫЙ элемент строки - 0 (ясно). Второй может быть любым, и каждый раз мы попробуем достроить строку до максимальной.

sub FindMax
{
local $n = shift @_;
local $MaxLength = 2;
local @sequence = (0); # FIRST element can be preset as 0 - automorphism!
foreach $second (0..($n-1)) # SECOND element
{
push (@sequence,$second); # NOW we start!
&MaxCont;
pop @sequence;
}
return $MaxLength;
}

Здесь @sequence и $MaxLength передаются через область определения в функцию MaxCont, которая попытается продолжить последовательность рекурсивно, следующим макаром:

sub MaxCont
{
foreach $odd (0..($n-1))
{
push (@sequence,$odd);
foreach $even (0..($n-1))
{
push (@sequence,$even);
if (&IsStillGood(\@sequence))
{
if ((scalar @sequence) > $MaxLength)
{
$MaxLength = scalar @sequence;
}
&MaxCont;
}
pop @sequence;
}
pop @sequence;
}
}

Разумеется, тут стОит порассыпать разные print-ы, а то компутер молчать будет часами - уж слишком это сложно: проверять вложенность подпоследовательности длиной 15 в подпоследовательность длиной 30...

И, наконец, "мэйн" может выглядеть так:

print "Enter n: ";
$n = <>;
chomp $n;
print "\n\nA($n) = ",1+&FindMax($n),"\n";

Почему "1 плюс"? Потому что ясно, что мы можем удлинить нашу ЧЁТНУЮ последовательность на один элемент без вреда для "хорошести".

* * *

...Так чему же равно А(3)? Пока не знаю, потому что два компа (виндовый и линукс), которые я запустил под это, еще пашут. Застряли оба после 74, так что А(3) явно не меньше 75.

Хорошая последовательность размером 75 выглядит так:

0,0,1,1,0,1,2,2,2,2,
0,2,2,2,2,2,2,2,1,2,
2,2,1,1,1,1,1,1,1,1,
1,1,1,1,1,0,2,2,2,2,
2,2,2,2,2,2,2,2,2,2,
2,2,2,2,2,2,2,2,2,2,
2,2,2,2,2,2,2,2,2,1,
2,2,0,1, кто угодно.

С уважением.

---
PS: оффтопик - загляни вот сюда: The Catherine Jones Memoirs. К тебе имеет отношение... :)

From:

avva.livejournal.com

Спасибо, это всё здорово и наглядно ;) Твой lower bound для А(3) чуть меньше настоящего, но я его пока не буду раскрывать, пока не напишу длинный постинг на всю эту тему.

From:

khatul.livejournal.com

Нда. Сообразил, что, может, и здорово-наглядно, только не оптимально. Я исключил один тип автоморфизмов, начиная всегда с нуля, но ведь могут быть автоморфизмы от любого подмножества букв!

Решение: вместо цикла в FindMax делаем только проверку на 00 и 01 (второй элемент, если есть, всегда 1), а вместо цикла в MaxCont делаем так: в FindMax заводим еще список @alphabet, и дополняем его новым элементом только тогда, когда нужно, и только тогда, когда scalar @alphabet < $n . Еще для полного благолепия надо ВЫТАСКИВАТЬ из @alphabet элементы там, где в результате серии pop @sequence -ов они исчезают вообще из последовательности. Тогда сократится время поиска - причем не как-нибудь, а в (n!/2) раз по сравнению с кодом, к-рый я привел. Вона как. (Для многострадальной тройки - соответственно, еще в 3 раза сокращает вычисления.

______
Опять оффтопик: ты было собрался недельные главы комментировать... и как? :)
Я-то свои продолжаю выдавать там, где обычно: http://kor.mk.ru/yeshiva

From:

avva.livejournal.com

Так ты нашёл lower bound для трёх? ;-)

Недельные главы: всё ещё очень хочу, просто рутина заела. Собираюсь к следующим выходным начать.

From:

khatul.livejournal.com

Пока юникс обогнал винды и нашел мне хорошую строку размером 79 (и пашет дальше).

Вот она:

0,0,1,1,0,1,2,2,2,2,
0,2,2,2,2,2,2,2,1,2,
2,2,1,1,1,1,1,1,1,1,
1,1,1,1,1,0,2,2,2,2,
2,2,2,2,2,2,2,2,2,2,
2,2,2,2,2,2,2,2,2,2,
2,2,2,2,2,2,2,2,2,1,
2,2,1,1,1,0,2,2, что угодно.

Интуиция, впрочем, говорит мне, что настоящее значение намного больше. (Наверное, это даже доказуемо на бумаге).

А комментарий - интересно было бы твой комментарий как раз к "Берешит" и "Ноах" увидеть.