о дореволюционной орфографии и книге Кони
Oct. 22nd, 2002 06:42 pmВо время вчерашнего визита в библиотеку я нашёл также замечательную книгу: сборник речей Анатолия Фёдоровича Кони, знаменитого русского юриста. Он был издан в 1890-м году, и содержит текст некоторых судебных выступлений Кони в 1868-1888 годы; в основном там обвинительные заключения (15 штук), но есть также несколько указаний присяжным (в качестве председателя суда) и кассационных жалоб.
Читать это исключительно интересно. Я бы хотел хотя бы несколько его речей поместить в дневнике, но это, пожалуй, нереально: они довольно длинные, а у меня нет ни сканера, ни OCR-программ. Да я и не знаю, насколько эти программы хорошо справляются с дореформенной отфографией.
Но кроме самих речей, перед каждой речью в книге есть сжатое описание сути данного дела: ход следствия, показания свидетелей, исход дела и даже в некоторых случаях письма подсудимых или свидетелей, которые использовались в качестве свидетельств во время суда. Я не знаю точно, но предполагаю, что эти сжатые описания написал сам Кони (сборник явно издавался с его ведома, и в нём есть его предисловие); так или иначе, мне они показались столь же интересными, как и сами речи, а в отдельных случаях и более интересными. Каждое описание - словно небольшой рассказ, позволяющий (сейчас будут какие-то дежурные банальности, извините) лучше понять жизнь тогдашнего общества, привычки и характеры каких-то людей.
Хотя бы два-три таких описания дел я хочу поместить в журнале, но тут есть одна техническая сложность. Я очень хочу оставить неизменной орфографию оригинала (дореволюционную). Сделать это не так уж просто. Вместо "десятеричного и" можно использовать латинское i, от него неотличимое. Вместо фиты - греческую тету: Θедор (надеюсь, всем хорошо видно). А вот с ятем есть серьёзная проблема; в Юникоде для него есть, конечно, символ, но, насколько я понимаю, далеко не у всех юзеров установлены фонты, которые его показывают.
Вот несколько разных методов, с помощью которых я могу попробовать изобразить букву ять в дореволюционных текстах; мне хотелось бы получить от читателей дневника информацию о том, какой из них "работает" у всех или почти у всех. И тогда именно его я и использую.
Вот вроде бы и всё. Хотелось бы узнать, что лучше видно, и есть ли какие-то другие варианты, которые я упустил, или какие-то ещё мнения специалистов (только желательно прочитать написанное в комментах к тому времени -- если какая-то реакция уже много раз высказывалась, можно не повторять, наверное).
P.S. Ижицей и прочими очень редкими буквами я считаю возможным пренебречь в этом случае, да.
Читать это исключительно интересно. Я бы хотел хотя бы несколько его речей поместить в дневнике, но это, пожалуй, нереально: они довольно длинные, а у меня нет ни сканера, ни OCR-программ. Да я и не знаю, насколько эти программы хорошо справляются с дореформенной отфографией.
Но кроме самих речей, перед каждой речью в книге есть сжатое описание сути данного дела: ход следствия, показания свидетелей, исход дела и даже в некоторых случаях письма подсудимых или свидетелей, которые использовались в качестве свидетельств во время суда. Я не знаю точно, но предполагаю, что эти сжатые описания написал сам Кони (сборник явно издавался с его ведома, и в нём есть его предисловие); так или иначе, мне они показались столь же интересными, как и сами речи, а в отдельных случаях и более интересными. Каждое описание - словно небольшой рассказ, позволяющий (сейчас будут какие-то дежурные банальности, извините) лучше понять жизнь тогдашнего общества, привычки и характеры каких-то людей.
Хотя бы два-три таких описания дел я хочу поместить в журнале, но тут есть одна техническая сложность. Я очень хочу оставить неизменной орфографию оригинала (дореволюционную). Сделать это не так уж просто. Вместо "десятеричного и" можно использовать латинское i, от него неотличимое. Вместо фиты - греческую тету: Θедор (надеюсь, всем хорошо видно). А вот с ятем есть серьёзная проблема; в Юникоде для него есть, конечно, символ, но, насколько я понимаю, далеко не у всех юзеров установлены фонты, которые его показывают.
Вот несколько разных методов, с помощью которых я могу попробовать изобразить букву ять в дореволюционных текстах; мне хотелось бы получить от читателей дневника информацию о том, какой из них "работает" у всех или почти у всех. И тогда именно его я и использую.
- "настоящая" буква ять в Юникоде; в HTML её пишут так: Ѣ (большая) и ѣ (маленькая); или в десятичной записи Ѣ (большая) и ѣ (маленькая). Вот пример слов с этой буквой, по которому можно проверить, хорошо ли она видна: слова "дело" и "ДЕЛО" строчными и прописными буквами через ять.
дѣло ДѢЛО
(кстати, я читал где-то, уже не помню где, что лучше писать HTML entities в десятичной записи, а не в шестнадцатиричной; если кто-то знает точно, расскажите) - Следующий способ: использовать сербскую букву, похожую на ять, в надежде на то, что она встречается в большем репертуаре фонтов. Вот она в этих словах (Юникодные коды 0x402 и 0x452):
дђло ДЂЛО - ещё один вариант - использовать ту же "похожую" букву, но только в её прописном варианте, т.к. он особенно похож на обычную печатную ять:
дЂло ДЂЛО - ещё один вариант - латинская строчная буква h (несколько похожая на рукописную строчную ять). Этого бы очень не хотелось.
дhло ДhЛО - следующий вариант - картинка вместо каждой буквы. Показывать, как это выглядит, не буду. Самый неприятный для меня с эстетической точки зрения, кроме следующего и последнего.
- Последний вариант - просто использовать "е" вместо яти. Самый нежелательный с моей точки зрения.
Вот вроде бы и всё. Хотелось бы узнать, что лучше видно, и есть ли какие-то другие варианты, которые я упустил, или какие-то ещё мнения специалистов (только желательно прочитать написанное в комментах к тому времени -- если какая-то реакция уже много раз высказывалась, можно не повторять, наверное).
P.S. Ижицей и прочими очень редкими буквами я считаю возможным пренебречь в этом случае, да.
no subject
Date: 2002-10-22 09:55 am (UTC)Еще вариант: <STRIKE>ь</STRIKE> =
ь.no subject
Date: 2002-10-22 09:58 am (UTC)Вариант с перечёркнутым мягким знаком интересный, спасибо.
(no subject)
From:no subject
Date: 2002-10-22 09:58 am (UTC)2,3 - в ленте видно, причём 3 вполне красиво. На странице самого постинга - другой шрифт, и всё уже не так красиво.
no subject
Date: 2002-10-22 10:03 am (UTC)например... (http://apollon.df.ru/vis6.htm)
Re:
Date: 2002-10-22 03:52 pm (UTC)Но как-то у меня ну очень душа не лежит к запихиванию такого кол-ва картинок, по картинке вместо каждой буквы. Эстетическое неприятие, не очень рациональное.
спасибо :)
From:OFFTOPIC
Date: 2002-10-22 10:03 am (UTC)Re: OFFTOPIC
Made my day :)
Re: OFFTOPIC
Date: 2002-10-22 10:16 am (UTC)Re: OFFTOPIC
From:Re: OFFTOPIC
From:зачем так сложно
Date: 2002-10-22 10:04 am (UTC)Re: зачем так сложно
Date: 2002-10-22 10:22 am (UTC)Re: зачем так сложно
From:Re: зачем так сложно
From:no subject
Date: 2002-10-22 10:12 am (UTC)Браузериада
Date: 2002-10-22 10:19 am (UTC)Вижу всё кроме (1) и кроме варианта alexcohn.
Но:
Мозилла показывает всё без исключения.
Re: Браузериада
Date: 2002-10-22 10:32 am (UTC)Re: Браузериада
From:Re: Браузериада
From:Re: Браузериада
From:Re: Браузериада
From:Re: Браузериада
From:no subject
Date: 2002-10-22 10:25 am (UTC)IE 6/0, win2K -- вариант 1 квадратиками.
Mozilla 1.1 (Mozilla/5.0 (Windows; U; Windows NT 5.0; en-US; rv:1.1) Gecko/20020826)
под той же win2k -- "ять" отлично видно, но мазила тормозила (похоже, разобралась что в шрифтах выставляемы стайлшитом от /talkpost.bml нужного символа нет, нашла шрифт, где буква есть (это видно по начертанию, да, шрифт другой) и нашла какой-то компромиссный вариант, но на этом нашла какую-то багу у себя внутри, и скрючилась)
Да, в ленте мазилла нарисовала тоже правильно, тоже заменив шрифт, и похоже, тоже с тормозами.
опера, разумеется не смогла, НН4.хх даже и не пробовал
Re:
Date: 2002-10-22 03:51 pm (UTC)no subject
Date: 2002-10-22 10:28 am (UTC)Re:
Date: 2002-10-22 10:32 am (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2002-10-22 11:16 am (UTC)А если не секрет - в чем необходимость обязательно поддерживать ять? Много ли случаев смыслового значения, которое теряется без ятя?
Предполагается ли сохранять твердый знак в конце слов?
Re:
Date: 2002-10-22 02:23 pm (UTC)Надеюсь, что не будет слишком тяжело читать тем, кто не привык, текст-то хороший.
(no subject)
From:Re:
From:no subject
Date: 2002-10-22 11:17 am (UTC)Re:
Date: 2002-10-22 03:47 pm (UTC)(no subject)
From:no subject
Date: 2002-10-22 11:20 am (UTC)Микрософт, к сожалению, закрыл в августе страничку Microsoft Core Fonts for Web (из-за Линукса, по-видимому). Там было с десяток WGL4 шрифтов плюс описание того с каким офисами браузерами и операционками распространяется та или иная версия того или иного шрифта. Из этих шрифтов ять есть в "Arial Unicode MS" и "Lucida Unicode". Именно на эти шрифты в общем безопасно ссылаться в HTML-е. Как запасной вариант можно использовать пару бесплатных bitstream-овских шрифтов, но они почему-то очень некрасивые. И их надо просить скачивать и устанавливать. Что неуждобно. Видел я в интернете и страничку про это, там еще парочка маленьких бесплатных русских шрифтов лежала.
Что касается браузеров, то в 4-м Нетскейпе на кодовую табличку при отрисовке отводилось 256 символов, поэтому хотя он и поддерживает unicode entities, ять видно не будет. 4-й эксплорер не понимает конструкции "#x". Есть и еще нюансы.
Все что здесь написано более-менее относится и к знаку ударения.
no subject
Date: 2002-10-22 11:25 am (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2002-10-22 12:51 pm (UTC)no subject
Я думаю, можно спокойно использовать белорусское/украинское і (U+0456), так как если русский отоброжается нормально, то в 99.9% эта буква тоже показывается нормально. Так, имхо, правильнее.
Re:
Date: 2002-10-22 03:46 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2002-10-22 01:04 pm (UTC)И, как видите, сжат в exe-файл, т.е. запустить его можно только из-под Windows (или, возможно, через wine в Linux'е, не пробовал). Ну, короче, я его поставил.
http://zsigri.tripod.com/fontboard/cjk/cjksupp.html
Microsoft no longer offers it for download but you can still get it from the following sites: list enclosed.
Кроме того, бывают специальные шрифты с древнерусскими буквами, они как раз небольшие. Но нормального юникодова шрифта небольшого размера и с дореформенными буквами я не знаю.
Короче, рассчитывать на юникод, пожалуй, пока не стоит.
no subject
Date: 2002-10-23 02:55 am (UTC)Я тут как раз выясняю, как на моих юниксных машинах поставить TTF шрифты. Оказалось, что это скорее .cab, чем .exe, и распаковать его можно программой cabextract (http://www.kyz.uklinux.net/cabextract.php3) без всякого wine
(no subject)
From:Re:
From:no subject
Date: 2002-10-22 01:17 pm (UTC)Re:
Date: 2002-10-22 03:34 pm (UTC)no subject
Date: 2002-10-22 01:24 pm (UTC)Re:
Date: 2002-10-22 03:35 pm (UTC)(no subject)
From:no subject
Date: 2002-10-22 02:41 pm (UTC)no subject
Date: 2002-10-22 03:23 pm (UTC)Re:
Date: 2002-10-22 03:33 pm (UTC)no subject
Date: 2002-10-22 11:56 pm (UTC)Сообщение по делу: под Windows 2000 в Мозилле 1.1 видны все варианты, в MSIE 6 не работает "честный" вариант 1. Полностью предсказуемый вариант. Что касается варианта с явно указанным шрифтом (http://www.livejournal.com/talkread.bml?journal=avva&itemid=481206), он работает и там, и там.
Немного мыслей off-topic. Возможно, мой подход слишком программистский, однако я считаю правильным: (а) в "плане содержания" пользоваться только "честными" юникодовскими символами (в данном случае ятями U0462 и U0463); (б) в "плане выражения" пользоваться всеми доступными средствами для облегчения участи читателей, не вооружённых инструментами с полноценной поддержкой Юникода (в данном случае явным указанием шрифта). Насколько я понимаю, Вашей целью является публикация текста именно в оригинальной орфографии, а ни один из паллиативных вариантов эту задачу не решает (не говоря уже о картинках, даже вариант с сербским алфавитом не проходит, ибо Кони не использовал сербский алфавит). Юникод (в виде соответствующего стандарта ISO/IEC) с нами всерьёз и надолго, так что, с моей точки зрения, надо работать на перспективу.
Резюме: я бы рекомендовал вариант с "честными" ятями и явным указанием Unicode-enabled шрифта.
Кстати, вот Вам пример неудачного решения подобной проблемы (http://www.bible-center.ru/bibletext?cont=oldslav&txt=ge+1). Товарищи пошли по радикально "нестандартному" (в смысле несоответствия стандартам) пути, поставив себе целью оптимизировать отображение текста в конкретном браузере (разумеется, MSIE). В результате их текст не отображается в других браузерах (кстати, более "соответствующих") и не может быть использован в мирных целях путём "copy-paste" или "save as".
no subject
Date: 2002-10-23 12:03 am (UTC)(no subject)
From:Re:
From:no subject
Date: 2006-06-08 11:08 am (UTC)Но предложу еще один вариант имитации (для строчных букв):
вотъ такое дbло
внутри большого текста смотрится вполне ничего