о дореволюционной орфографии и книге Кони
Oct. 22nd, 2002 06:42 pmВо время вчерашнего визита в библиотеку я нашёл также замечательную книгу: сборник речей Анатолия Фёдоровича Кони, знаменитого русского юриста. Он был издан в 1890-м году, и содержит текст некоторых судебных выступлений Кони в 1868-1888 годы; в основном там обвинительные заключения (15 штук), но есть также несколько указаний присяжным (в качестве председателя суда) и кассационных жалоб.
Читать это исключительно интересно. Я бы хотел хотя бы несколько его речей поместить в дневнике, но это, пожалуй, нереально: они довольно длинные, а у меня нет ни сканера, ни OCR-программ. Да я и не знаю, насколько эти программы хорошо справляются с дореформенной отфографией.
Но кроме самих речей, перед каждой речью в книге есть сжатое описание сути данного дела: ход следствия, показания свидетелей, исход дела и даже в некоторых случаях письма подсудимых или свидетелей, которые использовались в качестве свидетельств во время суда. Я не знаю точно, но предполагаю, что эти сжатые описания написал сам Кони (сборник явно издавался с его ведома, и в нём есть его предисловие); так или иначе, мне они показались столь же интересными, как и сами речи, а в отдельных случаях и более интересными. Каждое описание - словно небольшой рассказ, позволяющий (сейчас будут какие-то дежурные банальности, извините) лучше понять жизнь тогдашнего общества, привычки и характеры каких-то людей.
Хотя бы два-три таких описания дел я хочу поместить в журнале, но тут есть одна техническая сложность. Я очень хочу оставить неизменной орфографию оригинала (дореволюционную). Сделать это не так уж просто. Вместо "десятеричного и" можно использовать латинское i, от него неотличимое. Вместо фиты - греческую тету: Θедор (надеюсь, всем хорошо видно). А вот с ятем есть серьёзная проблема; в Юникоде для него есть, конечно, символ, но, насколько я понимаю, далеко не у всех юзеров установлены фонты, которые его показывают.
Вот несколько разных методов, с помощью которых я могу попробовать изобразить букву ять в дореволюционных текстах; мне хотелось бы получить от читателей дневника информацию о том, какой из них "работает" у всех или почти у всех. И тогда именно его я и использую.
Вот вроде бы и всё. Хотелось бы узнать, что лучше видно, и есть ли какие-то другие варианты, которые я упустил, или какие-то ещё мнения специалистов (только желательно прочитать написанное в комментах к тому времени -- если какая-то реакция уже много раз высказывалась, можно не повторять, наверное).
P.S. Ижицей и прочими очень редкими буквами я считаю возможным пренебречь в этом случае, да.
Читать это исключительно интересно. Я бы хотел хотя бы несколько его речей поместить в дневнике, но это, пожалуй, нереально: они довольно длинные, а у меня нет ни сканера, ни OCR-программ. Да я и не знаю, насколько эти программы хорошо справляются с дореформенной отфографией.
Но кроме самих речей, перед каждой речью в книге есть сжатое описание сути данного дела: ход следствия, показания свидетелей, исход дела и даже в некоторых случаях письма подсудимых или свидетелей, которые использовались в качестве свидетельств во время суда. Я не знаю точно, но предполагаю, что эти сжатые описания написал сам Кони (сборник явно издавался с его ведома, и в нём есть его предисловие); так или иначе, мне они показались столь же интересными, как и сами речи, а в отдельных случаях и более интересными. Каждое описание - словно небольшой рассказ, позволяющий (сейчас будут какие-то дежурные банальности, извините) лучше понять жизнь тогдашнего общества, привычки и характеры каких-то людей.
Хотя бы два-три таких описания дел я хочу поместить в журнале, но тут есть одна техническая сложность. Я очень хочу оставить неизменной орфографию оригинала (дореволюционную). Сделать это не так уж просто. Вместо "десятеричного и" можно использовать латинское i, от него неотличимое. Вместо фиты - греческую тету: Θедор (надеюсь, всем хорошо видно). А вот с ятем есть серьёзная проблема; в Юникоде для него есть, конечно, символ, но, насколько я понимаю, далеко не у всех юзеров установлены фонты, которые его показывают.
Вот несколько разных методов, с помощью которых я могу попробовать изобразить букву ять в дореволюционных текстах; мне хотелось бы получить от читателей дневника информацию о том, какой из них "работает" у всех или почти у всех. И тогда именно его я и использую.
- "настоящая" буква ять в Юникоде; в HTML её пишут так: Ѣ (большая) и ѣ (маленькая); или в десятичной записи Ѣ (большая) и ѣ (маленькая). Вот пример слов с этой буквой, по которому можно проверить, хорошо ли она видна: слова "дело" и "ДЕЛО" строчными и прописными буквами через ять.
дѣло ДѢЛО
(кстати, я читал где-то, уже не помню где, что лучше писать HTML entities в десятичной записи, а не в шестнадцатиричной; если кто-то знает точно, расскажите) - Следующий способ: использовать сербскую букву, похожую на ять, в надежде на то, что она встречается в большем репертуаре фонтов. Вот она в этих словах (Юникодные коды 0x402 и 0x452):
дђло ДЂЛО - ещё один вариант - использовать ту же "похожую" букву, но только в её прописном варианте, т.к. он особенно похож на обычную печатную ять:
дЂло ДЂЛО - ещё один вариант - латинская строчная буква h (несколько похожая на рукописную строчную ять). Этого бы очень не хотелось.
дhло ДhЛО - следующий вариант - картинка вместо каждой буквы. Показывать, как это выглядит, не буду. Самый неприятный для меня с эстетической точки зрения, кроме следующего и последнего.
- Последний вариант - просто использовать "е" вместо яти. Самый нежелательный с моей точки зрения.
Вот вроде бы и всё. Хотелось бы узнать, что лучше видно, и есть ли какие-то другие варианты, которые я упустил, или какие-то ещё мнения специалистов (только желательно прочитать написанное в комментах к тому времени -- если какая-то реакция уже много раз высказывалась, можно не повторять, наверное).
P.S. Ижицей и прочими очень редкими буквами я считаю возможным пренебречь в этом случае, да.
no subject
Date: 2002-10-22 09:55 am (UTC)Еще вариант: <STRIKE>ь</STRIKE> =
ь.no subject
Date: 2002-10-22 09:58 am (UTC)2,3 - в ленте видно, причём 3 вполне красиво. На странице самого постинга - другой шрифт, и всё уже не так красиво.
no subject
Date: 2002-10-22 09:58 am (UTC)Вариант с перечёркнутым мягким знаком интересный, спасибо.
no subject
Date: 2002-10-22 10:03 am (UTC)например... (http://apollon.df.ru/vis6.htm)
OFFTOPIC
Date: 2002-10-22 10:03 am (UTC)зачем так сложно
Date: 2002-10-22 10:04 am (UTC)Re: OFFTOPIC
Made my day :)
no subject
Date: 2002-10-22 10:12 am (UTC)Re: OFFTOPIC
Date: 2002-10-22 10:16 am (UTC)Re: OFFTOPIC
Date: 2002-10-22 10:17 am (UTC)no subject
Date: 2002-10-22 10:18 am (UTC)Кажется, MS Office тоже таскает с собой кучу шрифтов. Но остальным мало радости.
Кони это замечательно.
Браузериада
Date: 2002-10-22 10:19 am (UTC)Вижу всё кроме (1) и кроме варианта alexcohn.
Но:
Мозилла показывает всё без исключения.
Re: зачем так сложно
Date: 2002-10-22 10:22 am (UTC)no subject
Date: 2002-10-22 10:25 am (UTC)IE 6/0, win2K -- вариант 1 квадратиками.
Mozilla 1.1 (Mozilla/5.0 (Windows; U; Windows NT 5.0; en-US; rv:1.1) Gecko/20020826)
под той же win2k -- "ять" отлично видно, но мазила тормозила (похоже, разобралась что в шрифтах выставляемы стайлшитом от /talkpost.bml нужного символа нет, нашла шрифт, где буква есть (это видно по начертанию, да, шрифт другой) и нашла какой-то компромиссный вариант, но на этом нашла какую-то багу у себя внутри, и скрючилась)
Да, в ленте мазилла нарисовала тоже правильно, тоже заменив шрифт, и похоже, тоже с тормозами.
опера, разумеется не смогла, НН4.хх даже и не пробовал
Re: OFFTOPIC
no subject
Date: 2002-10-22 10:28 am (UTC)Re: Браузериада
Date: 2002-10-22 10:32 am (UTC)Re:
Date: 2002-10-22 10:32 am (UTC)Re: зачем так сложно
Opera 6.0.
no subject
Date: 2002-10-22 11:16 am (UTC)А если не секрет - в чем необходимость обязательно поддерживать ять? Много ли случаев смыслового значения, которое теряется без ятя?
Предполагается ли сохранять твердый знак в конце слов?
no subject
Date: 2002-10-22 11:17 am (UTC)no subject
Date: 2002-10-22 11:20 am (UTC)Микрософт, к сожалению, закрыл в августе страничку Microsoft Core Fonts for Web (из-за Линукса, по-видимому). Там было с десяток WGL4 шрифтов плюс описание того с каким офисами браузерами и операционками распространяется та или иная версия того или иного шрифта. Из этих шрифтов ять есть в "Arial Unicode MS" и "Lucida Unicode". Именно на эти шрифты в общем безопасно ссылаться в HTML-е. Как запасной вариант можно использовать пару бесплатных bitstream-овских шрифтов, но они почему-то очень некрасивые. И их надо просить скачивать и устанавливать. Что неуждобно. Видел я в интернете и страничку про это, там еще парочка маленьких бесплатных русских шрифтов лежала.
Что касается браузеров, то в 4-м Нетскейпе на кодовую табличку при отрисовке отводилось 256 символов, поэтому хотя он и поддерживает unicode entities, ять видно не будет. 4-й эксплорер не понимает конструкции "#x". Есть и еще нюансы.
Все что здесь написано более-менее относится и к знаку ударения.
no subject
Date: 2002-10-22 11:25 am (UTC)no subject
Date: 2002-10-22 11:30 am (UTC)Ѣ
или
<span style="font arial или lucida">Ѣ<span>
Re: Браузериада
Date: 2002-10-22 11:39 am (UTC)