avva: (Default)
[personal profile] avva
Читал главный юникодный файл. Много думал.

Date: 2004-08-30 06:21 am (UTC)
From: [identity profile] gosha.livejournal.com
Поневоле заставляет задуматься...

Date: 2004-08-30 06:24 am (UTC)
From: [identity profile] b0rg.livejournal.com
Революцию будем устраивать, или пока подождем? :)

Date: 2004-08-30 06:52 am (UTC)
From: [identity profile] tlkh.livejournal.com
У меня есть этот файл с картинками, изданный в виде книги.
Не знаю как насчет думать, но убить этой книгой легко.

Date: 2004-08-30 08:16 am (UTC)
From: [identity profile] rukenau.livejournal.com
Мне вот это больше всего понравилось:

4DC0;HEXAGRAM FOR THE CREATIVE HEAVEN;So;0;ON;;;;;N;;;;;
4DC1;HEXAGRAM FOR THE RECEPTIVE EARTH;So;0;ON;;;;;N;;;;;
4DC2;HEXAGRAM FOR DIFFICULTY AT THE BEGINNING;So;0;ON;;;;;N;;;;;
4DC3;HEXAGRAM FOR YOUTHFUL FOLLY;So;0;ON;;;;;N;;;;;
4DC4;HEXAGRAM FOR WAITING;So;0;ON;;;;;N;;;;;
4DC5;HEXAGRAM FOR CONFLICT;So;0;ON;;;;;N;;;;;
4DC6;HEXAGRAM FOR THE ARMY;So;0;ON;;;;;N;;;;;
4DC7;HEXAGRAM FOR HOLDING TOGETHER;So;0;ON;;;;;N;;;;;
4DC8;HEXAGRAM FOR SMALL TAMING;So;0;ON;;;;;N;;;;;
4DC9;HEXAGRAM FOR TREADING;So;0;ON;;;;;N;;;;;
4DCA;HEXAGRAM FOR PEACE;So;0;ON;;;;;N;;;;;
4DCB;HEXAGRAM FOR STANDSTILL;So;0;ON;;;;;N;;;;;
etc.

А вообще-то, из каких компонентов состоят эти строки? Можно ли первый код (4DC7, например) перевести в HTML-форму?

Date: 2004-08-30 08:32 am (UTC)
From: [identity profile] rukenau.livejournal.com
А, уже дошло, кажется. Можно записать в форме &#x + hex;, а можно в форме &# + decimal;. Если я правильно понимаю, конечно.

Date: 2004-08-30 08:52 am (UTC)
From: [identity profile] avva.livejournal.com
Ага.

Date: 2004-08-30 08:22 am (UTC)
From: [identity profile] liveuser.livejournal.com
Увидел много LOL и CooL. :-)
Больше ничего не понял.

Date: 2004-08-30 12:04 pm (UTC)
From: [identity profile] maravan.livejournal.com
Хочется переформулировать:
Читал главный юникодный файл. Хорошо!

Date: 2004-08-30 01:30 pm (UTC)
From: [identity profile] moon-aka-sun.livejournal.com
Тогда уж так:
Читал главный юникодный файл. Нассал под креслом.

Date: 2004-08-30 02:11 pm (UTC)
From: [identity profile] avva.livejournal.com
Можно и так, да ;)

Date: 2004-08-30 05:04 pm (UTC)
From: [identity profile] averros.livejournal.com
...держу талмуд Unicode 3.0 дома на книжной полке...

На самом деле, Unicod - довольно бредовая идея. Просто потому что кроме рисования текста на экране или листе бумаги с ним ещё нужно уметь как-то работать. Например, сравнивать строки игнорируя case или не-обязательную диакритику. Или сортировать по алфавиту, не обязательно в совсем "каноническом" порядке (которым всё равно никто уже давно не пользуется - см. правила сравнения строк во французском). Или, наконец, просто делать spell checking.

Всё это можно делать в Unicode только если известен язык, на котором написан текст. А если известен язык, то на кой чёрт нужно иметь уникальные code points для глифов? У каждого языка они всё равно свои - и во многих случаях многобайтовая кодировка нафиг не нужна. Как кодировка, Unicode - избыточен, но при этом не несёт в себе действительно полезной информации (а именно - код языка, а не алфавита).

Да, а для того, чтобы был известен язык, Unicode приходится окружать какой-либо лабудой вроде locale или rich text format. Просто текст на Unicode можно только изобразить.

Я когда-то пытался эти простые мысли донести до творцов стандарта, но был послан нафиг на основании того, что "мы же проделали большую работу, и теперь не можем ничего поменять". Сподвигнули меня на написание бумажек по поводу более разумной альтернативы.

Но, поскольку я тварь крайне ленивая, да и работы хватает, оно так в воздухе и повисло. Если кому интересно: Rosetta encoding (http://www.kotovnik.com/~avg/rosetta).

Date: 2004-08-30 10:17 pm (UTC)
From: [identity profile] ypq.livejournal.com
предупреждать надо, что там 900 кил! :)

December 2025

S M T W T F S
  123 4 56
78 9 10 11 1213
1415 1617181920
21 22 23 24 2526 27
2829 30 31   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 1st, 2026 09:54 pm
Powered by Dreamwidth Studios