avva | о джаве

Джава - это не язык, а тенденция. На любом языке можно писать на Джаве. Можно писать на C++ на Джаве и даже на Питоне на Джаве.

Вот так, например, пишут на Джаваскрипте на Джаве. Это из библиотеки Closure Library, одно время главного фреймворка, в котором писали на джаваскрипте в Гугле (сейчас выбор намного больше: есть Angular, Polymer, используют и другие библиотеки, не написанные в Гугле).

Если вы пишете на Джаве, то довольно тяжело не писать на Джаве - сам язык это вроде бы и позволяет, но сложившаяся экосистема библиотек и культурных практик тянет в направлении писать на Джаве на Джаве. Но если вы пишете не на Джаве, то лучше не поддаваться соблазну писать на этом языке на Джаве.

Flat | Top-Level Comments Only

From:

redis.livejournal.com

В двойке кривенькая поддержка юникода, кидает исключения, если строка не юникод, а хотелось юникод. Я мало работал с этим, хватило одного проекта

dzz.livejournal.com

Ну, батенька, пишите на третьем диалекте - будет вам везде UTF-8 и никаких траблов. В перле, надо полагать, с кодировками всё зашибись :)))

В тройке на тот момент не было нужной мне библиотеки.

На Перле писал, но с ним проблем не имел, случайность сработала не в мою пользу именно с Питоном - проект на Питоне оказался именно тем, что на втором Питоне писать не стоило. Разбор и парсинг е-мэйлов, MIME и все такое, с учетом того, что зачастую клиент указывает один encoding, а внутре оно в другом. Это было ужасно :(

pigmeich.livejournal.com

Ой, китайцы-то как обрадуются!

Гхм, CJK в UTF-8, вроде, в полном объёме реализованы, что не так-то?

Ага, только занимает 8 байт.

В основном, три. Там переменная длина.

И, самое главное, где-то это сделано принципиально иначе? В джаве, перле и С++ какой-то другой юникод и UTF-8? :)

Edited Date: 2017-09-23 08:55 am (UTC)

> В основном, три. Там переменная длина.

Ну мы же про CJK?

> И, самое главное, где-то это сделано принципиально иначе? В джаве, перле и С++ какой-то другой юникод и UTF-8? :)

Смайлик неуместен. В нормальных языках есть выбор в какой кодировке хранить.

Edited Date: 2017-09-23 09:34 am (UTC)

Обычно под CJK понимается поддержка символов китайского, японского и корейского языка без конкретизации кодировки. В юникоде есть достаточное для подавляющего большинства применений количество символов, соответствующих этим языкам. Кодировка UTF-8 имеет переменную длину, в которой на JK приходится, в основном, 2 байта, а на C - в основном, три. Что опять не так? :)

> Смайлик неуместен. В нормальных языках есть выбор в какой кодировке хранить.

Ну, пользуйтесь вторым диалектом, если есть желание при вводе-выводе постоянно трахаться с encode/decode, "как в нормальных языках". Разработчики фронтэндов и датабазники вас не поймут.

> Кодировка UTF-8 имеет переменную длину, в которой на JK приходится, в основном, 2 байта, а на C - в основном, три. Что опять не так? :)

Чё, серьезно? Офигительные открытия в этом журнале.

Вся кана и хангыль в UTF-8 укладываются в три байта.

Иероглифы, на вскидку:

http://graphemica.com/%E9%9B%8E - три байта
http://graphemica.com/%E9%9B%8C - три байта

Что я делаю не так?

Edited Date: 2017-09-23 10:56 am (UTC)

Вы только что утверждали, что японские кодпойнты укладываются в 2 байта (в UTF-8), а теперь в три.

> Что я делаю не так?

Вот это.

Ок, mea culpa. Но в три-то укладываются?

> Ага, только занимает 8 байт.

Вот это ваше "8 байт" где?

> Ок, mea culpa. Но в три-то укладываются?

Одно слово: «кандзи».

> Вот это ваше "8 байт" где?

Редкие иероглифы в комбинациях, может быть и больше.

Может, но это именно очень редкие случаи. Основная масса китайского и японского текста состоит из трёхбайтных пойнтов.

From: (Anonymous)

Очень редкие, да. Все симпволы Юникода, без исключения, замимают от 1 до 4 байт в UTF-8.

Если строка не юникод, а хотелось юникод, то исклюение — совершенно правильная реакция. В чем проблема?

S	M	T	W	T	F	S
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

Ни о какой безапелляционности в моих высказываниях не может быть и речи!

(...)

о джаве

о джаве

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

Profile

December 2025

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags