avva: (Default)
[personal profile] avva
Что если попробовать посмотреть на языки как на коды Хаффмана по отношению к абстрактным понятиям? Иными словами, язык как способ кодировать абстрактные слова последовательностями звуков, так, что более частые слова получаются более короткими.

Наверное, во всех естественных языках есть корреляция между частотой слова и его длиной в звуках или слогах. Самые короткие слова используются для самых основных понятий, и наоборот. Не без исключений, конечно, но в целом, наверное, так.

Один интересный вопрос, который сразу возникает - что можно сказать об энтропии разных языков. В своей основополагающей работе "Prediction and Entropy of Printed English" Шеннон ввел понятие информационной энтропии и продемонстрировал его на примере письменного английского. Но пытался ли кто-то измерить энтропию того же английского, или других языков, в фонетической записи - и какие получались значения? Я не знаю, и буду благодарен за ссылки (то же касается всего остального в этой записи).

Другой вопрос - как изменяется частых слов по длинам в результате языковых изменений. Скажем, фонетических: слились какие-то два звука, или какой-то согласный в определенной позиции стал произноситься по-другому. Всегда ли это ведет к уменьшению энтропии, т.е. более емкому в среднем звуковыражению в этом языке - по сравнению с тем, как было до того? (я не уверен, что использую слово "энтропия" правильно в предыдущем предложении). Тоже интересно, пытались ли это систематически исследовать.

Далее - может ли быть, что какое-то изменение, влияющее на весь язык в целом, в каком-то отдельном классе слов, наоборот, ведет к локально "несправедливому" распределению слов по длине? Собственно, я задумался обо всем этом, когда мне пришло в голову, что в русском языке многие глаголы короче в прошедшем времени, чем в настоящем. "Шел" по сравнению с "иду", "взял"/"беру", "дал"/"даю", "мёл/мету", "мыл"/"мою" итд. - один слог по сравнению с двумя. Но верно ли, что прошедшее время используется в обычной речи чаще, чем настоящее? По-моему, наоборот все же.

Вот еще одно наивное предположение - наивное, потому что древнерусскую грамматику я совсем почти не помню: до падения редуцированных эти формы прошедшего времени были из двух слогов: былъ, мылъ, шелъ итд. (твердый знак в то время, до 10-11 века, обозначал редуцированный гласный звук). Падение редуцированных в целом сильно сократило множество важных слов, в первую очередь существительных: быкъ->бык, сынъ->сын; но конкретно в случае глаголов оно изменило баланс между прошедшим и настоящим временем, потому что мылъ стало односложным, а мою осталось двусложным.

И еще одна тема - какие есть отдельные контрпримеры общему правилу "чем чаще, тем короче"? Иными словами, какие мы используем нерезонно длинные слова? Тут, наверное, есть как целые тенденции, так и обособленные примеры. Тенденции - это, скажем, когда становится модным заимствовать целыми пластами относительно длинные слова из другого языка. Как все эти слова на -tion или -ция: у многих были или могли сформироваться "местные" более емкие альтернативы, но поскольку уже есть сложившийся узор, удобная колея, в которую ладно ложатся латинские слова - это пересиливает соображения длины.

А что касается конкретных примеров, то мне забавным кажется французское aujourd'hui (сегодня), с тех пор, как я узнал его этимологию: au jour d'hui, т.е. "в день сегодня", где hui - более древнее и вышедшее из употребления слово для "сегодня". Как это получилось, что у французов было отличное и совершенно нормальное слово для "сегодня", hui, и они его заменили на длинное выражение "в сегодняшний день"?

Собственно, и в других известных мне языках это слово нередко оказывается составным: сего-дня, to-day. Почему так? Разве это не достаточно фундаментальное, основное понятие? Я уже придумал целую теорию о том, как якобы нам оно только кажется фундаментальным из нашего времени; а типичному жителю древних веков зачем было нужно это слово? Если говорить о чем-то, что должно "сегодня" случиться, то на то есть утро/полудень/вечер/ночь, которые гораздо лучше описывают, функционально обособляют правильный промежуток времени. А вне этих интервалов незачем и говорить о чем-то, что именно "сегодня" случилось или случится - это только с развитием документов и бюрократии стало важно.

Жаль, что эта теория полностью разбивается неброским словом "нынче", о котором я вовремя вспомнил. Хорошее, кстати, слово; вы знаете, что (по Фасмеру) оно родственно английскому now? Правильно, наверное, другой вопрос задавать: почему в русском языке "сегодня" вытеснило "нынче", и не является ли это одной из первых побед языкового бюрократизма?

Все это очень сумбурно, кажется, вышло, но причесывать времени нет, уж как есть.
Page 1 of 2 << [1] [2] >>

Date: 2010-02-09 02:56 pm (UTC)
From: [identity profile] f_ja.livejournal.com
http://news.bbc.co.uk/2/hi/uk_news/magazine/6250184.stm

Date: 2010-02-09 02:56 pm (UTC)
From: [identity profile] brammator.livejournal.com
На мой дилетантский взгляд, прошлое время в устной речи как раз более востребовано -- рассказать о том, што было, где ходил, кого видел, чем занимался. Настоящее время? "Чем занят, Степан? -- С тобой разговариваю."

Date: 2010-02-09 03:15 pm (UTC)
From: [identity profile] avva.livejournal.com
Но ведь в разговорной речи мы и о прошедшем говорим часто в настоящем времени. Иду я вчера, значит, и вижу, Коля стоит...

(no subject)

From: [identity profile] brammator.livejournal.com - Date: 2010-02-09 03:27 pm (UTC) - Expand
(deleted comment)

Date: 2010-02-09 03:19 pm (UTC)
From: [identity profile] avva.livejournal.com
О, спасибо, не знал про распределение Зипфа.

(no subject)

From: [identity profile] avva.livejournal.com - Date: 2010-02-09 03:22 pm (UTC) - Expand

(no subject)

From: [identity profile] plakhov.livejournal.com - Date: 2010-02-09 03:27 pm (UTC) - Expand

(no subject)

From: [identity profile] avva.livejournal.com - Date: 2010-02-09 03:28 pm (UTC) - Expand

(no subject)

From: [identity profile] status-constr.livejournal.com - Date: 2010-02-09 09:38 pm (UTC) - Expand

(no subject)

From: [identity profile] plakhov.livejournal.com - Date: 2010-02-10 07:58 am (UTC) - Expand

(no subject)

From: (Anonymous) - Date: 2010-02-10 08:47 am (UTC) - Expand

Ну что ж, бывает :)

From: [identity profile] status-constr.livejournal.com - Date: 2010-02-10 09:10 am (UTC) - Expand

(no subject)

From: [identity profile] plakhov.livejournal.com - Date: 2010-02-10 09:17 am (UTC) - Expand

(no subject)

From: [identity profile] brammator.livejournal.com - Date: 2010-02-09 03:33 pm (UTC) - Expand

Date: 2010-02-09 03:14 pm (UTC)
From: [identity profile] russ-dilettante.livejournal.com
"Ныне" родственно now по индоевропейской линии, как произошедшее из общего предка. Еще заметнее родство с немецким nun и латиским nunc. Но разве его вытеснило "сегодня", а не "теперь"?

Date: 2010-02-09 03:18 pm (UTC)
From: [identity profile] avva.livejournal.com
"Ныне" - скорее "теперь", а "нынче", мне кажется, чаще означает именно "сегодня"; по крайней мере отдельное такое значение у него точно есть - противостоит 'завтра' в поговорках итд. Хоть есть и другое значение, более близкое к 'теперь', да.

(no subject)

From: [identity profile] uniqum.livejournal.com - Date: 2010-02-09 04:24 pm (UTC) - Expand

Date: 2010-02-09 03:28 pm (UTC)
From: [identity profile] asherin.livejournal.com
По-моему, нецелесообразно брать длину слов вне связи с потребностями смыслоразличения.

Date: 2010-02-09 03:28 pm (UTC)
From: [identity profile] prolefa.livejournal.com
а в испанском сегодня (hoy) короче, чем сейчас (ahora). Может, оттого, что есть хоть какая-нибудь возможность отложить дело хотя бы на несколько часов :)

Date: 2010-02-09 03:36 pm (UTC)
From: [identity profile] nec-p1us-u1tra.livejournal.com
> Жаль, что эта теория полностью разбивается неброским словом "нынче"

неброским и односложным "днес", вообще-то. Хотя оно тоже из дьньсь -- "день этот"

Date: 2010-02-09 03:47 pm (UTC)
From: [identity profile] sereshka.livejournal.com
Дима Хмелев занимался чем-то достаточно близким:
http://mgg.coas.oregonstate.edu/%7Eanya/dima/publications-eng.html

Date: 2010-02-09 03:48 pm (UTC)
From: [identity profile] mkal.livejournal.com
Меня всегда раздражали очень длинные русские слова "Хорошо" и "Осторожно". Особенно второе, которое полагается кричать в экстренных ситуациях и к моменту окончания слова необходимость в его произнесении уже может и исчезнуть.

Date: 2010-02-09 04:34 pm (UTC)
From: [identity profile] tlkh.livejournal.com
Еще есть слово ostanavlivaites: http://www.languagehat.com/archives/003668.php

(no subject)

From: [identity profile] mkal.livejournal.com - Date: 2010-02-09 07:49 pm (UTC) - Expand

(no subject)

From: [identity profile] a-bronx.livejournal.com - Date: 2010-02-10 07:59 am (UTC) - Expand

Date: 2010-02-09 04:28 pm (UTC)
From: [identity profile] newkirill.livejournal.com
С французами все еще хуже: с недавних пор в разговорную речь вошло au jour d'aujourd'hui все в том же значении "сегодня", но объяснения этого феномена, явно противоречащего гипотезе о фонетической экономии, мне неизвестны.

Date: 2010-02-09 04:30 pm (UTC)
From: [identity profile] avva.livejournal.com
Вы шутите!
Нет, судя по гуглепоиску, вы не шутите! Какая прелесть!

(no subject)

From: [identity profile] krace.livejournal.com - Date: 2010-02-10 02:11 am (UTC) - Expand

(no subject)

From: (Anonymous) - Date: 2010-02-09 04:48 pm (UTC) - Expand

(no subject)

From: [identity profile] bobot.livejournal.com - Date: 2010-02-09 05:05 pm (UTC) - Expand

(no subject)

From: [identity profile] status-constr.livejournal.com - Date: 2010-02-09 10:39 pm (UTC) - Expand

(no subject)

From: [identity profile] status-constr.livejournal.com - Date: 2010-02-09 09:52 pm (UTC) - Expand

Date: 2010-02-09 05:05 pm (UTC)
From: [identity profile] gianthare.livejournal.com
Ну, Мишель Томас aujourd'hui в лекциях объяснял обилием омофонов для hui, а точнее, конкретно oui. Но у него много было подобных объяснений

Date: 2010-02-09 05:12 pm (UTC)
From: (Anonymous)
Чем больше в системе элементов, которые необходимо различать, тем длиннее должно быть среднее наименование такого элемента. Исходя из этого, чем многочисленнее народ, тем длиннее должны быть его имена. Однако едва ли не самые длинные имена – прибалтийские, а самые короткие – китайские.

Date: 2010-02-10 02:15 am (UTC)
From: [identity profile] krace.livejournal.com
однако на практике прибалтийские имена очень неплохо сокращаются (наблюдал), а китайские, емнип, комбинируются (Толик, не у тебя ли была дискуссия на эту тему, довольно давно).
Edited Date: 2010-02-10 02:15 am (UTC)

Date: 2010-02-09 05:32 pm (UTC)
From: [identity profile] mura-vey.livejournal.com
Прошедшее время значительно частотнее настоящего. Например, иду встречается в корпусе 5376 (http://search.ruscorpora.ru/search.xml?mycorp=&mysent=&mysize=&dpp=&spp=&spd=&text=lexform&mode=main&sort=gr_tagging&lang=ru&req=%E8%E4%F3) раз, а шел - 21763 (http://search.ruscorpora.ru/search.xml?mycorp=&mysent=&mysize=&dpp=&spp=&spd=&text=lexform&mode=main&sort=gr_tagging&lang=ru&req=%F8%E5%EB). И в целом рапределение выглядит похожим образом.
Что же касается времени до падения редуцированных, то тогда, конечно, форма на -л была еще настоящим причастием и употреблялась с глаголом быть. А прошедшее время маркировалось не этой формой, а имперфектом или аористом.
Вообще же связью частотностями с изменениями в языке много занималась Joan Bybee, в частности см. ее последнюю книжку "Frequency of use and the organization of language" (http://books.google.no/books?id=VLh4TyWeH5MC&printsec=frontcover&dq=Frequency+of+use+and+the+organization+of+language&source=bl&ots=SGvSz2H3x7&sig=IkforVHRgame-KXao_dEDk8ERSQ&hl=no&ei=RptxS7izA4je-Qb8-6zTCQ&sa=X&oi=book_result&ct=result&resnum=1&ved=0CA8Q6AEwAA#v=onepage&q=&f=false)

Date: 2010-03-29 02:58 pm (UTC)
From: [identity profile] omened-drunkard.livejournal.com
Не могли бы подробнее рассказать про этимологию прошедшего времени, либо дать ссылку? Буду очень признателен.

Date: 2010-02-09 05:46 pm (UTC)
From: [identity profile] oaristes.livejournal.com
"Ныне-нынче" от индоевропейской основы, "сегодня" от словосочетания. :)

Date: 2010-02-09 05:48 pm (UTC)
From: [identity profile] mme-n-b.livejournal.com
"более частые слова получаются более короткими." Слишком много примеров обратного. Например relatives и kin, сегодня и ныне.

Date: 2010-02-09 05:50 pm (UTC)
From: [identity profile] mme-n-b.livejournal.com
Нельзя так быстро нажимать на кнопки. Я xотела написать "сегодня и ныне" - далеко не единственный пример.

Date: 2010-02-09 06:15 pm (UTC)
From: [identity profile] lady-algiz.livejournal.com
В пользу этой теории свидетельствует, что слова, ставшие обиходными, в разговорном языке сокращаются. "Фотки" и "фото" вытеснили "фотографию", "телик" и "тэвэ" - телевизор и телевидение. Редко кто говорит "компьютер" и "фотоаппарат".
А, допустим, "революцию" или "идиосинкразию" сокращить никому не надо.

А "сегодня" в разговоре уже давно сократилось до "сёдня" - так что не длиннее "нынче".

Date: 2010-02-09 10:29 pm (UTC)
From: [identity profile] status-constr.livejournal.com
Вот именно. Щас вместо сейчас, таких примеров немало. И способов фонетического сжатия немало. А уж в таких языках, как английский, валлийский и другие, эта тенденция просто выставлена напоказ: five o'clock во всех видах и формах.

И всё же теория имеет фундаментальный недостаток. Если сжатие данных (в алгоритмике) не ограничено никакими посторонними соображениями, то живая речь (а) стремится не к минимуму, а к некоему оптимуму соотношения скорости передачи инфы к скорости оформления мысли и к интуитивно предполагаемой скорости восприятия: уставное разделение команды на подготовительную часть (КРРРРРРЮ...) и исполнительную (....ГОМ!!!) меет глубочайшие социопсихологичские корни (б) тормозится инстинктивным стремлением не делать уступок речевой эстетике (разной для разных языков, социумов, эпох) - если угодно, к ритмичности и напевности (в) не может не учитывать чисто биологические ограничения речевого аппарата (опять-таки разные для разных культур и субкультур).

Например, в китайском полным-полно искусственно УДВОЕННЫХ слов. Даже слово "речь" - это 言語, то есть 言(янь2, речь) плюс 語(ю3, язык). При том, что полным-полно слов типа комсомол или замнарком - такие слова более чем естественны для китайского и составляют... не знаю, ну ОЧЕНЬ значительную часть обиходного словаря.

(no subject)

From: [identity profile] lady-algiz.livejournal.com - Date: 2010-02-10 11:07 am (UTC) - Expand

(no subject)

From: [identity profile] status-constr.livejournal.com - Date: 2010-02-10 12:21 pm (UTC) - Expand

Date: 2010-02-09 06:26 pm (UTC)
From: [identity profile] klapauzius.livejournal.com
Мне кажется, что слова обычного человеческого языка должны обладать избыточным кодированием, чтобы собеседник улавливал смысл сказанного, даже если он не все услышит. Иначе не нужны были бы все суффиксы, артикли и т.д. и грамматика бы сильно упростилась.

Сумасбродная теория: глаголы прошедшего времени короче, т.к. про прошлое обычно рассказываешь с близкого расстояния в спокойной обстановке, тогда как при осуществлении совместного действия в текущий момент, могут мешать различные шумы, расстояние и т.д. - ну это в порядке шутки :)

Date: 2010-02-09 06:36 pm (UTC)
From: [identity profile] dyak.livejournal.com
Когда фонетические процессы в развитии языка приводят к похожести (или идентичности) разных слов, где возможна путаница, есть тенденция привешивать к одному из них усилительное что-нибудь, для избежания этой путаницы.

Напр. в некоторых СШАйских произношениях pin сливается с pen, и в них наблюдают частое употребление "writing pen".

Date: 2010-02-09 07:17 pm (UTC)
From: [identity profile] orie.livejournal.com
я слышала, что если в одной части языковой системы что-то упростилось, то в другой должно усложниться.

Date: 2010-02-09 07:26 pm (UTC)
From: [identity profile] esspe.livejournal.com
На похожую, но параллельную тему

http://languagelog.ldc.upenn.edu/nll/?p=22

Чем выше энтропия языка - тем ниже средняя скорость разговора.

Date: 2010-02-09 07:40 pm (UTC)
a_p: (Default)
From: [personal profile] a_p
у некоторых не шибко образованных французов в последнее время вошло в моду (неграмотное) выражение "au jour d'aujourd'hui", употребляется в смысле "на настоящий момент (состояние дел таково:)"

Date: 2010-02-09 08:43 pm (UTC)
From: [identity profile] mtyukanov.livejournal.com
Тут надо учесть, что современное русское прошедшее время -- это само по себе сокращение, это же бывший перфект, так что не "взял", а "взял есть". Сначала стали массово отбрасывать только "есть" -- другие лица и числа сохраняли связку (как, собственно и с другими видами использования "быти"). Потом связку утратили окончательно.

Date: 2010-03-29 02:47 pm (UTC)
From: (Anonymous)
Не могли бы подробнее рассказать про это? Либо дать ссылку.

(no subject)

From: [identity profile] omened-drunkard.livejournal.com - Date: 2010-03-29 02:57 pm (UTC) - Expand

Date: 2010-02-09 11:17 pm (UTC)
From: [identity profile] bortoq.livejournal.com
идея интересная, но - нет. это кстати, несложно проверить, взяв текст (лучше субтитры к фильмам, как наиболее приближенные к устной речи) и посчитав частоты слов. самыми часто употребляемыми словами будут не только короткие.

кроме того, как вы вычисляете длину слова? по буквам? а почему не по длительности произнесения? например: "вдруг" и "моя".

впрочем, я не лингвист. просто откликнулся на ключевое слово "хаффман".

Date: 2010-02-09 11:48 pm (UTC)
From: [identity profile] rudnev.livejournal.com
насколько можно понять, мотивация насчет "настоящего настоящего" времени как раз и показывает - не только сегодня, но и "сейчас, сей же час" - что текущее обозначение страдает некоторой избыточностью, трудностью, серьезностью, как бы подтверждая, что да, я действительно имею это в виду - а не около того.
и уже потом это значение размывается, когда перестает быть столь необходимым.

похоже на то, как жаргонное значение клево, кул, зыко и т.п. - нуждается в постоянном обновлении.

Date: 2010-02-09 11:53 pm (UTC)
From: [identity profile] rudnev.livejournal.com
раньше, кстати, были же в ходу и варианты типа "сию-минуту", как ни странно, исчезнувшие в век ускорения:)

Date: 2010-02-09 11:59 pm (UTC)
From: [identity profile] malaya-zemlya.livejournal.com
http://en.wikipedia.org/wiki/Optimality_Theory

Краткая речь проще для произношения, но сложнее для понимания. Это выгодно говорящим, но не так выгодна слушателям.
С другой стороны, развернутая речь понятнее слушателям, но лишний труд для оратора.
Каждое языковое сообщество балансирует эти противодействующие силы по-своему.

Если вдруг появляется новый метод, позволяющий увеличить как скорость изложения, так и скорость понимания, то его с радостью берут на вооружение. См. напр. смс-сленг: "OMGWTFBBQ!"
Page 1 of 2 << [1] [2] >>

December 2025

S M T W T F S
  123 4 56
78 9 10 11 1213
1415 1617181920
21 22 23 24 2526 27
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Dec. 30th, 2025 01:56 pm
Powered by Dreamwidth Studios