avva: (Default)
[personal profile] avva
Что если попробовать посмотреть на языки как на коды Хаффмана по отношению к абстрактным понятиям? Иными словами, язык как способ кодировать абстрактные слова последовательностями звуков, так, что более частые слова получаются более короткими.

Наверное, во всех естественных языках есть корреляция между частотой слова и его длиной в звуках или слогах. Самые короткие слова используются для самых основных понятий, и наоборот. Не без исключений, конечно, но в целом, наверное, так.

Один интересный вопрос, который сразу возникает - что можно сказать об энтропии разных языков. В своей основополагающей работе "Prediction and Entropy of Printed English" Шеннон ввел понятие информационной энтропии и продемонстрировал его на примере письменного английского. Но пытался ли кто-то измерить энтропию того же английского, или других языков, в фонетической записи - и какие получались значения? Я не знаю, и буду благодарен за ссылки (то же касается всего остального в этой записи).

Другой вопрос - как изменяется частых слов по длинам в результате языковых изменений. Скажем, фонетических: слились какие-то два звука, или какой-то согласный в определенной позиции стал произноситься по-другому. Всегда ли это ведет к уменьшению энтропии, т.е. более емкому в среднем звуковыражению в этом языке - по сравнению с тем, как было до того? (я не уверен, что использую слово "энтропия" правильно в предыдущем предложении). Тоже интересно, пытались ли это систематически исследовать.

Далее - может ли быть, что какое-то изменение, влияющее на весь язык в целом, в каком-то отдельном классе слов, наоборот, ведет к локально "несправедливому" распределению слов по длине? Собственно, я задумался обо всем этом, когда мне пришло в голову, что в русском языке многие глаголы короче в прошедшем времени, чем в настоящем. "Шел" по сравнению с "иду", "взял"/"беру", "дал"/"даю", "мёл/мету", "мыл"/"мою" итд. - один слог по сравнению с двумя. Но верно ли, что прошедшее время используется в обычной речи чаще, чем настоящее? По-моему, наоборот все же.

Вот еще одно наивное предположение - наивное, потому что древнерусскую грамматику я совсем почти не помню: до падения редуцированных эти формы прошедшего времени были из двух слогов: былъ, мылъ, шелъ итд. (твердый знак в то время, до 10-11 века, обозначал редуцированный гласный звук). Падение редуцированных в целом сильно сократило множество важных слов, в первую очередь существительных: быкъ->бык, сынъ->сын; но конкретно в случае глаголов оно изменило баланс между прошедшим и настоящим временем, потому что мылъ стало односложным, а мою осталось двусложным.

И еще одна тема - какие есть отдельные контрпримеры общему правилу "чем чаще, тем короче"? Иными словами, какие мы используем нерезонно длинные слова? Тут, наверное, есть как целые тенденции, так и обособленные примеры. Тенденции - это, скажем, когда становится модным заимствовать целыми пластами относительно длинные слова из другого языка. Как все эти слова на -tion или -ция: у многих были или могли сформироваться "местные" более емкие альтернативы, но поскольку уже есть сложившийся узор, удобная колея, в которую ладно ложатся латинские слова - это пересиливает соображения длины.

А что касается конкретных примеров, то мне забавным кажется французское aujourd'hui (сегодня), с тех пор, как я узнал его этимологию: au jour d'hui, т.е. "в день сегодня", где hui - более древнее и вышедшее из употребления слово для "сегодня". Как это получилось, что у французов было отличное и совершенно нормальное слово для "сегодня", hui, и они его заменили на длинное выражение "в сегодняшний день"?

Собственно, и в других известных мне языках это слово нередко оказывается составным: сего-дня, to-day. Почему так? Разве это не достаточно фундаментальное, основное понятие? Я уже придумал целую теорию о том, как якобы нам оно только кажется фундаментальным из нашего времени; а типичному жителю древних веков зачем было нужно это слово? Если говорить о чем-то, что должно "сегодня" случиться, то на то есть утро/полудень/вечер/ночь, которые гораздо лучше описывают, функционально обособляют правильный промежуток времени. А вне этих интервалов незачем и говорить о чем-то, что именно "сегодня" случилось или случится - это только с развитием документов и бюрократии стало важно.

Жаль, что эта теория полностью разбивается неброским словом "нынче", о котором я вовремя вспомнил. Хорошее, кстати, слово; вы знаете, что (по Фасмеру) оно родственно английскому now? Правильно, наверное, другой вопрос задавать: почему в русском языке "сегодня" вытеснило "нынче", и не является ли это одной из первых побед языкового бюрократизма?

Все это очень сумбурно, кажется, вышло, но причесывать времени нет, уж как есть.
Page 1 of 3 << [1] [2] [3] >>

Date: 2010-02-09 02:56 pm (UTC)
From: [identity profile] f_ja.livejournal.com
http://news.bbc.co.uk/2/hi/uk_news/magazine/6250184.stm

Date: 2010-02-09 02:56 pm (UTC)
From: [identity profile] brammator.livejournal.com
На мой дилетантский взгляд, прошлое время в устной речи как раз более востребовано -- рассказать о том, што было, где ходил, кого видел, чем занимался. Настоящее время? "Чем занят, Степан? -- С тобой разговариваю."

Date: 2010-02-09 03:14 pm (UTC)
From: [identity profile] russ-dilettante.livejournal.com
"Ныне" родственно now по индоевропейской линии, как произошедшее из общего предка. Еще заметнее родство с немецким nun и латиским nunc. Но разве его вытеснило "сегодня", а не "теперь"?

Date: 2010-02-09 03:15 pm (UTC)
From: [identity profile] avva.livejournal.com
Но ведь в разговорной речи мы и о прошедшем говорим часто в настоящем времени. Иду я вчера, значит, и вижу, Коля стоит...

Date: 2010-02-09 03:18 pm (UTC)
From: [identity profile] avva.livejournal.com
"Ныне" - скорее "теперь", а "нынче", мне кажется, чаще означает именно "сегодня"; по крайней мере отдельное такое значение у него точно есть - противостоит 'завтра' в поговорках итд. Хоть есть и другое значение, более близкое к 'теперь', да.

Date: 2010-02-09 03:19 pm (UTC)
From: [identity profile] avva.livejournal.com
О, спасибо, не знал про распределение Зипфа.

Date: 2010-02-09 03:22 pm (UTC)
From: [identity profile] avva.livejournal.com
Но нет, распределение Зипфа это другое: связь между конкретной частотой слова и его местом в списке всех слов по частоте. К длине слова в звуках/буквах/слогах это отношения не имеет, судя по этой статье в Википедии.

Date: 2010-02-09 03:27 pm (UTC)
From: [identity profile] brammator.livejournal.com
Не буду судить, какие разговорные нормы оно принимало во времена становления языка. Не хватает знаний и соображения. А так картинка складывается -- устная речь использовалась в целях повелительных и образовательных, второе и было в основном с прошедшим временем. Ну то есть как раз явление "прошедшее время в языке" (ещё даже не понятие, а только явление) как раз там и появилось, в хрестоматийного вида "рассказах стариков детям".

Ещё одно соображение: настоящее время (и будущее) это уже абстрактное мышление, это уже фантазия вслух. "Иду я лесом, вижу -- Коля стоит" -- как же это так, если Коля сейчас не стоит, а лежит дохлый, да и я не лесом иду, а у костра стою?

Date: 2010-02-09 03:27 pm (UTC)
From: [identity profile] plakhov.livejournal.com
По-русски Ципфа afaik

Date: 2010-02-09 03:28 pm (UTC)
From: [identity profile] asherin.livejournal.com
По-моему, нецелесообразно брать длину слов вне связи с потребностями смыслоразличения.

Date: 2010-02-09 03:28 pm (UTC)
From: [identity profile] avva.livejournal.com
Наверняка, да ;)

Date: 2010-02-09 03:28 pm (UTC)
From: [identity profile] prolefa.livejournal.com
а в испанском сегодня (hoy) короче, чем сейчас (ahora). Может, оттого, что есть хоть какая-нибудь возможность отложить дело хотя бы на несколько часов :)

Date: 2010-02-09 03:33 pm (UTC)
From: [identity profile] brammator.livejournal.com
Глава "Statistical explanation", там очень интересно про тексты из рандомно составленных слов. Я ошибаюсь, или количество повторений малобуквенных слов в таком тексте будет выше уже в силу мЕньшего количества их вообще? А распределение Зифа сохраняется.

Впрочем, кажется, я путаю причину с причиной.

Date: 2010-02-09 03:36 pm (UTC)
From: [identity profile] nec-p1us-u1tra.livejournal.com
> Жаль, что эта теория полностью разбивается неброским словом "нынче"

неброским и односложным "днес", вообще-то. Хотя оно тоже из дьньсь -- "день этот"

Date: 2010-02-09 03:47 pm (UTC)
From: [identity profile] sereshka.livejournal.com
Дима Хмелев занимался чем-то достаточно близким:
http://mgg.coas.oregonstate.edu/%7Eanya/dima/publications-eng.html

Date: 2010-02-09 03:48 pm (UTC)
From: [identity profile] mkal.livejournal.com
Меня всегда раздражали очень длинные русские слова "Хорошо" и "Осторожно". Особенно второе, которое полагается кричать в экстренных ситуациях и к моменту окончания слова необходимость в его произнесении уже может и исчезнуть.

Date: 2010-02-09 04:24 pm (UTC)
From: [identity profile] uniqum.livejournal.com
всех их вытеснило краткое "щас"

Date: 2010-02-09 04:28 pm (UTC)
From: [identity profile] newkirill.livejournal.com
С французами все еще хуже: с недавних пор в разговорную речь вошло au jour d'aujourd'hui все в том же значении "сегодня", но объяснения этого феномена, явно противоречащего гипотезе о фонетической экономии, мне неизвестны.

Date: 2010-02-09 04:30 pm (UTC)
From: [identity profile] avva.livejournal.com
Вы шутите!
Нет, судя по гуглепоиску, вы не шутите! Какая прелесть!

Date: 2010-02-09 04:34 pm (UTC)
From: [identity profile] tlkh.livejournal.com
Еще есть слово ostanavlivaites: http://www.languagehat.com/archives/003668.php

Date: 2010-02-09 04:48 pm (UTC)
From: (Anonymous)
По-русски тоже иногда так говорят. «Сегодняшнего дня» вместо «сегодня». Гоголь: «Сегодняшнего дня случилось необыкновенное приключение» и т.д.

Date: 2010-02-09 05:05 pm (UTC)
From: [identity profile] gianthare.livejournal.com
Ну, Мишель Томас aujourd'hui в лекциях объяснял обилием омофонов для hui, а точнее, конкретно oui. Но у него много было подобных объяснений

Date: 2010-02-09 05:05 pm (UTC)
From: [identity profile] bobot.livejournal.com
Как жаль, что мы не проживем достаточно долго, чтобы через несколько итераций услышать чудесное au jour d'aujourd'aujourd'aujourd'aujourd'hui

Date: 2010-02-09 05:12 pm (UTC)
From: (Anonymous)
Чем больше в системе элементов, которые необходимо различать, тем длиннее должно быть среднее наименование такого элемента. Исходя из этого, чем многочисленнее народ, тем длиннее должны быть его имена. Однако едва ли не самые длинные имена – прибалтийские, а самые короткие – китайские.

Date: 2010-02-09 05:32 pm (UTC)
From: [identity profile] mura-vey.livejournal.com
Прошедшее время значительно частотнее настоящего. Например, иду встречается в корпусе 5376 (http://search.ruscorpora.ru/search.xml?mycorp=&mysent=&mysize=&dpp=&spp=&spd=&text=lexform&mode=main&sort=gr_tagging&lang=ru&req=%E8%E4%F3) раз, а шел - 21763 (http://search.ruscorpora.ru/search.xml?mycorp=&mysent=&mysize=&dpp=&spp=&spd=&text=lexform&mode=main&sort=gr_tagging&lang=ru&req=%F8%E5%EB). И в целом рапределение выглядит похожим образом.
Что же касается времени до падения редуцированных, то тогда, конечно, форма на -л была еще настоящим причастием и употреблялась с глаголом быть. А прошедшее время маркировалось не этой формой, а имперфектом или аористом.
Вообще же связью частотностями с изменениями в языке много занималась Joan Bybee, в частности см. ее последнюю книжку "Frequency of use and the organization of language" (http://books.google.no/books?id=VLh4TyWeH5MC&printsec=frontcover&dq=Frequency+of+use+and+the+organization+of+language&source=bl&ots=SGvSz2H3x7&sig=IkforVHRgame-KXao_dEDk8ERSQ&hl=no&ei=RptxS7izA4je-Qb8-6zTCQ&sa=X&oi=book_result&ct=result&resnum=1&ved=0CA8Q6AEwAA#v=onepage&q=&f=false)
Page 1 of 3 << [1] [2] [3] >>

December 2025

S M T W T F S
  123 4 56
78 9 10 11 1213
1415 1617181920
21 22 23 24 2526 27
2829 3031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Dec. 30th, 2025 05:17 pm
Powered by Dreamwidth Studios