avva: (Default)
[personal profile] avva
Вот люди разрабатывают Universal Networking Language. Формальный универсальный язык для представления любых видов информации, с полной формализацией семантики.

Смотрю на это и не знаю, плакать или смеяться просто. Что это такое? Кто эти люди? Откуда они взяли столько голубоглазой непробиваемой наивности? Или, может быть, я чего-то не понимаю?

Куча определений, предикатов и условий, взятых напрямую из английского языка, с английскими же именами, и с примерами только на одном языке - английском. Там вообще хоть один лингвист настоящий есть среди них? Хоть один человек, читавший, ну я не знаю, Соссюра?

В качестве первого же примера в самом начале документа приводится следующее:
For instance, the following shows an example of a UNL expression of the sentence “I can hear a dog barking outside”.

{unl}
aoj(hear(icl>perceive(agt>thing,obj>thing)).@entry.@ability, I)
obj(hear(icl>perceive(agt>thing,obj>thing)).@entry.@ability, :01)
agt:01(bark(agt>dog).@entry, dog(icl>mammal))
plc:01(bark(agt>dog).@entry, outside(icl>place))
{/unl}
И уже в этом, самом первом, примере, грубая ошибка и демонстрация безнадёжности всей затеи, потому что ведь это @ability внутри выражения означает, что на русский, скажем, язык, это будет "переведено" так примерно: "Я могу услышать, как собака лает снаружи". При этом ясно, что это совершенно неадекватный перевод для can hear в оригинале, и что это именно что не-информативное, идиоматическое, стилистическое использование модального глагола can в "I can hear the dog barking outside" (означающее "я слышу...", "мне слышно..." итп.) свойственно именно английскому языку, является его особенностью. Наверное, только человек, который вообще никаких других языков не знает, может так ничтоже сумняшеся перевести это "can hear" в @ability в формальном языке.

Потрясающее нахальство, смешанное с чем? с непониманием, незнанием основ лингвистики и семантики? Или это сейчас так принято, а я ничего не понимаю? Бред какой-то.

Date: 2003-03-03 08:33 am (UTC)
From: [identity profile] cheburashka.livejournal.com
Похоже на простое непонимание. Интересно, среди них хоть один человек, знающий какой-нибудь иностранный язык, есть?
Моя свекровь так по-фински говорит - дословно, с тем же порядком слов переводит русские предложения, в том числе и идиомы, и сильно удивляется, что ее не понимают :)

half-off-topic

Date: 2003-03-03 08:35 am (UTC)
From: [identity profile] hotgiraffe.livejournal.com
Ух, а кодировка на страничке - Shift-JIS.
Очень смешно при этом кавычки в IE6 выглядят.
А написана она в Ворде.
А (заглядываем в заголовок) авторы у неё "Hiroshi Uchida and Meiying Zhu".
Японец с китайцем, я правильно понимаю ?
Может, это наборот, от непонимания can-модальности, может имели в виду "I'm able to hear..." ?
Странно всё это.

Re: half-off-topic

Date: 2003-03-03 09:36 am (UTC)
From: [identity profile] avva.livejournal.com
Тогда ещё смешнее, если так :)
Странно, да.

Date: 2003-03-03 08:41 am (UTC)
nine_k: A stream of colors expanding from brain (Default)
From: [personal profile] nine_k
Да ладно человеческие языки -- они хоть в чём-то сходны, несмотря на более-менее неудачи в области хорошего машинного перевода. Можно даже попоытаться списать @ability на упрощение в иллюстративных целях ("не заметим" идиому).

А вот как они собираются представлять *любые* виды информации? Графическую, например, или звуковую? Ведь, по уму, её надо бы не просто впихивать внутрь в виде векторов, растра и т. п., а вот так же раскладывать, чтобы можно было дать разумные характеристики видимому/слышимому. Хотя с этим-то, наверное, проще будет.

Можно, конечно, разработать строго формализованный язык со всеми достоинствами и недостатками обычного человеческого языка, с неоднозначностями смысла, разъясняемыми только контекстом, возможностью каламбуров, etc, только без нерегулярностей, сложившихся в ЕЯ исторически (никаких неправильных глаголов и омонимов, etc). Но кто его будет интерпретировать? %-)

Date: 2003-03-03 09:13 am (UTC)
From: [identity profile] malaya-zemlya.livejournal.com
>Но кто его будет интерпретировать? %-)

Смысл не интерпретируют, смыслом оперируют. (постмодернисты - исключение)

Date: 2003-03-03 08:55 am (UTC)
From: [identity profile] alexeiv.livejournal.com
Да это, наверно, просто кто-то диссер пишет... Пусть пишет - не первый и не последний лажовый диссер по Computer Science.

Re:

Date: 2003-03-03 08:58 am (UTC)
From: [identity profile] avva.livejournal.com
Дык это вроде целая организация типа. С региональными серверами (например, unl.ru ). С конференциями какими-то, или чёрт знает чем ещё.

Date: 2003-03-03 09:32 am (UTC)
From: [identity profile] alexeiv.livejournal.com
понятно, я недооценил размер маразма... Ну ладно, все-таки, по моему мнению, пусть лучше параноики рисуют нолики, чем по "Норд-остам" шастают.

Re:

Date: 2003-03-03 09:34 am (UTC)
From: [identity profile] avva.livejournal.com
Ну это-то точно.

Date: 2003-03-03 10:42 pm (UTC)
From: [identity profile] sendfor.livejournal.com
Ну значит гранты, выданные добрым дядей, осваивают. Наука, блин.

Date: 2003-03-03 08:56 am (UTC)
From: [identity profile] pendelschwanz.livejournal.com
Товарищь, трудно это семантику выражать.
Они предлагают способ создавать семантические схемы (весьма формальные).
И не более того.
Покамест нет и никто не придумал надежных способов формализации естественного языка а тем более перевода с языка на язык, сыпятся эти переводчики.
Нехорошо смеяться над тем как грудной ребенок описался.

Date: 2003-03-03 09:11 am (UTC)
From: [identity profile] malaya-zemlya.livejournal.com
*В принципе* идея, на мой взгляд, заслуживающая внимания. В конце концов *мы*-то можем себе представить, *что* означает "I can hear a dog barking outside". Это - то, что Хомский называет "I-Language", а Пинкер - "Mentalese" То, что такое представление у нас есть доказывается хотя бы тем, что мы можем различить смыслы двусмысленных высказываний (avoid confusing people with modifiers :)

Теоретически, значит, и компьютер можно как-то научить. Другое дело, что UNL скорее всего для такого дела не подходит. Мозги - страшно гибкая штука и простого исчисления предикатов тут явно не достаточно (Как логически определить понятие "собака"? А дохлая собавка - это собака? А Товарищ Шариков?)

Тем не менее все такие разработки мне страшно интересны - ибо имеют прямое отношение к написанию текстовых игр :) Keep'em coming!

Date: 2003-03-03 02:54 pm (UTC)
From: [identity profile] avva.livejournal.com
Метафора Mentalese'а мне кажется весьма сомнительной по многим причинам, и вообще я с гораздо большей настороженностью, чем Вы, видимо, отношусь к точке зрения Хомского на данную проблему (а уж тем более к популяризациям Пинкера). То, что мы можем различать смыслы двусмысленных выражений, о чём-то говорит, но о чём именно, мне кажется, пока что мы просто ещё не знаем. Не говоря уж о том, что многие примеры, приводимые хомскианцами в качестве таких
"двусмысленностей", на самом деле являются двусмысленными выражениями только в письменной речи, а в настоящем общении очень легко различаются.

Re:

Date: 2003-03-03 04:01 pm (UTC)
From: [identity profile] malaya-zemlya.livejournal.com
Вы не можете рассказать немного поподробнее, что именно в mentalese настораживает?
Идея, что у концепций есть внутренне представление, отличающееся от внешнего? Универсальность этого внутреннего представления? "Деревянная" струтура этого представления, постулируемая Г-ном Хомским? Что-нибудь еще?

Uran-Bator

Date: 2003-03-03 09:27 am (UTC)
From: [identity profile] flaass.livejournal.com
Chto oni delajut zdes', eti ljudi?
S ugrjumymi licami tjazhelym lomom
Vse bjut i bjut...

Re: Uran-Bator

Date: 2003-03-03 10:58 am (UTC)
From: [identity profile] avva.livejournal.com
Примерно так, да:)

Date: 2003-03-03 09:28 am (UTC)
From: [identity profile] malaya-zemlya.livejournal.com
Кстати есть еще такая штука:
Information Flow Framework - оччень абстрактная попытка пострения универсальной компьютерной семантики (на основе теории концептов и теории категорий).

http://suo.ieee.org/IFF/

Re:

Date: 2003-03-03 10:57 am (UTC)
From: [identity profile] avva.livejournal.com
Это что-то потрясающее. Я пошёл по ссылке, прочитал кучу текста и так и не понял, что это такое и что именно они делают. Сгрузил какой-то их specification в PDF'е, прочитал экранов 10 там, тоже ничего не понял. Какой-то страшный оверлоад buzzwords и аббревиатур. И это при том, что я знаю значение каждого отдельного слова, технического жаргона и в философии, и в логике итп. Я сдался в конце концов. Мне кажется, я бы даже специально не смог написать так непонятно.

Date: 2003-03-03 02:46 pm (UTC)
From: [identity profile] malaya-zemlya.livejournal.com
Еще одна попытка объяснить компьютеру, что все это значит - вдогонку semantic web, UML, OML, KIF и проч. Если долго мучаться, что-нибудь получится.

Re:

Date: 2003-03-03 02:53 pm (UTC)
From: [identity profile] avva.livejournal.com
Да нет, это-то понятно ;) но конкретно что там происходит, осталось неясным. Т.е., может быть, я вульгарный прагматик, но мне кажется, что вместо того, чтобы громоздить десятками бессмысленные (без точных определений) buzzwords типа logics, theories, lattices, ontologies итп., можно было в нескольких абзацах кратко описать, как именно выглядит данный конкретный план, что для него характерно, и продемонстрировать на 1-2 простых примерах.

Наверное, если бы я вгрызся достаточно глубоко и потратил на это дополнительные полчаса, я бы это для себя уяснил, но зачем нужно было отнимать у меня и у всех читателей этий документов столько времени совершенно бессмысленным описанием невнятных общностей на бюрократическом языке -- совершенно непонятно.
From: [identity profile] ypolozov.livejournal.com
http://www.utro.ru/news/2003/03/03/130782.shtml
SMS УНИЧТОЖАЮТ АНГЛИЙСКИЙ ЯЗЫК

membrana.ru. 18:45:16

Опасения по поводу того, что мгновенные текстовые сообщения (SMS), которыми подростки обмениваются по своим мобильникам, угрожают английскому языку, похоже, начинают оправдываться.
В Великобритании учитель так и не смог расшифровать сочинение 13-летнего мальчика на тему "Как я провёл лето": "Я просто не поверил своим глазам. Страница была испещрена какими-то иероглифами, многие из которых я просто не смог перевести", — пожаловался учитель журналистам.
Сочинение, вызвавшее недоумение преподавателя начиналось так: "My smmr hols wr CWOT. B4, we used 2go2 NY 2C my bro, his GF & thr 3 : kids FTF. ILNY, it's a gr8 plc".
В переводе на английский это выглядит следующим образом: "My summer holidays were a complete waste of time. Before, we used to go to New York to see my brother, his girlfriend and their three screaming kids face to face. I love New York. It's a great place".
По-русски примерно так: "Мои летние каникулы были пустой тратой времени. Раньше мы в это время ездили Нью-Йорк повидать моего брата, его подружку и их троих крикливых детишек. Я люблю Нью-Йорк. Это отличное место".
From: [identity profile] yms.livejournal.com
Нашёл первоисточник — там гора-аздо больше! :))
From: [identity profile] melkin.livejournal.com
В разгар IRC я тоже пытался подобное писать на уроках английского. Перестал, после того как с отличников скатился в тарарары и получил от родителей по мозгу :).

Date: 2003-03-03 10:36 am (UTC)
From: [identity profile] cmm.livejournal.com
скажи спасибо что хотя бы без иксемельных тэгов, ага.

фигни вообще на свете много.   т.н. semantic web по амбициям схож с данной затеей, например.

Date: 2003-03-03 02:59 pm (UTC)
From: [identity profile] avva.livejournal.com
скажи спасибо что хотя бы без иксемельных тэгов, ага.

Спасибо ;)

фигни вообще на свете много. т.н. semantic web по амбициям схож с данной затеей, например.

Я смотрел на него как-то.. они, всё же, поскромнее, мне кажется. Тоже дело совершенно безумное, конечно.

Date: 2003-03-03 12:16 pm (UTC)
From: [identity profile] ex-ilyavinar899.livejournal.com
По-моему, этот универсальный язык - индоевропейский. Даже библейский иврит имел несколько иную грамматическую структуру, чем это. В китайском нет времён, как в ИЕ.

Шибко универсален, этот язык.

Date: 2003-03-03 12:19 pm (UTC)
From: [identity profile] dyak.livejournal.com
"универсальный язык - индоевропейский"
А еще точней -- английский, переписанный "закорючками".

Re:

Date: 2003-03-03 12:20 pm (UTC)
From: [identity profile] avva.livejournal.com
Вот именно.

Date: 2003-03-03 12:34 pm (UTC)
From: [identity profile] amzin.livejournal.com
Мне очень понравилось на UNL.ru - "Any person with access to the Internet will be able to "enconvert" text written in their own language into UNL expressions using UNL editor. And likewise, any UNL expressions can be "deconverted" into a variety of native languages using the UNL viewer".

Выглядит так, как будто сейчас они доработают стандарт и сразу облагодетельствуют человечество универсальным переводчиком...

Бывают на свете люди, ага. Странные люди...Но хотя бы не мошенники, как на http://www.thevortextheory.com/ . Мне кажется, что унльцы правда ВЕРУЮТ во всё, что они написали.

ps. Про текстовые игры (interactive fiction) и использование таких разработок в них (о чём написали уже в комментах) - сомнительно, крайне. Я сразу засыпаю, когда вижу слово Agent в описании таких систем - это означает, что люди пытаются построить нечто гавкающее через равные интервалы времени...outside. Ясен перец, часы с кукушкой всяко легче родить, чем ИИ и даже просто универсальный переводчик :).

chto-to v etom est'...

Date: 2003-03-03 01:33 pm (UTC)
From: [identity profile] flaass.livejournal.com
A vse-taki delo poleznoe. Konechno, ne dlja avtomaticheskogo literaturnogo perevoda s jazyka na jazyk. Dazhe avtomaticheskij perevod s zhivogo jazyka na etot UNL - neminuemo budet pestrit' oshibkami. No esli pojavitsa kakoj-nikakoj standart, i podderzhitsa programmnymi produktami (pust' poganyj standart i produkty poganye ponachalu; vspomnite rozhdenie HTML:) ), a potom eshhe i iskalki eto voz'mut na vooruzhenie i nachnut podderzhivat' - process pojdet.

(Zelenyj palec v topike chitajte ne kak "Vo!!!",
a po-latyni: kak "pust' zhivet..." :) )

Re: chto-to v etom est'...

Date: 2003-03-03 02:57 pm (UTC)
From: [identity profile] avva.livejournal.com
Проблема в том, что аналогия с HTML не проходит, так как это не что-то, что можно будет потом постепенно до ума доводить; сам подход полностью порочен. Не то чтобы я знал, как можно каталогизировать семантику универсальным способом, и не то чтобы я был на сто процентов уверен, что можно вообще; но то, что так - нельзя, совершенно очевидно.

Re: chto-to v etom est'...

Date: 2003-03-04 02:10 am (UTC)
From: [identity profile] ex-shushuny.livejournal.com
Ну да.. единственная универсальная семантика, на которую можно смотреть -- это то, что Вежбицка делает, и то, только до тех пор, пока это делает она сама, а не кто-то из ее последователей и учеников...

И это она еще формализации никакой из этого не устраивает!
From: [identity profile] dizel.livejournal.com
рекомендую статью "Temporal reference from a radical pragmatics perspective: Why Yucatec does not need to express "after" and "before". J. Bohnemeyer, Cognitive Linguistics 9-3 (1998)

Статья о том, что в языке Yucatec maya не существует категорий "до" и "после", являющихся, по Вержбицкой, семантическими универсалами.

При этом носители этого языка прекрасно (не хуже и не лучше контрольной группы немецкоговорящих испытуемых) понимают и передают друг другу временные отношения, выражаемые в других языках этими словами.

Естественно, это не означает, что семантических универсалов (лий :) не существует, но где они и что они - пока неясно.

Date: 2003-03-03 03:20 pm (UTC)
From: [identity profile] shq.livejournal.com
Я работал в фирме STAR (http://www.star.spb.ru), которая занималась этим проектом. Я читал кое-какие их материалы, и даже писал статью (http://www.gagin.ru/internet/4/10.html). В общем, их идея была скорее обеспечить простого, не владеющего иностранными языками человека, средством перевода. Например, рассылает фирма X письмо с новостями в UNL, и любой гражданин взяв деконвертор может понять о чем там шла речь.

Помню, что лингвисты жаловались, что UNL "слишком японский", т. е. в их модели много черт, характерных для Японского, а не английского.

Больше, к сожалению, ничего сказать не могу.

lojban

Date: 2003-03-04 05:42 am (UTC)
From: (Anonymous)
Есть еще такой проект, AL. не полная формализация семантики, немного другое. в перспективе предназначен для машинного перевода, но пока что этим никто не озаботился. вещь занятная.
www.lojban.org

Date: 2003-03-04 05:54 am (UTC)
From: [identity profile] umbu-travoso.livejournal.com
Пять лет назад (в 1998) я смотрел на экспериментальную
версию системы машинного перевода ЭТАП-3,
и там среди языков уже был UNL, и перевод на него
как-то работал, то есть выдавалось нечто похожее на
aoj(hear(icl>perceive(agt>thing,obj>thing)).@entry.@ability, I)
и пр. Обратно переводить было нельзя.

В подробности этого UNL я, правда, не вдавался, и не знаю, что произошло с ним и с ЭТАП-ом за эти 5 лет.
From: [identity profile] erez.livejournal.com
На мой дилетантский взгляд, это развитие ЛИСПа с влиянием XML. Насколько я далек от истины?
From: [identity profile] avva.livejournal.com
Думаю, довольно далеки, это всё же несколько другие идеи.

Date: 2003-03-07 10:58 am (UTC)
From: [identity profile] showpanorama.livejournal.com
Весь филологический факультет МГУ, включая забавную, но трудолюбивую кафедру ОТИПЛ, до сих пор не может внятно построить хотя бы одну грамматическую модель.

А я вот построил.

но не скажу.

Date: 2003-03-10 09:53 am (UTC)
From: [identity profile] ex-ilyavinar899.livejournal.com
Из воспоминаний Литтлвуда о Бертране Расселле:

He said once, after some contact with the Chinese language, that he was horrified to find that the language of Principia Mathematica was an Indo-European one.

see also a better project: BabelCode

Date: 2003-12-20 12:42 am (UTC)
From: (Anonymous)
http://www.babelcode.org

This project introduces the use of "macros", enabling the reuse of common patterns.

chutzpah

Date: 2004-01-10 09:30 am (UTC)
From: [identity profile] kobak.livejournal.com
Ух ты какое слово: chutzpah!! Обалдеть.

Это идишизм, я правильно понимаю? Или из еврейского?

Re: chutzpah

Date: 2004-01-10 09:35 am (UTC)
From: [identity profile] avva.livejournal.com
Из иврита.

December 2025

S M T W T F S
  123 4 56
78 9 10 11 1213
1415 1617181920
21 22 23 24 2526 27
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Dec. 29th, 2025 08:37 pm
Powered by Dreamwidth Studios