универсальный язык
Mar. 3rd, 2003 06:20 pmВот люди разрабатывают Universal Networking Language. Формальный универсальный язык для представления любых видов информации, с полной формализацией семантики.
Смотрю на это и не знаю, плакать или смеяться просто. Что это такое? Кто эти люди? Откуда они взяли столько голубоглазой непробиваемой наивности? Или, может быть, я чего-то не понимаю?
Куча определений, предикатов и условий, взятых напрямую из английского языка, с английскими же именами, и с примерами только на одном языке - английском. Там вообще хоть один лингвист настоящий есть среди них? Хоть один человек, читавший, ну я не знаю, Соссюра?
В качестве первого же примера в самом начале документа приводится следующее:
Потрясающее нахальство, смешанное с чем? с непониманием, незнанием основ лингвистики и семантики? Или это сейчас так принято, а я ничего не понимаю? Бред какой-то.
Смотрю на это и не знаю, плакать или смеяться просто. Что это такое? Кто эти люди? Откуда они взяли столько голубоглазой непробиваемой наивности? Или, может быть, я чего-то не понимаю?
Куча определений, предикатов и условий, взятых напрямую из английского языка, с английскими же именами, и с примерами только на одном языке - английском. Там вообще хоть один лингвист настоящий есть среди них? Хоть один человек, читавший, ну я не знаю, Соссюра?
В качестве первого же примера в самом начале документа приводится следующее:
For instance, the following shows an example of a UNL expression of the sentence “I can hear a dog barking outside”.И уже в этом, самом первом, примере, грубая ошибка и демонстрация безнадёжности всей затеи, потому что ведь это @ability внутри выражения означает, что на русский, скажем, язык, это будет "переведено" так примерно: "Я могу услышать, как собака лает снаружи". При этом ясно, что это совершенно неадекватный перевод для can hear в оригинале, и что это именно что не-информативное, идиоматическое, стилистическое использование модального глагола can в "I can hear the dog barking outside" (означающее "я слышу...", "мне слышно..." итп.) свойственно именно английскому языку, является его особенностью. Наверное, только человек, который вообще никаких других языков не знает, может так ничтоже сумняшеся перевести это "can hear" в @ability в формальном языке.
{unl}
aoj(hear(icl>perceive(agt>thing,obj>thing)).@entry.@ability, I)
obj(hear(icl>perceive(agt>thing,obj>thing)).@entry.@ability, :01)
agt:01(bark(agt>dog).@entry, dog(icl>mammal))
plc:01(bark(agt>dog).@entry, outside(icl>place))
{/unl}
Потрясающее нахальство, смешанное с чем? с непониманием, незнанием основ лингвистики и семантики? Или это сейчас так принято, а я ничего не понимаю? Бред какой-то.
no subject
Date: 2003-03-03 08:33 am (UTC)Моя свекровь так по-фински говорит - дословно, с тем же порядком слов переводит русские предложения, в том числе и идиомы, и сильно удивляется, что ее не понимают :)
half-off-topic
Date: 2003-03-03 08:35 am (UTC)Очень смешно при этом кавычки в IE6 выглядят.
А написана она в Ворде.
А (заглядываем в заголовок) авторы у неё "Hiroshi Uchida and Meiying Zhu".
Японец с китайцем, я правильно понимаю ?
Может, это наборот, от непонимания can-модальности, может имели в виду "I'm able to hear..." ?
Странно всё это.
Re: half-off-topic
Date: 2003-03-03 09:36 am (UTC)Странно, да.
no subject
Date: 2003-03-03 08:41 am (UTC)А вот как они собираются представлять *любые* виды информации? Графическую, например, или звуковую? Ведь, по уму, её надо бы не просто впихивать внутрь в виде векторов, растра и т. п., а вот так же раскладывать, чтобы можно было дать разумные характеристики видимому/слышимому. Хотя с этим-то, наверное, проще будет.
Можно, конечно, разработать строго формализованный язык со всеми достоинствами и недостатками обычного человеческого языка, с неоднозначностями смысла, разъясняемыми только контекстом, возможностью каламбуров, etc, только без нерегулярностей, сложившихся в ЕЯ исторически (никаких неправильных глаголов и омонимов, etc). Но кто его будет интерпретировать? %-)
no subject
Date: 2003-03-03 09:13 am (UTC)Смысл не интерпретируют, смыслом оперируют. (постмодернисты - исключение)
no subject
Date: 2003-03-03 08:55 am (UTC)Re:
Date: 2003-03-03 08:58 am (UTC)no subject
Date: 2003-03-03 09:32 am (UTC)Re:
Date: 2003-03-03 09:34 am (UTC)no subject
Date: 2003-03-03 10:42 pm (UTC)no subject
Они предлагают способ создавать семантические схемы (весьма формальные).
И не более того.
Покамест нет и никто не придумал надежных способов формализации естественного языка а тем более перевода с языка на язык, сыпятся эти переводчики.
Нехорошо смеяться над тем как грудной ребенок описался.
no subject
Date: 2003-03-03 09:11 am (UTC)Теоретически, значит, и компьютер можно как-то научить. Другое дело, что UNL скорее всего для такого дела не подходит. Мозги - страшно гибкая штука и простого исчисления предикатов тут явно не достаточно (Как логически определить понятие "собака"? А дохлая собавка - это собака? А Товарищ Шариков?)
Тем не менее все такие разработки мне страшно интересны - ибо имеют прямое отношение к написанию текстовых игр :) Keep'em coming!
no subject
Date: 2003-03-03 02:54 pm (UTC)"двусмысленностей", на самом деле являются двусмысленными выражениями только в письменной речи, а в настоящем общении очень легко различаются.
Re:
Date: 2003-03-03 04:01 pm (UTC)Идея, что у концепций есть внутренне представление, отличающееся от внешнего? Универсальность этого внутреннего представления? "Деревянная" струтура этого представления, постулируемая Г-ном Хомским? Что-нибудь еще?
Uran-Bator
S ugrjumymi licami tjazhelym lomom
Vse bjut i bjut...
Re: Uran-Bator
Date: 2003-03-03 10:58 am (UTC)no subject
Date: 2003-03-03 09:28 am (UTC)Information Flow Framework - оччень абстрактная попытка пострения универсальной компьютерной семантики (на основе теории концептов и теории категорий).
http://suo.ieee.org/IFF/
Re:
Date: 2003-03-03 10:57 am (UTC)no subject
Date: 2003-03-03 02:46 pm (UTC)Re:
Date: 2003-03-03 02:53 pm (UTC)Наверное, если бы я вгрызся достаточно глубоко и потратил на это дополнительные полчаса, я бы это для себя уяснил, но зачем нужно было отнимать у меня и у всех читателей этий документов столько времени совершенно бессмысленным описанием невнятных общностей на бюрократическом языке -- совершенно непонятно.
Навеяло: отомстим английскому!
SMS УНИЧТОЖАЮТ АНГЛИЙСКИЙ ЯЗЫК
membrana.ru. 18:45:16
Опасения по поводу того, что мгновенные текстовые сообщения (SMS), которыми подростки обмениваются по своим мобильникам, угрожают английскому языку, похоже, начинают оправдываться.
В Великобритании учитель так и не смог расшифровать сочинение 13-летнего мальчика на тему "Как я провёл лето": "Я просто не поверил своим глазам. Страница была испещрена какими-то иероглифами, многие из которых я просто не смог перевести", — пожаловался учитель журналистам.
Сочинение, вызвавшее недоумение преподавателя начиналось так: "My smmr hols wr CWOT. B4, we used 2go2 NY 2C my bro, his GF & thr 3 : kids FTF. ILNY, it's a gr8 plc".
В переводе на английский это выглядит следующим образом: "My summer holidays were a complete waste of time. Before, we used to go to New York to see my brother, his girlfriend and their three screaming kids face to face. I love New York. It's a great place".
По-русски примерно так: "Мои летние каникулы были пустой тратой времени. Раньше мы в это время ездили Нью-Йорк повидать моего брата, его подружку и их троих крикливых детишек. Я люблю Нью-Йорк. Это отличное место".
Re: Навеяло: отомстим английскому!
Date: 2003-03-03 10:47 pm (UTC)Re: Навеяло: отомстим английскому!
Date: 2003-03-04 01:28 am (UTC)no subject
Date: 2003-03-03 10:36 am (UTC)фигни вообще на свете много. т.н. semantic web по амбициям схож с данной затеей, например.
no subject
Date: 2003-03-03 02:59 pm (UTC)Спасибо ;)
фигни вообще на свете много. т.н. semantic web по амбициям схож с данной затеей, например.
Я смотрел на него как-то.. они, всё же, поскромнее, мне кажется. Тоже дело совершенно безумное, конечно.
no subject
Date: 2003-03-03 12:16 pm (UTC)Шибко универсален, этот язык.
no subject
Date: 2003-03-03 12:19 pm (UTC)А еще точней -- английский, переписанный "закорючками".
Re:
Date: 2003-03-03 12:20 pm (UTC)no subject
Выглядит так, как будто сейчас они доработают стандарт и сразу облагодетельствуют человечество универсальным переводчиком...
Бывают на свете люди, ага. Странные люди...Но хотя бы не мошенники, как на http://www.thevortextheory.com/ . Мне кажется, что унльцы правда ВЕРУЮТ во всё, что они написали.
ps. Про текстовые игры (interactive fiction) и использование таких разработок в них (о чём написали уже в комментах) - сомнительно, крайне. Я сразу засыпаю, когда вижу слово Agent в описании таких систем - это означает, что люди пытаются построить нечто гавкающее через равные интервалы времени...outside. Ясен перец, часы с кукушкой всяко легче родить, чем ИИ и даже просто универсальный переводчик :).
chto-to v etom est'...
(Zelenyj palec v topike chitajte ne kak "Vo!!!",
a po-latyni: kak "pust' zhivet..." :) )
Re: chto-to v etom est'...
Date: 2003-03-03 02:57 pm (UTC)Re: chto-to v etom est'...
Date: 2003-03-04 02:10 am (UTC)И это она еще формализации никакой из этого не устраивает!
По поводу универсальной семантики Вержбицкой
Date: 2003-03-05 04:26 pm (UTC)Статья о том, что в языке Yucatec maya не существует категорий "до" и "после", являющихся, по Вержбицкой, семантическими универсалами.
При этом носители этого языка прекрасно (не хуже и не лучше контрольной группы немецкоговорящих испытуемых) понимают и передают друг другу временные отношения, выражаемые в других языках этими словами.
Естественно, это не означает, что семантических универсалов (лий :) не существует, но где они и что они - пока неясно.
no subject
Date: 2003-03-03 03:20 pm (UTC)Помню, что лингвисты жаловались, что UNL "слишком японский", т. е. в их модели много черт, характерных для Японского, а не английского.
Больше, к сожалению, ничего сказать не могу.
lojban
Date: 2003-03-04 05:42 am (UTC)www.lojban.org
no subject
Date: 2003-03-04 05:54 am (UTC)версию системы машинного перевода ЭТАП-3,
и там среди языков уже был UNL, и перевод на него
как-то работал, то есть выдавалось нечто похожее на
aoj(hear(icl>perceive(agt>thing,obj>thing)).@entry.@ability, I)
и пр. Обратно переводить было нельзя.
В подробности этого UNL я, правда, не вдавался, и не знаю, что произошло с ним и с ЭТАП-ом за эти 5 лет.
А откуда они берутся-то, эти языки?
Date: 2003-03-04 03:18 pm (UTC)Re: А откуда они берутся-то, эти языки?
Date: 2003-03-11 01:59 pm (UTC)no subject
А я вот построил.
но не скажу.
no subject
Date: 2003-03-10 09:53 am (UTC)He said once, after some contact with the Chinese language, that he was horrified to find that the language of Principia Mathematica was an Indo-European one.
see also a better project: BabelCode
Date: 2003-12-20 12:42 am (UTC)This project introduces the use of "macros", enabling the reuse of common patterns.
chutzpah
Это идишизм, я правильно понимаю? Или из еврейского?
Re: chutzpah
Date: 2004-01-10 09:35 am (UTC)