о том, как ищут
Jun. 26th, 2007 03:30 pmDare Obasanjo пишет о выступлении Мариссы Мейер (Google Search VP) на конференции, посвященной scalability. Из интересного:
Из этого не следует, что не нужно в принципе пытаться лучше понимать запросы на 'естественном языке', но важность такого понимания, видимо, бывает сильно преувеличена.
P.S. Это только одна тема из нескольких, которых касается запись Dare, там еще есть немало интересного.
Примеры запросов новичка и опытного юзера:
Запрос новичка: Why doesn't anyone carry an umbrella in Seattle?
Запрос эксперта: weather seattle washington
Запрос новичка: can I hike in the seattle area?
Запрос эксперта: hike seattle area
Новый пользователь Гугла в среднем переходит от уровня новичка к уровню эксперта за один месяц.
Из этого не следует, что не нужно в принципе пытаться лучше понимать запросы на 'естественном языке', но важность такого понимания, видимо, бывает сильно преувеличена.
P.S. Это только одна тема из нескольких, которых касается запись Dare, там еще есть немало интересного.
no subject
Date: 2007-06-26 12:47 pm (UTC)no subject
Date: 2007-06-26 12:54 pm (UTC)voobshe-to, absolutno vezde v povsednevnoy jyzni est takoe poniatie - REGISTER
In linguistics, a register is a subset of a language used for a particular purpose or in a particular social setting (http://en.wikipedia.org/wiki/Register_%28linguistics%29)
eto est' vezde! v banke, v bol'nitse, v shkole, na rabote, v restorane... vse tak ili inache jyvut s etim i bystro etomu uchatsia - tak obshestvo samo vybralo, tak pochemu search ne mojet imet' svoy register, vpolne normal'no chto eto sushestvuet!
no subject
это хорошо. :) спасибо.
no subject
Date: 2007-06-26 12:58 pm (UTC)no subject
Date: 2007-06-26 12:57 pm (UTC)no subject
Date: 2007-06-26 12:59 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2007-06-26 01:15 pm (UTC)это процент от всех интернет поисков в США,
чисдл которых тоже растет
(no subject)
From: (Anonymous) - Date: 2007-06-26 07:48 pm (UTC) - Expandони есть
Date: 2007-07-09 06:59 am (UTC)говорят что мол русский язык он не поддерживает и т.п. глупости.
к сожалению
no subject
Date: 2007-06-26 01:07 pm (UTC)no subject
Date: 2007-06-26 02:54 pm (UTC)no subject
Date: 2007-06-26 01:10 pm (UTC)И что такое это "в среднем"? Кто-то за день, кто-то через полгода, кто-то никогда. Если мы знаем, что 10% пользователей и через полгода делают запросы на естественном языке - значит ли это, что важность понимания таких запросов преувеличена? А главное, согласятся ли эти 10% с таким утверждением?
no subject
Date: 2007-06-26 05:12 pm (UTC)если человек за месяц не сможет сделать из этого соответствующие выводы, то ему ничего не поможет
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From: (Anonymous) - Date: 2007-06-26 08:09 pm (UTC) - Expand(no subject)
From: (Anonymous) - Date: 2007-06-26 08:10 pm (UTC) - Expand(no subject)
From:no subject
Date: 2007-06-26 01:11 pm (UTC)no subject
Date: 2007-06-26 01:13 pm (UTC)no subject
Date: 2007-06-26 01:17 pm (UTC)Я как-то пытался целиком записывать свои маршруты на кубках Яндекса по поиску. Алгоритма, существенно повышающего вероятность нахождения правильного ответа, похоже, не существует.
Вопрос с зонтиком в Сиэтле некорректен, потому что надо сначала точно сформулировать, что ищут. М.б. запрашивающего интересует погода, а м.б. - традиция сиэттлцев носить плащи-дождевики вместо зонтов. Если погода, то м.б. спрашивающий происходит из региона, где зонты используются в основном от солнца. Мало ли что.
no subject
Date: 2007-06-26 01:26 pm (UTC)Существует :-)
А осенью проверим, существует ли алгоритм, позволяющий продвинуться еще дальше.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2007-06-26 01:57 pm (UTC)Запрос эксперта: Bush Iraq
no subject
Date: 2007-06-26 02:12 pm (UTC)no subject
Date: 2007-06-26 02:57 pm (UTC)no subject
Date: 2007-06-26 03:18 pm (UTC)Смысл ведь запросов на естественном языке не в том, чтобы дописать для красоты "почему" или "где купить" и знак вопроса.
Смысл в том, чтобы поисковик понимал связь слов в запросе.
no subject
Date: 2007-06-26 04:23 pm (UTC)no subject
Date: 2007-06-26 05:18 pm (UTC)Probably memoryless search engines will soon be obsolete. In many cases single query is not enough to describe the question.
no subject
Date: 2007-06-26 09:02 pm (UTC)Exactly, this especially can work better if the answer is expected to come from some message board or mail list. If I have computer question I often search for the form as I would ask it my computer manager, and frequently get exactly the question asked and answered.
(no subject)
From:NL question answering
Date: 2007-06-26 07:45 pm (UTC)no subject
Date: 2007-06-26 09:22 pm (UTC)hike "seattle *** area"
Так лучше?
no subject
Date: 2007-06-26 10:33 pm (UTC)(no subject)
From:no subject
Date: 2007-06-26 11:59 pm (UTC)no subject
Date: 2007-07-09 06:55 am (UTC)