Вот прямо сейчас нажимаю на кнопку, которая делает мой первый launch в гугле, т.е. запускает вживую что-то, что я сделал. Это что-то очень незначительное пока что, и на пользователях почти никак не отразится. Но все равно начало. Волнуюсь.
Я, наверное, могу сказать в очень общих чертах, над чем я работаю, если кому-то интересно. Главное, чем я занимаюсь - определенной частью веб-поиска, т.е. самой поисковой машины. Самое что ни на есть технологическое ядро Гугла, ну или одно из ядер, смотря как считать, их тут много. Это именно та область, куда хотелось в первую очередь. А кроме того еще работаю над некоторыми вещами в GMail, но это так, дополнительно и малую часть рабочего времени занимает, процентов 20-30.
no subject
Date: 2007-06-15 08:16 pm (UTC)no subject
Date: 2007-06-15 08:28 pm (UTC)no subject
Date: 2007-06-15 08:41 pm (UTC)Предложения, например, такие:
1. Распознавание текста на картинках (это целый большой проект, впрочем, и мне было бы удивительным, если бы в гугле никто им не занимался)
2. Ну, лично у меня была идея некоторой компьютеризации археологии (например , компьютеризированная реконструкция и sequencing черепков и прочая), но как бы это согласовывалось с бизнес-моделью гугля (whatever that is) - непонятно
3. Еще был один интэрэсный идэй, которым могу поделиться частным образом (про турызм)
4. Ну, поиск музыки по мелодии - что-то типа http://www.musipedia.org/, только лучше
5. Распознавание морфологии на разных языках (но я вижу, что тут в последнее время серьезный сдвиг и без моей помощи произошел, по крайней мере на русском и иврите)
6. Автоматическое определение языка, чтобы когда я забываю переключать клавиатуру (а я это делаю постоянно), поиск работал правильно
7. Исторический поиск: искать в сети, как она выглядела на определенную дату
8. Починить threading в гмейле, чтобы жж-шные дискуссии нормально отображались :)
9. Онлайновая читалка книг (могу отдельно поподробней)
10. Не знаю, может такое и есть: когда есть сильная корреляция на поиски по двум словам, предлагать купить второе слово тем, кто купил первое
11. Как в Амазоне: поиск на А говорит тебе: те, кто ищут А, часто ищут также Б
12. Куча улучшений desktop search (более ублюдочной программый еще не видел - разве что gmail notifier)
Как-то так.
no subject
Date: 2007-06-16 10:43 am (UTC)10. Это, положим, не нашего ума дело, откуда они бабки берут :-)
2. Опять-таки, завалят рекламой вот и будет доходно, в чём собственно проблема с бызныс-маделью?
7. А этого разве нет? Ой... А можно попросить гугль такую-то страничку за такую-то дату? А спутниковый снимок такого-то места в "прошлом и т.д." варианте?
8. Это действительно ":-)".
9. А это что?
3. Дэлытысь памылу.
Кстати, вот кто-то очень возбухал у Аввы в каментах, что нельзя искать на картах географические названия по-русски. А теперь можно (может журнал Аввы это и есть "то самое место"? :-). Правда не всегда находит, самое смешное это поиск слова "Фонтанка". Совсем не там окажешься, чем по "Фонтанка, набережная реки". А ещё почему-то Воронеж оказался... ну сами посмотрите где :-)
no subject
Date: 2007-06-16 08:55 pm (UTC)Теперь по некоторым твоим конкретным предложениям.
7. Полагаю, что у этого может быть куча юридических проблем. archive.org их обходит тем, что у них нет денег и с ними поэтому невыгодно судиться :)
2. Не очень понятно, как бы это выглядело.
9. Эта тема моему сердцу тоже очень близка (хоть я ничем в этой области не занимаюсь сам). Ты знаком с flash-интерфейсом Google Book Search? Как бы твоя идеальная читалка отличалась/походила на это?
12. Ни разу не пользовался dekstop search :)
На все остальное вынужден сказать "спасибо и no comments".
no subject
Date: 2007-06-16 09:46 pm (UTC)Мне казалось, что archive.org это обходит путем того, что по первому требованию снимает то, что у него требуют снять. Можно было бы поступать аналогично - я думаю, если после cease and desist сразу снимать, проблем быть не должно.
Там несколько направлений. Например:
1. Автоматическое восстановление керамики по черепкам (т.е., по сути дела, сборка трехмерного паззла). То же самое - в отношении, например, разбитых колонн: скажем, колонны парфенона были лет сто назад восстановлены, но неверно, теперь их воссоздают заново.
2. Автоматический sequencing. Возьмем, допустим, кувшин. Если посмотреть на него в разрезе, мы увидим некую кривую. Допустим, у нас есть некоторое количество overlapping shards, из которых, впрочем, целый кувшин составить нельзя. На данный момент восстановить на основании их форму кувшина представляется делом утомительным и даже не всегда возможным. Что можно делать - генерировать для каждого черепка его кривую (что само по себе совсем нетривиально), затем делать мэтчинг получившимся частичным sequences, что позволит автоматически выстраивать заново весь sequence - т.е., восстанавливать форму кувшина. Для этого потребуется сравнительно небольшое количество черепков, относительно общей площади поверхности кувшина.
3. Далее, если предположить, что форма кувшина, или какая-то его часть, является характерной для того или иного стиля, определение формы (см. №2) позволит быстро и с высокой вероятностью определять принадлежность кувшина той или иной культуре. Это потребует, разумеется, preprocessing уже имеющихся данных, но зато возможно и послужит проверкой имеющихся теорий.
Это только то, что касается керамики. Есть еще множество неохваченных областей (как пример - визуализация археологических сайтов со множественными культурными слоями).
Например, она бы помнила позицию внутри книги для каждого читателя. Вообще чего я не понимаю - это почему гугль не пытается продвигать платные электронные книги - пока что все, что я видел в отношении книг, права на которых не находятся в открытом доступе - это отсылка в магазины. А ведь гугль - это именно тот гигант, который мог бы сдвинуть с места паблишеров, и добиться продажи е-буков по сносным ценам!
Тебе ОЧЕНЬ повезло. Это ОЧЕНЬ кривая программа.