avva: (Default)
[personal profile] avva
Яндекс сделал поиск по комментам.

Технически это, конечно, отличная штука. Друзья, вы молодцы и спасибо вам.

Тем не менее (неизбежное темнеменее), в том, что касается privacy -- это очень опасная штука. Присоединяюсь к точке зрения пользователя [livejournal.com profile] bigbang, очень ясно и убедительно высказанной здесь.

Date: 2007-10-31 09:01 pm (UTC)
From: [identity profile] kouzdra.livejournal.com
Не вижу никакой особенно опасности. Когда Вы пишете на форуме - ваши комментарии (обычно) индексируются. И никого это не смущает.

Да

Date: 2007-10-31 09:18 pm (UTC)
From: [identity profile] valshooter.livejournal.com
Во всех форумах есть стандартная фича "найти все сообщения этого пользователя".

Иногда она доступна только зарегистр. пользователям, но при свободной регистрации это не проблема.

Другое дело, что ЖЖ всё же не форум.

Мой внутренний параноик ликует.

Re: Да

Date: 2007-10-31 09:19 pm (UTC)
From: [identity profile] kouzdra.livejournal.com
Я о Гуголе говорю.

Сорри, не понял сразу

Date: 2007-10-31 09:24 pm (UTC)
From: [identity profile] valshooter.livejournal.com
Ну гуглом утомительно искать все комментарии одного ЖЖ-пользователя.

Что же до нарушения прайваси: мне очень не понравилось, когда яндекс.ппб стал обращать внимание на ЖЖ-чекбокс о запрете индексации.

Логика "есть RSS - значит блог, и блог публичный" была железной и непробиваемой. Но нет, они пошли на уступки, и в результате сейчас получат свежие вопли пользователей.

Re: Сорри, не понял сразу

Date: 2007-10-31 09:29 pm (UTC)
From: [identity profile] kouzdra.livejournal.com
Ээээ. Я не об этом. Им можно куда более интересные вещи на некоторых форумах найти. Про меня в том числе тоже довольно интересные. Я, по крайней мере, некоторое время думал на эту тему, прежде чем писать.

Что же до нарушения прайваси: мне очень не понравилось, когда яндекс.ппб стал обращать внимание на ЖЖ-чекбокс о запрете индексации.

Это просто соблюдение общепринятого правила хорошего тона - robots.txt положено уважать (правильно положено - иначе поисковых ботов начнут блокировать техническими средствами - что несложно - так что лучше уж без мордобоя)

С моей точки зрения индексирование комментов должно определяться индексирование блога, в котором они пишутся.

Date: 2007-10-31 09:36 pm (UTC)
From: [identity profile] valshooter.livejournal.com
Индексирование комментариев: да, по блогу в котором пишутся. Они технически расположены "на домене" запрещенного блога, соответственно и в robots.txt индексирование запрещено. Это всё область старого доброго HTML, ничего нового.

А вот с индексацией RSS получается не всё так просто. Это формат для синдикации данных. Если есть RSS, то его можно индексировать.

Потому что иначе очень просто ситуация доводится до абсурда. Для кого пишется robots.txt? Для роботов. Т.е. для всех нечеловеков. В частности, роботы Google.Readerа и Яндекс.Ленты должны подчиняться правилам из robots.txt

Тогда запрещенный к индексации журнал становится недоступным для трансляции тоже. Но это не так, роботы читалок прекрасно игнорируют ЖЖ-запрет (User-Agent: * Disallow: /)

Date: 2007-10-31 10:18 pm (UTC)
From: [identity profile] kouzdra.livejournal.com
С RSS до сих пор вопроса не возникало, потому что они задумывался как широковещательный формат. Там подобные ограничения странны.

Date: 2007-10-31 10:28 pm (UTC)
From: [identity profile] valshooter.livejournal.com
Ну так яндекс.ППБ именно RSS индексирует.

И насколько я помню, сначала ППБ игнорировал robots.txt

Потом, после запуска, начал его учитывать — по просьбам многочисленных параноиков. Пошёл на поводу.

История повторяется. Теперь параноики будут истерично требовать, чтобы Яндекс.ППК не индексировал комментарии тех пользователей, которые поставили птичку о запрете индексирования — и не только в своём журнале (что логично с точки зрения HTML и robots.txt) но и вообще везде.

Re: Сорри, не понял сразу

Date: 2007-10-31 11:50 pm (UTC)
From: [identity profile] slobin.livejournal.com
robots.txt был придуман не для этого. Смысл создания этого файла в далёком 1994 году был не в "я не хочу, чтобы эта информация индексировалась" (такой абсурд тогда никому в голову прийти не мог), а "вы, вероятно, не хотите индексировать эту информацию" (например, потому, что эта страница динамическая и её содержимое меняется при каждом обращении, или потому, что это дерево документов полностью дублирует находящееся где-то в более правильном месте). Такой взаимовыгодный договор -- вы не перегружаете мой сервер лишними запросами, а свой -- бесполезной информацией в индексах. Потом как-то незаметно прагматика robots.txt сменилась с "подсказка" на "запрет".

Сама идея информации "для глаз, но не для роботов" бессмысленна. Нет, не потому, что она чем-то морально плоха (я бы предпочёл жить в мире, где эти понятия разделены), а потому, что она нереализуема. Утверждение, что "поисковых ботов начнут блокировать техническими средствами, что несложно", мне кажется необоснованным. Ну то есть да, крупные поисковики, индексирующие всё, и впрямь несложно заблокировать, но мой маленький самописный скриптик, выполняющий прицельный data mining интересных мне лично людей -- что вы с ним сделаете? А потом, рано или поздно, кто-нибудь придумает распределённый p2p поисковик.

... Ускорение темпов роста повышения производительности труда ...

Date: 2007-10-31 09:19 pm (UTC)
From: [identity profile] sunch.livejournal.com
Можно иметь разные ники на разных форумах.

И конечно ключевой момент тут - резкая смена правил игры.

Date: 2007-10-31 09:20 pm (UTC)
From: [identity profile] kouzdra.livejournal.com
Ну дело вкуса. Но у меня в этом смысле привычки выработаны фидошкой, в которой - что вылетело - то вылетело. Не только проиндексируется, но и удалить невозможно.

Date: 2007-10-31 09:24 pm (UTC)
From: [identity profile] sunch.livejournal.com
Ключевое слово тут - "у меня" ;)

Date: 2007-10-31 11:56 pm (UTC)
From: [identity profile] slobin.livejournal.com
И конечно ключевой момент тут - резкая смена правил игры.

Ключевой момент тут -- нерезкая (ползучая) смена правил игры до этого. При создании сетей (в том числе www) правило "вся информация может индексироваться" было заложено изначально. Потом как-то незаметно, без объявления войны, были протащенны с улицы правила о privacy, не-то-чтобы-приватной и не-то-чтобы-публичной информации, и прочая подобная фигня. Это не новые правила игры, это хорошо забытые старые правила игры. А если кто-то что-то хорошо забыл, ему об этом напомнят. Возможно, болезненно.

... Каждый заблуждается в меру своих возможностей ...

Date: 2007-11-01 06:15 am (UTC)
From: [identity profile] sunch.livejournal.com
"Как-то незаметно" эти правила появились фактически одновременно с появлением многопользовательских блоговых систем (читай ЖЖ) - то есть именно тогда, когда необходимость в них возникла, и просуществовали по большому счету без изменений лет эдак семь - а это, на минуточку, половина срока существования WWW as we know it. Так что - именно резкая смена правил.

February 2026

S M T W T F S
1 2 3 4 5 67
8 9 10111213 14
15 16 17 18192021
2223 2425262728

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 24th, 2026 06:54 pm
Powered by Dreamwidth Studios