Я сам несколько раз сталкивался с тем, что Гугл проиндексировал страницу с какого-то вебсервера, которая представляла из себя копию какой-то ещё страницы из кэша Гугла. Так что можно сказать, что Гугл а это случае проиндексировал свой кэш.
Гугль кэширует только то, куда ходит его робот (кто бы мог подумать). Чтобы запретить роботу Гугля ходить в свой кэш, специальный код не нужен, достаточно общего кода, обрабатывающего robots.txt (http://www.google.com/robots.txt). Заодно гуглевый кэш не индексируют и не кэшируют другие поисковики.
Что действительно смешно, а главное бывает в жизни - сделать мыл-сервер на каком-нить IP с каким-нить доменом (например 10.10.10.10 и kewlserver.org) и в настройках мыл-сервера не приписать его к этому домену. Потом шлём письмо, например test@kewlserver.com. Что имеем? Резолвится IP 10.10.10.10, сервер принимает письмо для дальнейшей обработки, смотрит домен - kewlserver.com не прописан как "свой", надо письмо переслать. Куда? На IP 10.10.10.10 <: Шлём... Принимаем... Шлём...
Может я неясно выразился, но, наверное, все всё-таки мою мыслю поняли (:
no subject
no subject
Date: 2003-07-05 03:10 pm (UTC)no subject
Прошу обратить внимание на disclaimer
Re:
Date: 2003-07-05 03:27 pm (UTC)Но всё-таки это кэш самого Гугля, а не его кэша.
no subject
Date: 2003-07-05 03:56 pm (UTC)Re:
Date: 2003-07-05 03:58 pm (UTC)no subject
Date: 2003-07-05 03:31 pm (UTC)Вот заставить два мейл-сервера друг другу письма форвардить, вот это смешно. ;-)
no subject
Date: 2003-07-06 05:48 pm (UTC)no subject
Date: 2003-07-07 03:00 am (UTC)no subject
Date: 2003-07-08 05:41 pm (UTC)