Entry tags:
об утечке из фейсбука и моей фамилии
Пару недель назад в публичный доступ попала массивная утечка данных из Фейсбука: имя, фамилия, и номер телефона (плюс еще немного по мелочи, но не содержимое постов или что-то в этом духе) 500 миллионов пользователей - примерно 20% всех пользователей ФБ.
Я скачал быстро файлы по России и Израилю (там большой текстовый файл отдельно для каждой страны) и проверил, кто из семьи-друзей оказался там, а кто нет, просто из любопытства, а потом не знал особо, что с этим делать. Но потом все-таки придумал одну простую вещь. По сути, как кто-то остроумно заметил, эта утечка - первая общемировая телефонная книга, правда, неполная, но все равно, какие-то тренды по именам и фамилиям в ней можно отслеживать, например.
Моя фамилия - Воробей, но я давно привык к тому, что ее часто неправильно пишут Воробьев, потому что Воробьев - намного более частая фамилия, чем Воробей, по причинам, которые мне не вполне понятны. Но как минимум я смог это проверить по этой утечке из фейсбука. И действительно, суммируя по разным написаниям этих фамилий, а также женскому варианту (Воробьева), я посчитал, что кол-во людей с фамилией "Воробей" в этой базе данных из Фейсбука примерно 4% от кол-ва людей с фамилией "Воробьев/а", в 25 раз меньше.
Не сказать, чтоб супер важное исследование или супер полезные данные, но если кому-то нужно что-то такое, то да, это пол-миллиарда имен-фамилий-стран-городов-телефонов.
Я скачал быстро файлы по России и Израилю (там большой текстовый файл отдельно для каждой страны) и проверил, кто из семьи-друзей оказался там, а кто нет, просто из любопытства, а потом не знал особо, что с этим делать. Но потом все-таки придумал одну простую вещь. По сути, как кто-то остроумно заметил, эта утечка - первая общемировая телефонная книга, правда, неполная, но все равно, какие-то тренды по именам и фамилиям в ней можно отслеживать, например.
Моя фамилия - Воробей, но я давно привык к тому, что ее часто неправильно пишут Воробьев, потому что Воробьев - намного более частая фамилия, чем Воробей, по причинам, которые мне не вполне понятны. Но как минимум я смог это проверить по этой утечке из фейсбука. И действительно, суммируя по разным написаниям этих фамилий, а также женскому варианту (Воробьева), я посчитал, что кол-во людей с фамилией "Воробей" в этой базе данных из Фейсбука примерно 4% от кол-ва людей с фамилией "Воробьев/а", в 25 раз меньше.
Не сказать, чтоб супер важное исследование или супер полезные данные, но если кому-то нужно что-то такое, то да, это пол-миллиарда имен-фамилий-стран-городов-телефонов.