Большие данные или все мы под колпаком
В 2013 году вышла книга Viktor Mayer-Schonberger, Kenneth Cukier - "Big Data" (Большие данные). Книга о растущей способность обрабатывать огромные массивы информации, мгновенно их анализировать и получать порой совершенно неожиданные выводы. И как некоторые компании с успехом используют это в бизнесе. Но можно из книги сделать и другие выводы. Привожу некоторые отрывки из нее:
«…Почти сорок лет, вплоть до падения Берлинской стены в 1989 году, Министерство государственной безопасности ГДР (нем. Ministerium furStaatssicherheit — Stasi (Штази)) шпионило за сотнями тысяч людей. Около ста тысяч штатных сотрудников вели наблюдения с улиц и из окон автомобилей. Они вскрывали письма и заглядывали в банковские счета, прослушивали квартиры и телефонные линии.
… Спустя 20 лет после развала ГДР о каждом из нас собирается и хранится больше данных, чем когда-либо. Мы находимся под постоянным наблюдением: расплачиваясь кредитной картой, общаясь по сотовому телефону или предъявляя номер социального страхования для удостоверения личности.
Amazon отслеживает наши предпочтения в покупках, Visa и MasterCard — наши финансовые транзакции, Google - просматриваемые веб-страницы, а Twitter — мимолетные мысли. Facebook* успевает уловить все это сразу, наряду с нашими социальными отношениями.
Поскольку большие данные обещают ценные открытия тем, кто их анализирует, естественно ожидать стремительного увеличения числа тех, кто будет собирать, хранить и повторно использовать наши личные данные. Поскольку стоимость хранения будет так же стремительно падать, а аналитические инструменты — становиться все мощнее, размер и масштаб сбора данных станет расти не по дням, а по часам.
… Некоторые «умные» электросчетчики, которые внедряются в США и Европе, могут собирать от 750 до 3000 точек данных в месяц в режиме реального времени. Каждый прибор имеет уникальную «подпись нагрузки» при получении электропитания, которая позволяет отличить холодильник от телевизора, а телевизор — от подсветки для выращивания марихуаны. Таким образом, использование электроэнергии раскрывает личную информацию, будь то ежедневные привычки, медицинские условия или противозаконное поведение.
…В августе 2006 года компания AOL сделала общедоступными горы старых поисковых запросов под благовидным намерением дать исследователям возможность анализировать их в поисках интересных открытий. Набор данных из 20 миллионов поисковых запросов от 650 000 пользователей за период с 1 марта по 31 мая 2006 года был тщательно анонимизирован.
Тем не менее в течение нескольких дней сотрудники New York Times, связав поисковые запросы, такие как «одинокие мужчины за 60», «целебный чай» и «ландшафтный дизайнер в Лилбурне, Джорджия», успешно установили, что пользователь № 4417749 — это Тельма Арнольд, 62-летняя вдова из Лилбурна, штат Джорджия. «О Господи, это же вся моя личная жизнь! — сказала она журналистам Times, когда они наведались к ней в гости. — Я понятия не имела, что за мной подсматривают».
… Не только частный сектор пробует силы в области больших данных. Государственные органы тоже. Для обработки этих данных США строят гигантские центры, такие как здание АНБ в Форт-Уильямс, Юта, стоимостью в 1,2 миллиарда долларов. Все государственные органы, а не только спецслужбы по борьбе с терроризмом требуют больше информации, чем раньше. Когда список данных расширяется, включая сведения о финансовых операциях, медицинских картах, обновлениях статуса в Facebook* и пр., их собирается невообразимое количество. Государственные органы не в состоянии обработать столько
всего. Так зачем собирать?
Ответ на этот вопрос показывает, как изменился способ наблюдения в эпоху больших данных. В прошлом исследователи крепили щипковые зажимы к телефонным проводам, чтобы получить максимум информации о подозреваемом. Важно было как можно полнее изучить, что он собой представляет. Сегодня иной подход. Новое мышление (в духе Google и Facebook*) состоит в том, что люди — совокупность их социальных отношений, взаимодействий в интернете и связей с контентом. Чтобы полностью изучить человека, аналитикам нужно просмотреть как можно более широкий круг периферических данных — узнать не только с кем он знаком, но и с кем знакомы его знакомые и т. д. Раньше это было технически трудновыполнимо, а теперь — проще, чем когда-либо...» и т.д.
Таким образом и без Windows 10 мы все фактически находимся под «колпаком» компаний, которые имеют доступ к «большим данным», которые содержат нашу личную информацию. А учитывая, что большинство этих компаний американские, то и под колпаком АНБ.
* Запрещены в РФ
8 комментариев
9 лет назад
Удалить комментарий?
Удалить Отмена9 лет назад
Удалить комментарий?
Удалить Отмена9 лет назад
Удалить комментарий?
Удалить Отмена9 лет назад
У нас это выглядит как НОМЕ НОМЕ, 99 лет, Урюпинск (по этому показателю там еще +100500 тыщ проживает), учился в несуществующем институте... Или еще более не связанные слова. Ясен перец что можно смотреть еще что то... но это тяжелее...
Удалить комментарий?
Удалить Отмена