Манипуляция восприятием - вот чего стоит бояться

Источник: expert

"Мне не очень жалко людей, которые считают, что все в интернете правда". Интервью с Артуром Хачуяном, генеральным директором Tazeros Global Systems, программистом, специалистом по обработке больших данных

Все приложения - фейсбук, гугл - говорят: мы, мол, используем алгоритмы только для того, чтобы подобрать для вас релевантный контент. Это ложь. Алгоритмы ушли дальше, и они уже давно не предлагают релевантный контент. Они манипулируют вашим восприятием, они ведут вас в определенную сторону

Артур Хачуян в IT-среде признан как один из лучших в России специалистов, создавших инструменты для работы с большими данными. Его рекомендуют как отличного программиста, задающего тренды, и к тому же как человека, который достаточно свободно рассказывает о том, как сам зарабатывает на больших данных пользователей соцсетей. Мы поговорили с ним о секретах слежки за пользователями соцсетей, о торговле их данными, о том, кто и как зарабатывает на наших лайках и репостах. И о том, как при заключении договора с клиентом, происходит еще одна сделка - с совестью.

- Вы не могли бы объяснить по-простому, что такое "большие данные"?

- Это просто набор алгоритмов и подходов к анализу сверхбольших массивов данных. Например, раньше мы имели данные о десяти жителях, и они могли храниться в картотеке на карточках, а теперь у нас есть данные о миллионе, и для того, чтобы их обрабатывать, нам нужны новые подходы. Что такое, например, библиотечная картотека? Способ хранения и систематизации данных. Раньше у нас там лежало сто записей, но сейчас в одном инстаграме каждый день происходит миллиард транзакций. И все это счастье нужно где-то хранить, обеспечивать скорость хранения, скорость записи, доступ в реальном времени к этим данным.

- А что еще хранят эти данные, кроме моих лайков в инстаграме?

- Основной источник данных, находящихся сейчас в обороте, - это данные людей. Мы цифровая валюта. За последние десятилетия люди начали создавать огромное количество данных, поэтому и такой бум больших данных сейчас.

- Но все-таки что это за данные?

- Если мы говорим о системе геоаналитики, то там основным источником информации является перемещение пользователя, то есть человек, его координаты и время перемещения. Мы знаем, где он находился в каждый момент времени. Это может быть база данных мобильного оператора или московского общественного транспорта, в котором стоят джипиэсники и каждую секунду отправляют информацию о том, где находится конкретный автобус. Есть база данных соцсетей, в которой хранится информация о потребляемом человеком контенте, грубо говоря, о его интересах. Например, я наклеил на автобус набор рекламы и хочу знать, сколько человек на нее посмотрит. Для этого я собираю данные из трех баз: первая - мобильного оператора, который хранит данные о ваших перемещениях, вторая - о том, где едет транспорт в конкретный момент времени, третья - ваши интересы. Все эти данные я сваливаю в одну базу. Дальше я строю такие геополигончики и понимаю, какие люди были рядом с каким автобусом в какой момент времени. На основании этих трех источников я могу построить аналитическое решение для операторов наружной рекламы.

- А я подхожу к автобусу, вижу на нем рекламу того, о чем размышляла, купить или не купить, и думаю: "О, это знак свыше!"?


Страница сайта http://www.interface.ru
Оригинал находится по адресу http://www.interface.ru/home.asp?artId=40166