​Данные из горожан

Как власти будут использовать big data

​Данные из горожан


«Операторы сотовой связи продают московским властям данные о перемещениях граждан, которые позволяют отслеживать их местонахождение с точностью до 500 метров», — сообщили на днях «Ведомости». Департамент информационных технологий (ДИТ) Москвы закупает геоаналитику с 2015 года и потратил на нее за это время 516 млн рублей из городского бюджета. В прошлом году информация о том, где живут, работают и как перемещаются по городу москвичи, обошлась мэрии более чем в 100 млн рублей.

Первые ласточки «умного города»

Операторы определяют передвижение десятков миллионов своих абонентов с помощью SIM-карт: примерно каждые 5 минут телефон отправляет сигнал на базовые станции связи. Далее полученные таким образом маршруты перемещения абонентов накладываются на карту города.

Радиопеленгация работает не так эффективно, как GPS, зато заблокировать трекинг пользователь не может, даже если отключит функции геолокации на своем девайсе. Единственный способ решения проблемы для параноиков — полностью отказаться от устройств, которые имеют возможность установки SIM-карты, и коммуницировать только через точки Wi-FI, говорит юрист «Роскомсвободы» и «Центра цифровых прав» Саркис Дарбинян.

Официальная цель сбора геоданных — планирование городской технической транспортной инфраструктуры. Например, маршруты абонентов помогают принять решение о том, где лучше построить еще одну дорожную развязку, а где — автобусную остановку или станцию метро.

Один из популярных запросов столичных властей — анализ потоков людей в наиболее загруженные утренние (8.00–9.00) и вечерние часы (18.00–19.00). «Для департамента информационных технологий Москвы мы определяем предпочтения местных жителей в выборе транспорта. Эта информация помогает городу настраивать светофоры, строить развязки и расширять магистрали», — уточнили «Новой» в пресс-службе «Tele2 Москва».

Другой пример. Демографическая информация о том, какую часть населения составляют молодые семейные пары в возрасте 29–37 лет, помогает администрациям планировать строительство школ, детских площадок и садов. Основными заказчиками геоаналитики выступают городские администрации, подтверждают в «Tele2».

Если раньше специалисты по городскому планированию для анализа транспортных потоков могли использовать только приблизительные расчетные модели, то использование технологий big data открывает принципиально новые возможности. «Сегодня есть возможность понять по факту, сколько людей находятся в пути из точки А в точку В и в какое время. Конечно, эти данные пока несовершенны, но для калибровки существующих моделей они совершенно незаменимы», — объясняет научный сотрудник Института экономики транспорта и транспортной политики Константин Трофименко.

Анализ больших данных для оптимизации систем городского транспорта — это первая ласточка будущего «умного города», в котором за каждым решением городских властей стоят соответствующие расчеты. «Абсолютно все процессы в «умном городе» измеряемы: транспорт, энергопотребление, количество мусора, количество привезенных продуктов питания и так далее. На основании измерений собираются данные и обрабатываются по алгоритмам, после чего городской робот сам решает, как дальше оптимально размещать ресурсы», — рассказывает эксперт.

Вернуть данные народу

После того, как рынок традиционных услуг мобильных операторов — звонки и СМС — достиг пика и начал уступать интернету, телеком-индустрия повернулась в сторону монетизации данных абонентов. И это вполне ожидаемый ход: операторы знают о своих пользователях не меньше, чем крупнейшие интернет-компании (доход, демография, потребительские привычки). Причем сконцентрированы эти информационные залежи в руках большой четверки: «Мегафона», МТС, «Вымпелкома» и «Tele2».

Данные абонентов обезличены и не привязаны ни к номеру телефона, ни к паспортным данным, уверяют операторы. «Например, мы знаем, что абонент № 123 с 12 ночи до 8 утра был в районе Кузьминки, дальше пробыл 10 часов в районе Шаболовки и вернулся назад. Вероятно, он живет в Кузьминках, а работает на Шаболовке, но определить этого человека мы не можем», — поясняет Трофименко. Впрочем, теоретически идентифицировать человека по обезличенным данным можно, говорит директор АНО «Информационная культура» Иван Бегтин — например, установить личность по адресу, почтовому индексу и дате рождения.

В настоящее время в России нет законодательства, регулирующего рынок «больших данных». Закон о персональных данных (152-ФЗ) запрещает обработку персональных данных и их передачу третьим лицам без согласия их владельца. Однако он не учитывает последние технологические возможности и потребности компаний в больших массивах обезличенной информации, утверждает Саркис Дарбинян. Сейчас клиенты сотовых операторов дают согласие на обезличенную обработку своих персональных данных, когда подписывают абонентское соглашение.

Прошлой осенью депутаты попытались вывести рынок «больших данных» из «серой зоны». В октябре 2018-го депутат-единоросс Михаил Романов внес на рассмотрение законопроект о регулировании «больших данных», в рамках которого нужно было сформулировать определение «больших данных», а Роскомнадзор должен был создать «Реестр операторов больших пользовательских данных». Необходимость инициативы объяснялась «правовым вакуумом в сфере регулирования больших пользовательских данных» в России. Закон, в частности, подразумевал введение запрета на идентификацию конкретного человека при обработке больших пользовательских данных, если только речь не идет об оперативно-разыскной деятельности. Тем не менее на законопроект пришел отрицательный отзыв из профильного комитета Госдумы, а заключение из правительства не пришло совсем. Депутаты критиковали инициативу за необходимость выделения бюджетных средств на создание реестра, а рабочая группа «Цифровой экономики» — за торможение развития российских технологий и неточное определение понятия «больших данных», которое пересекалось с определением персональных данных. В итоге законопроект вернули на доработку.

«Думаю, что в течение 2019 года будет принят какой-то модульный закон, об этом уже неоднократно говорили чиновники и эксперты, которые занимаются вопросами легализации рынка «больших данных», — считает Саркис Дарбинян. Иван Бегтин возражает, что России нужна национальная стратегия работы с данными, а не отдельный закон о «больших данных» (само понятие «больших данных» он считает скорее маркетинговым термином, чем определением самих данных).

Главная проблема, по словам экспертов, заключается в том, что россияне не могут управлять теми данными о себе, которые копятся в различных системах: от банковской истории до баз данных госуслуг.

Часто люди даже не знают, какую информацию они передали сторонним сервисам или государству.

«Граждане должны иметь право как в частной, так и в государственной системах затребовать все документы о себе, как это устроено, например, в медицине. А сейчас, если вы придете в правительство Москвы и запросите все данные о вас, то вам их просто не дадут», — объясняет Бегтин.

Технократы из мэрии

Использование новых технологий в целях общественного блага, например, для создания более эффективной инфраструктуры общественного транспорта или для обеспечения общественной безопасности — это общемировая тенденция, которая дает впечатляющие результаты. Сейчас в развитии «умного города» Москва отстает от передовых мегаполисов лет на пять, но развивается быстрее, чем они, оценивает Трофименко.

Московские власти хорошо понимают, что делают, и обладают квалифицированной IT-командой, подтверждает Бегтин. Но обратная сторона цифровой грамотности мэрии — высокая степень закрытости информационных систем и отсутствие механизмов общественного контроля.

Технологии big data уже не раз оказывались замешаны в политических скандалах. К примеру, американский стартап Geofeedia, который отображал на карте скопления людей и отслеживал их публикации в социальных сетях, сотрудничал с американской полицией в области слежки за активистами движения Black Lives Matter, протестующих против убийств темнокожих людей полицейскими. После того как об этом стало известно, Facebook, Twitter и Instagram отрезали Geofeedia доступ к геокодированию, и стартап потух.

Но такие разработки для борьбы с митингами могут существовать и в закрытом режиме, полагает Бегтин. «Вполне можно отслеживать коммуникации людей, которые находятся на определенной территории. Или устанавливать камеры для распознавания лиц на избирательных участках. Это может быть дорого, но технически не так сложно».

Источник: Арнольд Хачатуров, Лилит Саркисян