Блог

18 июня
2012

Сбор данных

Мир полон данных. Ежесекундно, каждый из нас снимает множество показателей, сам того не осознавая. Небольшая часть этих данных становится информацией, которой мы пользуемся — эмпирическими патернами, которые помогают нам делать предположения и принимать решения на их основе:

Мы видим надвигающиеся тучи и берем зонт. Мы рассчитываем траекторию и скорость сразу нескольких автомобилей, чтобы перейти дорогу. Мы планируем покупки исходя из своего бюджета и его ежемесячного пополнения.

Данные объективны

Но люди не машины: даже самые осознанные индивиды не способны собирать совершенно достоверную и беспристрастную статистику о себе и мире. Таково устройство нашей психики — мы предвзяты и субъективны. Кроме этого, мы ограничены чисто технически: органами своих чувств и объемом памяти.

Сложно назвать это совпадением, но сколько он себя помнит, человек всегда стремился формализовать сбор данных о мире. История такой, какой мы ее знаем возможна только благодаря записям, имеющим формальную и рациональную константу. Иная история — предмет творчества и мифологии. Это касается не только истории мира до появления письменности, но и самых рутинных событий сегодняшнего дня. Осознанно или нет, человек акцентирует внимание на том, что кажется ему важным, и выбрасывает остальное.

И правильно, потому что выделять и окрашивать главное удается ему интересней и лучше всего, а для остального есть более точные инструменты.

Сбор данных о себе

Появление мобильных и умных устройств сделали сбор персональных статистических данных доступным для широкой публики. Разумеется, это не означает, что широкая публика сразу кинулась этими инструментами пользоваться, но определенная группа людей, дотошно снимающих с себя показатели, растет и развивается. Развивается во многих направлениях, ибо объективные данные о себе дают возможность принимать информированные, а значит более верные решения относительно себя.

Daytum — сервис, созданный Николасом Фелтоном (Nickolas Felton), известным своими годовыми отчетами о себе. Openpaths — приложение, отслеживающее передвижения своего владельца. Happiness report — открытое исследование, отслеживающие состояние участников и связанные с ним активности.

Сбор данных сетей

Более того, данные собирают даже те, кто задумывается об этом меньше всего: популярные социальные сервисы агрегируют огромное количество данных просто фиксируя поведение своих пользователей. В результате мы имеем огромный массив данных, исследуя которые, можно получать довольно впечатляющие корреляции:

Данные о переключении абонентов между сотовыми вышками Женевы можно транслировать в городской пульс, что и было сделано в рамках проекта Ville Vivante.

Качество данных

Не удивительно, что практика последовательного сбора данных и уважения к ним, развита в странах, где стремление к объективному познанию заложено в самой культуре. Только с завистью можно смотреть на западные национальные и городские проекты, основанные на статистических данных поразительной точности.

Данные выборов президента США в 2008 году.

Так же не удивительно (и вместе с тем невыразимо печально) смотреть на результаты работы наших статистических, метеорологических, геодезических и служб и избирательных комиссий.

В объективных данных у нас просто не возникало необходимости более 70 лет: опыт всесоюзной переписи 37-го года показал, что они только мешают. Именно поэтому открытые и честные проекты, собирающие и структурирующие данные о нашем государстве и его жителях, важны невероятно, не говоря уже о проектах, которые эти данные анализируют и интерпретируют.

Статья Сергея Шпилькина о данных российских выборов и очевидности их фальсификации.