/ из чего состоят данныеВообще, о производстве данных у нас будет целое занятие. Но пока — не о производстве, а о структуре.
Начнём мы не с того, откуда они берутся вообще, а с момента столкновения с данными. Это жизненная или рабочая ситуация, любая из описанных выше. Например, принятие решения о том, что надеть: собираясь на улицу, мы смотрим в телефоне, сколько градусов и идёт ли дождь (и опираемся на данные).
Мы можем высунуть нос на улицу, и тогда у нас будет ощущение.
Но нередко при сравнении мы поверим цифрам. Ведь у данных высокий
эпистемический авторитет — мы доверяем им (иногда больше, чем ощущениям или другим источникам знания и переживания о мире).
Обращаясь к данным, мы имеем дело с их
визуализацией или репрезентацией. Например, в случае погоды это облака или солнце, а также количество градусов. Прогноз погоды на телевидении снабжается иногда ещё и красочным фильмом о передвижениях циклона.
Но за визуализациями стоит другая визуальная форма представления данных. Она часто является чем-то вроде исходного материала и находится «за» оформленной картинкой/графиком. Обычно это табличка, в которой собраны материалы о наблюдениях, скажем, за погодой. Табличка — тоже форма представления данных. Такие же записи можно делать в блокноте или вордовском файле. Но табличка позволяет совершать с данными операции, с помощью которых можно выявлять закономерности, легко подсчитывать и даже прогнозировать. (Подробнее: Drucker, 2011)
Чтобы поместить данные в табличку, нужно сначала продумать
механизм сбора и анализа данных: понять, что именно мы будем узнавать, потом осуществить эту операцию, а потом — обработать то, что собрано. Часто о собранном, но несортированном говорят, что это «сырые данные». На деле они никогда не «сырые», так как им предшествует: а) выделениеобласти мира, которую мы будем изучать, и б) вопросы, которые позволят классифицировать это изучение, чтобы потом представлять данные (в). Получается, на входе нам уже нужно вообразить желаемый результат — что с собранным будет происходить. (Подробнее: Gitelman, 2013)
Ещё в данные всегда включены
инструменты, с помощью которых их собирают. Например, данные о температуре можно собирать не только с помощью термометров в разных частях города. Даже если физически вы не находитесь в конкретном месте, вы можете соотнести другие данные, использовать определённые показатели — и (таким образом) рассчитать температуру с огромной точностью. То есть мы можем больше доверять механизмам, людям, математическим формулам и так далее. Заметьте, слово «доверие» возникает уже не в первый раз! И это неспроста: мы доверяем инструментам, предполагая доверие самим данным.
пример:
В этом
ролике затрагивается важная тема того, как устроена работа с данными по COVID-19, в том числе с данными, закрытыми от публичного доступа, как в Китае. Собеседники говорят о том, как важно подобрать корректную визуализацию, чтобы донести до людей свою мысль и обеспечить ясное понимание происходящего. Нужно помнить, что визуализация как представление данных — это публичный рассказ, ориентированный на аудиторию (а не просто картинка).
Интересно, что такой подход не всегда уменьшает авторитета данных в целом. Но почему, несмотря на скептические замечания о данных в медиа или науке, наше доверие к цифрам всё же велико, и числовые показатели продолжают влиять на нашу жизнь? При каких обстоятельствах мы перестаём полагаться на цифры?