/ из чего состоят данные
Вообще, о производстве данных у нас будет целое занятие. Но пока — не о производстве, а о структуре.
Начнём мы не с того, откуда они берутся вообще, а с момента
столкновения с данными. Это жизненная или рабочая ситуация, любая из описанных выше. Например, принятие решения о том, что надеть: собираясь на улицу, мы смотрим, сколько градусов и идёт ли дождь. Мы можем высунуть нос на улицу, и тогда у нас будет ощущение (кстати, оно тоже используется в прогнозах и data-based описаниях: например, когда пишут, что на улице -2, но чувствуется как все -10).
Но уже стоит иметь в виду, что у данных высокий эпистемический авторитет — мы доверяем им (иногда больше, чем ощущениям или другим источникам знания и переживания о мире).
Обращаясь к данным, мы имеем дело с их
визуализацией или репрезентацией. Например, в случае погоды это облака или солнце, а также количество градусов. Прогноз погоды на телевидении снабжается иногда ещё и красочным фильмом о передвижениях циклона.
Но за визуализациями стоит другая визуальная форма представления данных. Она не всегда предшествует, а часто является чем-то вроде черновика и оказывается «за» уже оформленной картинкой/графиком. Обычно это
табличка, в которой собраны материалы о наблюдениях, скажем, за погодой. Табличка — тоже форма представления данных. Такие же записи можно делать в блокноте или вордовском файле. Но табличка позволяет совершать с данными операции, с помощью которых можно выявлять закономерности, легко подсчитывать и даже прогнозировать.
(Подробнее: Drucker, 2011)Чтобы поместить данные в табличку, нужно сначала продумать механизм
сбора и анализа данных: понять, что именно мы будем узнавать, потом осуществить эту операцию, а потом — обработать то, что собрано. Часто о
собранном, но несортированном говорят, что это «сырые данные». На деле они никогда не «сырые», так как им предшествует: а)
выделение области мира, которую мы будем изучать, и б) вопросы, которые позволят классифицировать это изучение, чтобы потом представлять данные (в). Получается, на входе нам уже нужно вообразить желаемый результат — что с собранным будет происходить.
(Подробнее: Gitelman, 2013)Ещё в данные всегда включены инструменты, с помощью которых их собирают. Например, данные о температуре можно собирать не только с помощью термометров в разных частях города. Даже если физически вы не находитесь в конкретном месте, вы можете соотнести другие данные, использовать определённые показатели — и (таким образом) рассчитать температуру с огромной точностью. То есть мы можем больше доверять механизмам, людям, математическим формулам и так далее. Заметьте, слово «доверие» возникает уже во второй раз. И это связанные вещи: мы доверяем инструментам, предполагая доверие самим данным.
(Нам ещё предстоит подробно обсудить тему доверия, но лишь после того, как вы поработаете над заданием по автоэтнографии. В рамках задания вам сначала нужно будет понаблюдать за собой просто так, без использования каких-либо инструментов селф-трекинга, а затем вы повторите то же самое наблюдение, но с тщательной фиксацией данных. В заключительной части вам нужно будет соотнести два процесса и подумать о сходствах и отличиях в результатах.)
пример:
В этом
ролике затрагивается важная тема того,
как устроена работа с данными по COVID-19, в том числе с данными, закрытыми от публичного доступа, как в Китае. Мне показалось интересным, что собеседники говорят о том, как важно подобрать корректную визуализацию, чтобы донести до людей свою мысль и обеспечить ясное понимание происходящего. Нужно помнить, что визуализация как представление данных — это публичный рассказ, ориентированный на аудиторию (а не просто картинка).
Интересно, что такой подход не всегда уменьшает авторитета данных в целом. Но почему, несмотря на скептические замечания о данных в медиа или науке, наше доверие к цифрам всё же велико, и числовые показатели продолжают влиять на нашу жизнь? При каких обстоятельствах мы перестаём полагаться на цифры?