/ данные и политика. структура и родственники данных.Но теперь перейдём к концептам, которые связаны с понятием данных.
Связь между 1) машинами, 2) измерениями общества и 3) отдельных людей и анализом этого всего в рамках наук — очень старое явление.
Обследования населения и имущества затевались ещё в древнем мире, например, они были нужны при сборе налогов, чтобы рассчитывать сумму налога с каждого человека или дела, а также понимать устройство бюджета государства. Неудивительно, что они наследуют с тех времён и возможности, и проблемы этого процесса: те, кто собирает данные, оказываются сильнее, а те, кто их отдаёт — оказываются подсчитанными, объективированными, узнанными. И, конечно, многие поэтому и не любят сборщиков данных.
Уже на этом старинном примере видно, что данные связаны с властью. Эта связь не всегда такая линейная, как при разговоре о сборе налогов. И стоит иметь в виду, что действуют не только люди, но и инструменты, и методы. На деле речь идёт и об инструментах, и о том, что учитывается, а что — нет. А значит, об инструментах и понятиях, которые работают вместе с данными. (Подробнее: Vis, 2013)
Вместе с обращением к данным для увеличения эффективности или политических задач государства, возникает и вопрос о том, что и кто становится
источником или ресурсом для данных. Ведь далеко не всегда они же, став ресурсом, оказываются выгодополучателями. И вообще, не факт, что нам нужно тут рассуждать в таких терминах рынка и производства, когда речь идёт о судьбах людей. Из необходимости понять, как формируется этика работы с данными — происходит и часть критики, и беспокойства. А также стремление сделать процедуры, связанные с данными, понятными разным людям — так, например, возникает понятие data literacy, цифровой грамотности.
Но мы будем больше фокусироваться на том, чтобы понять данные как явление и смотреть на их структуру, имея в виду и то, как они устроены.
Во многих примерах мы говорим о данных как понятии, связанном со статистикой. Действительно, данные наследуют многим
статистическим процедурам, о которых говорилось выше. Это сбор материала и классификация мира, исходящая из того, что мы можем знать, а также выработка специальных способов фиксации и наблюдения: механического или структурного. Механический, проще говоря, связан с инструментами фиксации, а структурный — с тем, как мы размечаем структуру представления данных, ещё не визуализации, а для систематизации и анализа. Важно — это исторически разные формы представления знания и его конструирования. Они не всегда идентичны тому, что существует сегодня.
Например,
если мы анализируем цвета в романе Льва Толстого, то нам нужно задать механические инструменты «выхватывания» названий цветов и определить структуру базы данных: что в неё попадёт, как будут сгруппированы цвета, будем ли мы считать багровый — красным, а слово «алеющий» — указанием на цвет.
В статистике метод сбора — это отдельный большой вопрос, и на конференциях и в журналах по статистике ведутся свои дискуссии о том, где и какой способ получения информации и измерения лучше. Часто добродетелью в статистических измерениях становится
объективность, минимизация участия самого исследователя. (Подробнее: Галисон & Дастон, 2018.) Или наоборот — максимизация участия для того, чтобы данные стали «чистыми». Если мы говорим о процедурах «очистки», то они включают в себя и техники, и конкретные материальные, технологические решения. Связь с технологиями у статистических методов, в том числе из-за этого, очень долгая, она длится не одно столетие.
Про историю связи статистики и машин можно почитать подробнее в книгах
Reckoning with matter: Calculating machines, innovation, and thinking about thinking from Pascal to Babbage (Jones, 2016) и Metric Power (Beer, 2018)Не меньше и связь статистики с опасениями по поводу
наблюдений и слежки. Нередко критики статистических подходов обращаются к примерам из начала ХХ века, когда во многих странах происходили переписи населения и его свойств: социальных, демографических, тех, что касаются частной жизни. Яркий пример этого – история с картотекой Бюро статистики в Нидерландах в первой половине XX века. К 1939 году каждый гражданин должен был иметь документ, куда в том числе включалась графа «происхождение». После вторжения немцев в 1940 году эти данные были использованы для преследования еврейского населения и массовой депортации в концентрационные лагеря. Эта история показывает нам, как при меняющихся политических условиях само наличие данных может ставить социальные группы в уязвимую позицию.
Подробнее про это см.:
Raul Hilberg, The Destruction of the European Jews, New Haven: Yale University Press, 2003.Эти исторические экскурсы важны, чтобы видеть в том, что мы сегодня называем «данными», не нечто, появившееся только в эпоху интернета и цифровых следов, а
часть большой истории. В статистических измерениях есть некоторая преемственность. Так, англо-саксонская система статистики тесно связана со сбором показателей, нужным для того, чтобы оценивать работу институций (например, школ), в ситуации, когда они работают вне рынка. Говоря дальше в ходе курса о политиках данных, мы будем говорить в том числе и о возможностях работы с данными вне институций, но заранее предупреждаю, что данные — это необязательно история о гигантских машинах контроля.
Ещё много статистики собирают предприятия, чтобы улучшать работу, повышать
эффективность. В США обычно это соотносят с «тейлоризмом», по имени Фредерика Уинслоу Тейлора. Он предложил устраивать деятельность рабочих в соответствии с научными теориями, распределять задачи между рабочими, измерять эффективность труда и принимать меры на основе изучения разных процессов работы. Эти принципы с тех пор не раз оспаривались, но до сих пор находятся в основе многих управленческих процессов. Система Тейлора не была ни однозначной, ни единственной. Например, российские и советские (позже) учёные и изобретатели спорили с тейлоризмом. Пожалуй, одна из самых известных разработок в области советского управления трудом — это работы Алексея Гастева. Гастев спорил и с Фордом, и с Тейлором, доказывая, что главное в процессе труда — это становление человека. Это не было похоже на современное внимание к человеку. Гастев понимал рационально, как коммунист и революционер — а значит,
рациональность труда была ценной не для повышения эффективности предприятий, а для общества и человека в целом. Его книга
«Как надо работать» — впечатляюще интересная, и позволяет понять, как по-разному можно понимать труд и оценку показателей.
Но стоит иметь в виду, что данные — это не то же самое, что статистика. Ведь они могут быть результатами включённого наблюдения или, например, нарративами интервью. Сбор данных связан с разработкой способов свидетельства, наблюдения, очевидности (evidence), которые могут быть связаны и с человеческим вниманием, и с механической фиксацией.