/ почему данные стали «расти» и как может быть иначе
Но для самых разных методов работы с данными важно, чтобы
данных было как можно больше. Причём это важно в двух смыслах. Во-первых, учёные стремились увеличивать размер выборки, чтобы модели статистического анализа были точными. Во-вторых, данные считались высококачественными, если их можно применять к разным ситуациям и моделям. С той же середины ХХ века идёт и идея о необходимой
предиктивности (данные должны предсказывать будущие тенденции на основе текущих и прошлых изменений и закономерностей). Работа с данными предполагается полезной для выявления
паттернов (то есть образцов, на основе которых принимаются решения о том, что некоторое сочетание событий или показателей — закономерно). Ещё данные должны быть
валидными — собранными так, чтобы метод соответствовал задачам, выборке и результату. Желательно, чтобы данные были
консистентными: это значит, что они должны быть однородными внутри себя, скажем, в графе возраст был всегда возраст, а не год рождения. «Качественные» и «большие» данные считаются
репрезентативными — то есть отражающими реальный мир.
Кроме того, данные же должны предполагать или делать возможной «правильную»
категоризацию. Кавычки я использую, так как на деле речь не идёт о какой-то единственной правильности. Иногда категоризация связана с удобством, иногда — с традицией. Она может быть для выбранной и более подходящей теории или скорее основана на том, что мы видим в практиках.
Есть немало критики репрезентативизма. Основная проблема с этим понятием в том, что оно предполагает, будто мир существует в какой-то готовой форме до того, как мы начали его рассмаривать. Между тем, часто всё устроено ровно наоборот — какие-то показатели вовсе не существуют, пока мы не начали ими заниматься, особенно если речь идёт о социальном мире. Например, эта проблема есть с показателями вроде «социального благополучия». Думали ли мы, что существует некое «социальное благополучие» до того, как превратили его в фиксируемый количественно показатель? История данных развивалась несколько разными путями в разных странах. Во многих случаях она основывалась на кибернетических идеях, предполагавших, что всё в мире можно описать как системы: общество, биологические процессы, жизнь человека, и так далее.
Данные почти неизбежно несут «
позитивистский» флёр: что можно всё предсказать, основываясь на научном методе и подсчёте. Для того, чтобы отнестись к этому критически, конечно, стоит понимать историю такого отношения: когда, кем и зачем оно культивировалось.
(Подробнее: Jones, 2018) Сегодня часто говорят об альтернативных трактовках данных: тех, что происходят из
незападных обществ, например. Ведь понимание данных в нашем контексте связано с тем, как устроено знание — и с тем, как устроено само разделение на «реальность», «знание» и «воображение». В тех обществах, где, например, мир не является объектом осмысления, а сам предлагает свои интерпретации — данные могут быть чем-то совсем иным. Другой способ говорить и думать о данных иначе — привлекать людей, которые являются вообще-то «источниками данных», и говорить о том, как они
воображают это явление. В таком случае можно увидеть совсем другое взаимодействие с властью и с тем, как по-разному устроено понимание справедливости в теме данных.
(Подробнее: Milan & Treré, 2019; Ruppert, 2018) Вот
небольшой разговор о том, как базы данных о знании могут работать для австралийских аборигенов. В их структурах знания нет такой иерархической связи между данными и метаданными (то есть данными о данных, например, геолокация вашего телефонного разговора), как в условных западных обществах.
А пока можно поупражняться в воображении других миров данных, подумать о ваших собственных практиках и том, что мы называем (или нет) данными.
Воображение и примеры важны для критического подхода. Во многом он с них начинается, а потом речь пойдёт об анализе, узнавании того, как устроены способы производства и использования данных.
Дальше мы будем иметь в виду их политическую роль и этические беспокойства, которые могут возникать. И снова возвращаться к тому, что может быть интересным, удобным, забавным, психотерапевтически полезным, приятным способом работать с данными как понятием и явлением.