/ обработка данных
И да, сами культуры работы с данными и алгоритмами, которые их «добывают» и «обрабатывают» тоже отличаются.
Пожалуй, общая (и самая проблемная) история здесь — это
поиск закономерностей в том, что мы видим с помощью инструментов для представления данных. Кстати, это отдельная тема: как дата-аналитики работают с данными, почему и какие графики и таблицы используют, и как семиотика и материальность этих инструментов влияет на то, что в итоге получается. Например, почему предзадаётся равенство всех элементов таблиц, где собираются данные (то есть почему, грубо говоря, в Экселе все клеточки равны).
И проблемой это становится из-за того, что поиск закономерностей — это часто
поиск причинности (каузальности). Видя устойчивые совпадения, мы невольно прочерчиваем между ними причинно-следственные отношения. Например, если мы видим, что люди идут под зонтами, мы знаем, что они делают это потому, что пошёл дождь. Но не наоборот.
Если с погодой и нашими действиями всё более или менее линейно, в социальной жизни такие прямые отношения причины и следствия — скорее редкость. Почему дети больше отвлекаются? Из-за планшетов или из-за того, что меняется стиль воспитания? Или стиль воспитания меняется ещё по какой-то причине? Или планшеты чаще используют родители, чтобы занять ребёнка надолго хоть чем-то?
Ещё несколько толковых примеров можно найти
вот здесь. Иногда это соотносят с
работой мозга, как в этих примерах. Иногда — с культурой и конкретными социальными и эпистемологическими условиями (этот подход мне в целом ближе, и я больше говорю о нём, но с точки зрения работы мозга тоже очень интересно). Но общий принцип очень важен:
не путайте совпадения с причинностью! (обратите внимание на график внизу, он показывает, что бывает, если всё же путать; много забавных и грустных примеров в этой
подборке странных корреляций).
Есть и более тонкие особенности работы с методом и анализом. Например, Мэтью Джонс (Jones, 2018) пишет об интерпретативной, причинной и механистичной моделях работы с данными. Это примерно понятно из здравого смысла: можно выявлять причинно-следственные связи (но я предупреждала!), интерпретировать (очень по-разному), а ещё смотреть на модели как на простые тенденции/закономерности, которые можно использовать. Джонс тут опирается на идею Лео Брейнмана о статистике, которая мне кажется очень интересной. Брейнман (Leo Breiman) описал две культуры использования статистических моделей, которые существуют для того, чтобы делать выводы: одна предполагает более научный, а вторая — инженерный подход. Первая основана на том, что механизмы извлечения данных работают с понятной и однообразной реальностью, а сами усовершенствуются. Другая — что реальность изменчива, и механизмы обращения к ней тоже меняются.
Изучая историю науки, мы понимаем, что любой подход может измениться, а нам, чтобы в этом сориентироваться, важно понять общие закономерности (!) и предпосылки.