Старый/ Критические исследования данных-4. Этика

Тема последняя. Этика в исследованиях данных.

/ множественность этики
/ этические проблемы в контексте данных (piu)
/ этические кодексы (piu)
/ этика как практика и этика как метод (piu)
/ где этические вопросы недостаточны (piu)
/ политика и критика как альтернативные оптики (piu)

Эта тильда посвящена этическим и политическим вопросам, а также понятию критики.
Это деление — не классификация. Этика, критика и политика — это не «красное, жёлтое и зелёное»‎, а скорее «красное, в клеточку и яркое»‎. То есть дополняющие друг друга, пересекающиеся категории.

Так, невозможна выработка этических кодексов или политических программ без критики, сложны критика и политика без этических суждений. И я предлагаю эти три слова не для того, чтобы раз и навсегда классифицировать, а для того, чтобы различать ваши возможные суждения и интересы по отношению к нашей общей теме.

Часто всю совокупность вопросов, о которых мы говорим на протяжении курса, называют этическими. Это не вполне верно, но такой ход подходит для начала. Поэтому половина тильды — про этику. Во второй половине мы обсудим, почему разговор об этике тут не единственный из возможных, и предложим два других варианта.

/ множественность этики

Современные рассуждения об этике непросты как интеллектуальная задача. С одной стороны, моральный универсализм остался в прошлом, и в ХХI веке принято говорить о том, что этические нормы отличаются в разных культурах и в разных ситуациях.

С другой стороны, новые явления вроде онлайн-данных (или изменившиеся и подросшие прежние) — заставляют искать их место в общем мире наук и исследований: чтобы понимать, где они могут нести дурные и благие последствия, кто наделён правом и ответственностью принимать решения, как устроена сама ситуация выбора. И да, это вопросы, которые нередко трактуются как этические.

Само понятие «этического» институционализировано. Так, в западных университетах и организациях: когда речь заходит об исследованиях, они одобряются или не одобряются этическими комиссиями. Эти комиссии принимают решения по разным вопросам, например: «Не вредит ли это исследование разным группам? Где возможны риски? Какие возможные последствия может иметь такое исследование?»

Если следовать логике комиссий и кодексов, этика — вопрос прагматический: нужно предусмотреть последствия своих исследований и попробовать не допустить вреда.

Но в самой этой идее есть подвох. Ведь исследование — предприятие с неизвестным ходом реализации. Если вы знаете, чем кончится исследование, зачем его затевать? Этика выступает тут своего рода противовесом любопытству и заставляет сразу продумывать изучение неизвестного как проект, причём социальный.

Вопрос

Кстати, эту тему мы попробуем отчасти обсудить на занятии, но вы можете заранее подумать, как вы видите — есть ли тут проблема?

Пожалуйста, запишите ваши мысли в этом документе.

Возможно, чтобы справиться с частью вопросов, можно обратиться к разным версиям самого понимания этики.

Для нашей темы мне кажется продуктивным различение Макса Вебера: об этике ответственности и этике убеждения.

Вебер описал это так:

Мы должны уяснить себе, что всякое этически ориентированное действование может подчиняться двум фундаментально различным, непримиримо противоположным максимам: оно может быть ориентировано либо на «этику убеждения», либо на «этику ответственности». Не в том смысле, что этика убеждения оказалась бы тождественной безответственности, а этика ответственности — тождественной беспринципности. Об этом, конечно, нет и речи. Но глубиннейшая противоположность существует между тем, действуют ли по максиме этики убеждения — на языке религии: «Христианин поступает как должно, а в отношении результата уповает на Бога», или же действуют по максиме этики ответственности: надо расплачиваться за (предвидимые) последствия своих действий. Как бы убедительно ни доказывали вы действующему по этике убеждения синдикалисту, что вследствие его поступков возрастут шансы на успех реакции, усилится угнетение его класса, замедлится дальнейшее восхождение этого класса, на него это не произведёт никакого впечатления.

Если последствия действия, вытекающего из чистого убеждения, окажутся скверными, то действующий считает ответственным за них не себя, а мир, глупость других людей или волю Бога, который создал их такими. Напротив, тот, кто исповедует этику ответственности, считается именно с этими заурядными человеческими недостатками, — он, как верно подметил Фихте, не имеет никакого права предполагать в них доброту и совершенство, он не в состоянии сваливать на других последствия своих поступков, поскольку мог их предвидеть. Такой человек скажет: эти следствия вменяются моей деятельности. Исповедующий этику убеждения чувствует себя «ответственным» лишь за то, чтобы не гасло пламя чистого убеждения, например, пламя протеста против несправедливости социального порядка. Разжигать его снова и снова — вот цель его совершенно иррациональных с точки зрения возможного успеха поступков, которые могут и должны иметь ценность только как пример.

(кстати, это отрывок из его замечательной работы «‎Политика как призвание и профессия», очень советую почитать его).

Если объяснить это чуть короче, то этика убеждения предполагает, что быть этичным — значит поступать в соответствии с «правильными» принципами. Этика ответственности говорит, что главное — это предполагать, какие последствия могут быть у ваших действий.

Применяя это к дискуссиям о данных, мы видим вот какое противоречие: нужно ли нам следовать верным принципам (например, всеобщего равенства, и того, что данные должны быть максимально полными) или подстраиваться под ситуацию (и думать, что произойдёт в конкретном случае, даже если это толкает нас к чему-то не вполне хорошему прямо сейчас)?

Уже за этим вопросом следуют другие: по какому принципу мы выбираем цель и определяем, что она — благая? Кто бенефициары, а кто — жертвы наших решений? Наконец, кто такие «мы», которые принимают их?

Этический разворот предполагает и другие вопросы: кто является субъектом решений и кто может от них претерпевать. Так, в западной традиции основной субъект этики — это индивид. Но если мы рассматриваем этику плюралистично, то это оказывается относительным. Ещё плюралистичная этика позволяет нам не принимать концепты единообразно, а наоборот — видеть, как понятие, скажем, приватности, воспринимается по-разному в городах и деревнях (как благо или как нечто непонятное и ненужное). Ещё стоит учитывать, что от страны к стране отличается граница между этикой и правом.

Но, конечно, различение, предложенное Вебером, не единственное. Есть и другие этические теории, которые становятся основой для обсуждений контексте данных:

Утилитаристская этика, при которой исследователи оценивают последствия своих действий и стремятся максимизировать благо для большинства

Этика заботы, во многом вырастающая из феминистского переосмысления этической теории и предполагающая выдвинуть принцип заботы как основание для разговора о этике и ответственности

Деонтологическая этика (от др.-греч. δέον «должное», а не отсутствия онтологии, как думается всем нам при столкновении с этим словом), ориентирующаяся на сам принцип или намерение действия, которое и должно подлежать этической оценке

Этика добродетели, которая предполагает оценку действующего субъекта и предлагает обращать внимание на культивацию общественных и индивидуальных добродетелей

Это не единые и однородные теории, а скорее интеллектуальные течения в рамках этических теорий, предполагающие ряд общих посылок, но разные трактовки и способы применения. Например, вот здесь вы можете почитать о том, как спорят спорят сторонники деонтологической этики и утилитаристы.

/ этические проблемы в контексте данных

Этическая проблематизация начинается с понимания границы между действиями и последствиями. Уже исходя из этого получится определить, что может произойти в разных ситуациях.

Один из ключевых примеров, на который часто ссылаются исследователи при работе с данными — это история исследования про Вкусы, время и связи — как менялись отношения людей и их предпочтения при проживании вместе в общежитиях. (Tastes, ties and time). Это исследование 2008 года было впечатляющим в смысле применения методик работы с данными, но главное для нас — оно было очень быстро и легко деанонимизировано. Оказалось, что речь шла об одном из кампусов Гарварда, а о некоторых людях стало известно почти с точностью до фамилии. Произошло это, так как материалы были основаны на данных Фейсбука (но они уже много лет не могут исследоваться как тогда — легко и открыто — по крайней мере, это невозможно официально и без разрешения компании).

Майкл Циммер написал статью, в которой объяснил, что не так с этим исследованием, и с тех пор сама эта статья тоже стала ключевой для понимания проблем с этикой при исследованиях на большом объёме данных.

Циммер подробно разобрал то, как стала возможной деанонимизация, и то, какие риски возникают из-за подобных ситуаций. Ключевые из них — нарушение приватности и недопустимое обращение с частной информацией, недобросовестное хранение и ошибки в датасетах. Во многом вопросы Циммера как раз исходят из традиционных для западной культуры начала XXI века ценностей — приватности и твёрдого различения частного и публичного. Это важно, так как на разделении частного и общего стоят и демократический способ управления, и общественные нормы (мы ещё вернёмся к этому в части про политику).

После этой истории многие социальные медиа стали ограничивать доступ исследователей к их информации, а исследователи стали уточнять и менять этические кодексы.

Конечно, эта история — не единственная, были и сложные политические дискуссии после выборов Трампа и Brexit, в которых использовалась контекстная реклама. Она, в свою очередь, основывалась на данных пользователей Фейсбука. Но пример с исследованием вкусов и ответом Циммера кажется наиболее показательным и актуальным во многом потому, что это — саморегулирование внутри исследовательской и научной среды.

/ этические кодексы

Этический подход к данным позволяет создавать решения в виде, например, этических кодексов, в которых подробно рассматривается, как решать проблемы с данными. Этические кодексы по работе с данными происходят из нескольких источников. Это кодексы компьютерных наук, естественно-научные своды правил, медицинские и журналистские кодексы.

Мы предлагаем рассмотреть подробнее тезисы Гайдлайнов Ассоциации интернет-исследователей, тем более, что в их версии 3.0 есть немало интересного про искусственный интеллект и алгоритмы.

(Все эти документы — рекомендательные, а не правовые, хотя грань может быть достаточно тонкой)

Всё больше исследователей склоняется к тому, что кодекс должен не столько предписывать и жёстко разграничивать правильные и неправильные действия, сколько предлагать вопросы, ответ на которые может помочь принять верное решение. Примеры таких вопросов:

Как проинформировать участников, согласовать с ними вашу работу и обеспечить приватность?
Как учесть в дизайне вашего исследования потенциальную разницу в понимании публичного/приватного между вами и участниками вашего исследования?
Считает ли автор/пользователь информацию о своих социальных связях и взаимодействиях приватной? Считает ли автор контента/участник исследования приватным свой контент и/или онлайн-пространство, которое вы исследуете?
Как долго информация будет храниться на компьютере/в облаке/в архиве, и в каком виде она там хранится?
Может ли анализ, публикация или распространение информации каким-либо образом навредить связанным с этими данными людям?
Что произойдёт с данными после того, как исследование закончится?
Можно ли уничтожить данные и как?
Как в архиве/библиотеке данных обозначается и удостоверяется авторство данных?
Как при презентации и распространении результатов вашего исследования будет обеспечена анонимность?
Легко ли найти участников по используемым вами данным (цитатам, демографическим данным и т. д.)?
Что делать с данными, если в исследовании используются IP адреса из разных стран, и в этих странах разная политика конфиденциальности?

Ещё есть схема, в которой перечислены вопросы, возникающие именно в интернет-исследованиях (но её можно соотнести и с другими исследованиями, работающими с данными).

ПОДРОБНЕЕ МОЖНО ПОЧИТАТЬ
ПО ССЫЛКЕ

Вопрос

Сталкивались ли вы с кодексами и правилами, которые как-то регламентируют работу с данными? Где там проходит граница права и этики? Как вы её понимаете?

Пожалуйста, напишите об этом в этом файле.

/ этика как практика и этика как метод

Некоторые из этических проблем можно решать, если рассматривать работу с данными именно как исследование. А значит, иметь в виду, что оно а) позволяет узнать что-то новое, б) работает с людьми как источниками этого знания, в) меняет мир, в котором живут эти люди.

Эти три простых соображения, следующие друг за другом, могут перевернуть процесс сбора и анализа данных. Если такие процессы, например, касаются сбора информации для улучшения логистического или коммуникативного процесса, то о людях речи и вовсе не идёт. Хотя источники информации — действия человека. Как же быть с этим парадоксом?

Наверное, на практике — по-разному. Но есть две идеи — про этику как метод и этику как практику.

Выше мы говорили о этике как совокупности этических теорий, каждая из которых локализирует этику по-разному: в последствиях действия, его принципах или на самом субъекте. При этом эти теории часто умозрительны: они исходят из философского знания, а не из практики. В какой-то момент антропологи и социальные исследователи подумали, что было бы любопытно посмотреть, как этические дилеммы решаются самими людьми, и какого рода этические действия происходят именно напрактике. Такое понимание этики как практики обращает наше внимание на то, как индивиды в своей повседневности разрешают напряжение «между повседневностью настоящего и возможностью другой, лучшей повседневности». (Keane, 2017). Например, Джейкоб Мэткалф и его коллеги исследовали то, как в американских IT компаниях устроена деятельность ответственных за этику специалистов (Metcalf et al., 2019).

Под давлением общественности многие компании начинают привлекать специалистов для внутреннего аудита продуктов или создания этических гайдлайнов для процесса разработки. В своей статье исследователи показывают, что работу таких специалистов ограничивает ряд «логик», доминирующих в индустрии, например, идеи меритократии, рыночного фундаментализма и представления о том, что технологии сами по себе способны решить все проблемы.

При такой множественности логик, этика часто оказывается ситуативной или подчинённой текущим задачам (например, получить одобрение этической комиссии).

Есть и противовес — идея об этике как методе. Так, интернет-исследовательница Аннет Маркхэм предлагает думать об этике как методе: не надо выделять этические размышления как отдельный этап исследования (особенно в конце). Напротив, этика должна быть частью метода, присутствовать на всех этапах исследования, с самого начала.

Что это значит? Что когда мы планируем исследование и имеем в виду его как социальное действие, то сам выбор темы, проблемы и объекта исследования оказывается вопросом — вопросом о том, какое изменение может произвести и сам процесс исследования, и само новое знание. Поскольку часто это затрагивает разные группы людей, а решения принимает исследователь, то речь идёт об этике, методе как этике.

/ почему этики недостаточно, и у неё есть ограничения?

Этические подходы не лишены недостатков, вот коротко о них:

этика одновременно универсальна (для всех исследований), но плюралистична (её основания отличаются). при этом этические ходы риторически сильны, а их последствия непонятны.
этические документы не обладают правовой силой, поэтому их применение может как быть частью регулирования, так и вовсе не происходить никогда. в итоге решения исследователей ситуативны.
этический подход предполагает, что исследование — это предприятие, в котором можно легко предположить, чем всё кончится. на деле это не всегда так, ведь исследование — мероприятие с открытым финалом, по крайней мере на этапе планирования.

Есть и более серьёзная проблема: этическое решение часто вуалирует проблему, делает вид, что все разногласия можно учесть, не меняя ничего радикально (а скорее делая какую-то часть ситуации более «этичной»).

На деле такой подход часто не работает, и оказывается, что этика не позволяет видеть корень проблемы. Например, нередко говорят: «Проблема в том, что пользователи не понимают, как устроены соглашения». Но при такой формулировке вопроса мы упускаем, что (персональные) данные — это уже часть большого бизнеса, о котором пользователи часто в принципе не знают. Получается, что постановка вопроса закрывает нам (и как исследователям, и как пользователям) глаза на суть проблемы. И это уже вопрос не этики, а справедливости.

Широта понятия «этика» оказывается и её минусом. Этику можно найти буквально во всём и везде. И тут же потерять, рассматривая любую проблему с решением и проблемой как «этическую». На деле проблема может быть прагматической или за ней может стоять конфликтом интересов разных групп. Поэтому я советую думать об этических проблемах вместе с политическими ракурсами.

/ политика и критика как альтернативные оптики

В качестве альтернативы я предлагаю посмотреть на два других подхода — политический и критический.

// политика

В рамках курса мы уже обращались к подходам и исследованиями, которые предлагают рассматривать работу с данными как политический процесс или позволяют увидеть связи эпистемологии и политики. Мы говорили о том, что само знание о ком-то или чём-то, доступ к данным и праве называть проблему — это прерогатива тех, кто обладает властью. И обладание таким знанием уже даёт власть, а борьба за данные оказывается, собственно, политической борьбой — за право иметь доступ к регулированию и описанию мира, определять границу своих и чужих.

На этот раз мы попробуем отдельно выделить подход, где работа с данными трактуется как политически небеспроблемный процесс.

Что он позволяет?

Выделять, что в процессе принятия решений (а также создания инструментов для сбора данных и алгоритмизации) есть разные участники со своими интересами. У участников есть свои свойства, и есть отношения между ними, которые заранее определяются как неравные.
Политический подход динамичен, видно, как отдельные решения отдельных акторов влияют на процесс. Это полезно для STS-исследований и тех подходов, которые хотят рассмотреть этические проблемы в развитии, а не текущем состоянии.
Есть возможность увидеть то, как работают данные (как понятие и явление) в процессе производства различий и в разных социальных процессах. Это позволяет иметь в виду темы демократии, справедливости, неравенства.

Но есть и трудности с политическим определением проблем.

Исследования проблем данных в политическом контексте реже настроены на прикладные решения (вроде более этичной организации исследований или улучшения пользовательских соглашений). Они могут показать неравенство или несправедливость, но не дать никакого решения;
Ещё политический ракурс часто упирается в управленческие или организационные условия производства политических отношений. Опять же, это хорошо для начала, но политика не сводится к конкретным управленческим процессам.

Но как раз понять политические отношения вокруг данных, притом в динамике, возможно. Посмотрим, как это работает на практике.

Известно, что данные почти никогда не собираются с нуля. Те процессы, которые уже основаны на каких-то систематизированных знаниях, изменяются в сторону большего приращения данных.

Например, знание обо всём обществе, населении России — оно существует благодаря очень старой процедуре переписи, а следы переписей мы находим даже на берестяных грамотах и глиняных табличках!.

А сейчас мы видим, например, в этой заметке, что большие данные предлагают использовать для переписи населения вместо стандартных обходов с переписными листами. Среди прочего там указывается, что это позволит также учитывать миграционные потоки.

Интересно! Получается, одни и те же явления могут собираться с помощью разных данных, раз они будут по-разному контролироваться.

Конечно, все эти темы обсуждают, и немало, но часто решения внедряются до больших обсуждений, и мы обсуждаем скорее их последствия. В разных сферах внедрение data-based решений происходит неспешно, но решительно, например, в правовой системе. Именно она является предметом больших споров: ведь то, как будут квалифицироваться разные действия, сейчас решают люди, рассматривая разные дела вручную. И это порой вызывает немало вопросов.

Во многих случаях работа алгоритмизированных сборщиков информации о правонарушениях (например, автоматы, фиксирующие неправильную парковку) тоже вызывают нарекания.

Но в позапрошлом году была новость о том, что эксперты из Сколково предлагают использовать основанные на больших данных решения для создания законодательных изменений, а также – законодательно определить понятие «цифрового следа». Сейчас все больше и больше думают о том, как разные способы автоматизированного анализа могут быть использованы при анализе больших массивов правовых актов и судебных решений, а многие компании уже применяют подобные системы. Подробнее об этом см.: Devins, C., Felin, T., Kauffman, S., & Koppl, R. (2017). The law and big data. Cornell JL & Public Policy, 27, 357.

Значит, при изменении источников информации, могут измениться и процессы управления сами по себе. Например, исследователи РАНХиГС объясняют, что это связано с переходом государственных служб к тому, чтобы действовать как платформы, а не руководствоваться старомодными принципами управления. Даже на организационном уровне это значит серьёзное переустройство: всё больше власти отходит тем, кто создаёт такие платформы, например, на уровне госуправления это Минкомсвязь (почитайте по ссылке интересное интервью о суперсервисах).

Итак, отношение к работе с данными как политическому процессу помогает увидеть связь с устройством принятия решений, справедливостью, политической борьбой и интересами разных групп. Такой подход менее прагматичен и часто обращается к уже существующим и очень общим категориям. Поэтому стоит иметь в виду ещё один ход — критический.

// критика

Критический подход в каком-то смысле собирает оба предыдущих. Часто в основе его лежит критическая теория.

Но я бы предложила рассматривать этот подход шире и видеть два его основных основания:

критика в философском смысле: как необходимость и возможность понимать место и время, где находится сама ситуация (например, сбор данных) и высказывание (о несправедливости). это немного похоже на подход Маркхэм — про этику как метод. и кстати, у неё есть отличная статья именно об этом: как понимать ситуацию и себя, хотя Маркхэм называет это рефлексией.
критика в отношении искусства (очень широкое понятие). конкретнее, стоит смотреть на фигуру критика по отношению к исследованиям как на ту, что позволяет конкретному исследованию быть описанным как часть и большого мира исследований, и другого контекста. например, в этом случае реакция Циммера на исследование про вкусы, связи и время — это реакция критическая.

В обоих случаях речь одновременно идёт о критике как части исследований. Но необязательно он является внутренним элементом исследования (при планировании проекта или его рефлексии). Критика может быть частью исследовательского мира как такового, и в том числе выражаться в сотрудничестве с этическими комитетами или быть на границе исследовательского и политического миров.

(тут стоит предупредить, что это моя авторская интерпретация критического подхода, повторю, что критическая теория устроена несколько иначе, и скорее обращена к марксизму как интеллектуальному инструменту, который позволяет рассматривать и устройство производства данных, и ситуации их применения в разных отношениях. моя трактовка несколько шире, что имеет свои плюсы и минусы, которые я была бы рада обсудить на занятиях, если будет к тому время и интерес)

Итак, суммируем: что позволяет критический подход?

Распознавать следы разных подходов, идеологий, социальных структур, наук и принципов, лежащих в основе работы с данными
Заниматься критикой как видом публичной практики, занимать дистанцию и позицию, но при этом не практиковать сразу политические решения. Поэтому можно практиковать критику и на частном уровне, и на публичном, не становясь автоматически активистом, а делая это в рамках места работы.
Видеть данные как нечто конструируемое и распознавать последствия разных интеллектуальных ходов и, например, метафор.

Правда, критический подход всегда предполагает некоторое недоверие по отношению к акторам: за одними действиями, высказываниями и практиками мы как будто должны видеть другие.

Задание

Возвращаясь к самому началу: в этом курсе мы обращаемся к разным способам понимать устройство и действие данных. Но стоит иметь в виду то, как именно они могут работать, и каковы их ограничения (часть из которых видна только уже на практике, ведь и разработка таких подходов — процесс исследовательски-творческий, с открытым финалом).

Чтобы попробовать, как это работает, я предлагаю небольшое задание, скорее важное включением вашей рефлексии:

Напишите, пожалуйста, здесь, небольшое сообщение для Марка Цукерберга. Сформулируйте в нём:

проблему с фейсбуком
ваше обоснование того, почему это проблема
(возможно) что хорошо бы сделать с ней.
(возможно) как вы видите — это высказывание этическое, политическое или критическое

Пожалуйста, сделайте это до вечера четверга. Перед занятием в пятницу вы сможете зайти в этот файл и посмотреть на высказывания других коллег, а на паре мы обсудим, чем отличаются эти три подхода.