Критические исследования данных

/ что это за курс и кто его придумал
/ план занятий и их описания (piu)
/ задания и оценки (piu)

/ что это за курс и кто его придумал

/аннотация
В течение последних пяти лет в НИУ ВШЭ, как и в других ведущих мировых университетах, появляется большое количество образовательных и исследовательских программ, посвящённых работе с данными. В учебные планы многих студентов бакалавриата включены основы Data Culture. В рамках таких программ работа с данными представляется в первую очередь как набор необходимых навыков, которые применяются в отношении конкретного направления в науках и исследованиях, например, в социологии или международных отношениях.

Однако, работа с алгоритмами и большими данными — это не только навык, но и явление, меняющее исследовательские подходы разных наук. В этой работе немало сложных вопросов, этических конфликтов, эпистемологических проблем. Эти проблемы необходимо обсуждать: не существует готовых решений, которые могли бы уместиться в инструкцию. Задача университета здесь — не только предложение конкретных решений, но и организация интеллектуально насыщенного диалога о проблемах, важным для науки и общества. Проблемы вокруг данных — их важная часть.

В течение последних десяти лет в обществах разных стран возникают разные соображения по поводу того, как связаны развитие наук о данных и социальная жизнь. Нередко эти соображения становятся опасениями или превращаются в моральную панику (O'Neil, 2017). Так, можно вспомнить многочисленные скандалы, связанные с социальной сетью Facebook, принятие GDPR, участившиеся разговоры о влиянии алгоритмов на избирательные кампании и политические предпочтения, а также дискуссии вокруг цифровых технологий и слежки за гражданами.

Сами инициаторы работы с данными часто понимают, что сами инструменты по работе с данными не является полностью нейтральными. Они связаны с разнообразными и непредсказуемыми последствиями при принятии и внедрении решений, основанных на них. В индустрии, академии и некоммерческом секторе разрабатываются этические профессиональные кодексы, чтобы предусмотреть эти последствия. Происходят изменения и на уровне законов. Так, в Европе принят GDPR, ограничивающий способы сбора пользовательских данных в интернете, в России также обсуждаются законодательные меры по регулированию данных. В крупнейших университетах мира идут курсы, посвящённые этике работы с данными. Предлагаемый курс следует этим тенденциям и предлагает последовательную работу с проблематизацией того, что такое данные, как они собираются, какие вопросы вокруг них возникают и как они могут решаться.

/ расшифровываем название
Исследовать критически — это значит изучать что-то, не принимая как данность. А наоборот, понимая, что само понятие работы с данными — меняется, вызывает кучу вопросов, требует интеллектуального участия. И значит — сложных вопросов и изобретательства.

Из такого отношения получается, что данные — не данность. Их производят, встраивают в организационные и управленческие процессы, считают ценными, им доверяют, их побаиваются. Кто всё это делает? Нужно изучать на конкретных примерах. Как данные становятся важной социальной и политической темой? Тоже будем это исследовать.

У курса есть основная задача: настройка понимания и рефлексии того, что такое данные и как с ними работать в частной и профессиональной жизни. Значит, мы будем говорить о политике (кто и почему принимает решения, какие у них последствия, у кого оказывается больше власти, а кто страдает) и об этике (какие дилеммы возникают при попытке понять роль данных в социальной жизни и для конкретных людей).

/ авторы
Авторы курса — Полина Колозариди и Дмитрий Муравьёв.
Полина занимается интернет-исследованиями, преподаёт в НИУ ВШЭ и координирует клуб любителей интернета и общества.
Дмитрий изучает данные и алгоритмы, также работает и учится в НИУ ВШЭ и участвует в клубе любителей интернета и общества, а также ведёт канал @datastudies и пишет.
/ как устроен курс

Курс состоит из синхронной и асинхронной части.

Синхронная часть проходит в Зуме по пятницам. Мы обсуждаем тексты и конкретные проблемы, делаем групповые и индивидуальные задания. Во многом задача курса — обмен знанием между студентами, поэтому курс междисциплинарный. На примере участников 2019/2020 года мы увидели, что это впечатляюще работает.

Асинхронная часть — это материалы, собранные на тильдах. Ссылки на них будут размещаться здесь. Занятия на тильде — это что-то между лекцией и презентацией: в них есть тексты, выдержки из статей и книг, видеоматериалы, вопросы к участникам и участницам курса.

/ список занятий и тем:

1. Что такое данные?
2. Данные в социальных и профессиональных мирах. Датафикация.
3. Сбор/ производство и использование данных как процесс. Критика понятия данных как извлекаемого ресурса.
4. Данные: этика, критика, политика.
5. Социальные последствия.
6. Дата-активизм и политики работы с данными. Данные как ставка.
7. Алгоритмы и данные.

/ план занятий
    Что такое данные?
    Что делаем?

    Часть 1
    • Знакомимся, обсуждаем, где, кто и с чем работает;
    • Составляем схемы того, что понимается под словом «данные», как они связаны с разными видами знания, узнавания, информации. Добавляем туда вопросы о том, как производятся данные
    Часть 2
    • Мини-лекция о том, как данные становятся проблемой в апреле 2022 года и на что мы можем опереться

    Цель занятия
    Проблематизировать данные как явление, связать их со статистикой, другими инструментами, которые предшествуют или сосуществуют в работе с данными. Акцентировать внимание на том, что данные производятся разными научными и прикладными подходами к явлению, одновременно наследуя им.

    Выявить проблемные точки, которые возникают в сферах деятельности, близких студентам. Понять, какие виды знаний задействуется при обнаружении этих точек.

    Задание после занятия:
    Подготовить небольшой рассказ о том, как устроены данные в известной/интересной сфере в России + как это менялось.

    Вопросы к заданию:

    • Что является источником данных? Что входит в понятие «данных» в этой сфере?
    • Кто и каким образом их собирает и потом использует?
    • Как хранятся и используются данные?
    • Какие вопросы у вас возникают к этому процессу и самим данным?
      / ключевые задания
      1. Карта возможностей и рисков использования данных в своей области. Карта составляется по конкретной сфере, выбранной студентом: городское планирование, экономика, журналистика, международные отношения и т.д.

      2. Конспект по ключевым понятиям курса вместе с конспектами статей по эпистемологии и политике данных.

      / описание заданий

      Задание 1. Карта возможностей и рисков использования данных в своей области.
      Это небольшое исследование, которое проще всего сделать в форме карты/схемы с небольшим комментарием (3-6 тысяч знаков).

      Карта составляется по конкретной сфере. Это может быть городское планирование, экономика, журналистика, международные отношения и т.д. Студенты могут выбрать тему, которая связана с их специализацией, или обратиться к тому вопросу, который интересует лично их.

      Карта ориентирована на прикладное исследование проблемы, её основные составляющие во многом совпадают с темами, которые обсуждаются в рамках курса:

      • что именно становится материалом для формирования данных в сфере специализации студентов;
      • какие процедуры и организации включены в производство данных;
      • как устроен исторический контекст: что делали, чтобы узнать о происходящем до датафикации;
      • какие социальные, политические и организационные проблемы возникают в связи с темой данных в этой сфере;
      • есть ли альтернативные способы работы с данными;
      • как студенты видят политически/ этически возможные и желательные способы решения проблем с данными.
      Карта делается на протяжении всего курса.
      По базовым критериям возможно получить хорошую оценку (6 баллов). Также в ходе выполнения этого задания студенткам необходимо выработать собственные критерии оценки работы. Вторая часть оценки ставится преподавателем на основании критериев, предложенных студентом. Они должны быть определены на основе обсуждения черновиков заданий за две недели до сдачи работы.

      Задание 2. Конспект и эссе по эпистемологии и политике данных

      Конспект занятий делается на протяжении всего курса. Он может включать схему или текст о ключевых понятиях и вопросах курса. Частично конспект делается на основании асинхронных занятий, частично — на основании синхронных семинаров. Ключевые вопросы предлагаются в асинхронных занятиях.

      По завершению курса тексты дополняются небольшим эссе. Эссе основывается на конспектах и основных понятиях из курса. В эссе должны быть включены теоретические концепты, связанные с данными, а также примеры из современной повестки и конкретная проблема.

      Примерный объём — 5 тысяч знаков.
      / формула оценки
      Оитог = О1 * 0,5 + О2 * 0,5

      • О1 — оценка за задание 1
      • О2 — оценка за задания

      / критерии оценивания
      1. Карта возможностей и рисков
      • 3 балла Карта соответствует фактической ситуации в сфере деятельности/ на рынке и подкреплена ссылками и указанием источников. Изложение структурировано.
      • 3 балла Карта представляет собой аналитическую работу, в которой представлены и описаны риски и возможности. Есть выводы по результатам работы. В аналитической работе применяются материалы курса.
      • 1 балл. Есть критерии для самооценки, они обоснованы и соотнесены с работой.
      • 3 балла. Выставляются авторами работы на основании критериев для самооценки.
      Критерии задания 2. Конспект и эссе по эпистемологии и политике данных
      • 3 балла. В конспекте учтены материалы 6 и более занятий, они структурированы и соотнесены с базовыми знаниями о теме данных.
      • 2 балла. В конспекте описаны изменения и ключевые вопросы, которые возникают у студентки в ходе работы с курсом.
      • 2 балла. Эссе представляет проблему и предлагает направления интеллектуальной работы с ней.
      • 3 балла Эссе учитывает современный интеллектуальный и локальный контекст, разрабатывает пример на эмпирическом материале.
      Made on
      Tilda