Статья Сары Маннхеймер (Sara Mannheimer) «Повторное использование качественных данных и крупные социальные исследования с точки зрения курирования данных» (Data Curation Implications of Qualitative Data Reuse and Big Social Research) основана на презентации «Поддержка ответственных исследований с получением Больших данных общественного характера: объединение практикующих сообществ» (Supporting Responsible Research with Big Social Data by Connecting Communities of Practice), состоявшейся в рамках Саммита RDAP (Registration Data Access Protocol) 2021 г. Материалы доступны в интернете: https://osf.io/e4u7v.

Большие данные общественного характера (например, данные социальных сетей и блогов) и архивированные качественные данные (например, транскрипты интервью, полевые журналы, дневники) обладают сходством, между тем сообщества, которые являются источником этих данных, не идентичны и практически не пересекаются. В данной статье рассматриваются общие задачи повторного использования качественных данных и Больших данных общественного характера в сфере курирования данных. Автор провела анализ литературы и применила индуктивное кодирование в отношении 300 статей, посвященных вопросу о повторном использовании качественных данных и крупным социологическим исследованиям. В представленной литературе выявлено шесть основных проблем, связанных с использованием и повторным использованием данных, присутствующих в качественных данных и крупных социологических исследованиях – это контекст, качество данных, сопоставимость данных, информированное согласие, право на частную жизнь и конфиденциальность, интеллектуальная собственность и право собственности на данные.

Автор настаивает на том, что специалисты, занятые курированием данных, должны понимать сущность этих проблем, вырабатывать стратегию и соответственно решать задачи их курирования через документирование, комбинирование массивов данных и их объединение через ссылки; поддержку надежных репозиториев; использование и продвижение стандартов для метаданных; обсуждение с исследователями и экспертами организаций альтернативных стратегий для контента; обеспечение деидентификации; обеспечение ограниченного доступа к данным; разработку договоров об использовании данных; управление правами и лицензирование данных; разработку и реализацию альтернативных стратегий архивирования. Решение этих задач по курированию данных обеспечит эффективную практику использования качественных данных и данных крупных социологических исследований.

Registration Data Access Protocol (RDAP) — протокол доступа к регистрационным данным, стандартизирован рабочей группой Инженерного совета Интернета в 2015 г. после изучения экспериментальных разработок и подробнейших обсуждений. RDAP является протоколом-преемником протокола WHOIS и используется для поиска релевантных регистрационных данных на таких ресурсах Интернет, как имена доменов, IP-адреса и номера автономных систем.

  

УДК: 004.65:303.425

ГРНТИ: 20.01; 04.15; 20.23.17, 20.23.21, 20.23.25

DOI: 10.7191/jeslib.2021.1218

 

Источник:

https://escholarship.umassmed.edu/jeslib/vol10/iss4/5/