Вниманию читателей предлагается статья «Определение общих характеристик метаданных в массивах данных ограниченного доступа в сфере здравоохранения: исследование оптимизации способов обнаружения и доступа к массивам данных ограниченного использования» (Identifying metadata commonalities across restricted health data sources: A mixed methods study exploring how to improve the discovery of and access to restricted datasets). В коллектив авторов вошли: Кевин Рид (Kevin B. Read), Университет провинции Саскачеван; Грант Гибсон (Grant Gibson), Канадская сеть исследовательских центров обработки данных (Canadian Research Data Centre Network, CRDCN); Амбери Лихи (Ambery Leahey), компания Scholars Portal; Линн Питерсон (Lynn Peterson), Национальный научно-исследовательский совет Канады (National Research Council of Canada); Сара Ратли (Sarah Rutley), Университет провинции Саскачеван; Джули Ши (Julie Shi), Университет Торонто; Виктория Смит (Victoria Smith), Университет Торонто (Digital Research Alliance of Canada); Келли Статис (Kelly Stathis), Международный консорциум DataCite, Канада.

Если открытые массивы данных используют принципы FAIR для более эффективного обнаружения и использования своих ресурсов, то ситуация с данными ограниченного доступа — доступные только по запросу или заявке — совершенно иная. Метаданные не являются обязательной характеристикой данных ограниченного доступа, что снижает возможности их обнаружения и использования. Целью данного исследования было определить возможности обнаружения данных ограниченного доступа и их доступность. Были проанализированы ресурсы сферы здравоохранения, содержащие данные ограниченного доступа. Перед исследователями стояла задача установить, как описываются конкретные массивы данных и процедуры доступа к ним, что имеется общего в описании этих ресурсов и в какой степени обнаруженные общие характеристики могут быть использованы в существующих схемах с участием метаданных.

В рамках исследования была проанализирована информация о способах доступа, полученная от 48 ресурсов, содержащих данные ограниченного доступа; определены общие характеристики, которые можно использовать для возможного включения метаданных в структуру данных ограниченного доступа. Общие характеристики совмещены с существующими схемами метаданных (например, DataCite). Это позволило понять, в какой степени метаданные могут аккумулировать информацию из ресурсов, содержащих данные ограниченного доступа.

Ресурсы, содержащие данные ограниченного доступа, описывают свои массивы данных (35 общих характеристик) и способы доступа (27 общих характеристик) похожим образом. Совмещение описаний массивов данных с существующими схемами метаданных (DDI-Lifecycle и Codebook) дало 91,4% и 85,7% точных совпадений соответственно в исследованных структурах массивов данных. Способы доступа не были совмещены с метаданными, доступными в существующих схемах. Обнаружено, что, хотя метаданные, описывающие массив, содержащий данные ограниченного доступа, повышают уровень обнаруживаемости данных, доступность этих массивов данных может быть значительно увеличена, если информацию о доступе к данным будут считывать структурированные метаданные. В настоящее же время схемы метаданных не имеют для данных ограниченного доступа нужного уровня детализации.

  

УДК: 001.103.2 + 002.1-021.342:61

ГРНТИ: 20.21.25, 20.23.21, 20.51.19; 76.75.07

DOI: 10.7191/jeslib.907

 

Источник:

https://publishing.escholarship.umassmed.edu/jeslib/article/id/907/