Авторы, представляющие Университет штата Монтана, США, Сара Маннхаймер (Sara Mannheimer), Джейсон А. Кларк (Jason A. Clark), Кайл Хагерман (Kyle Hagerman), Якоб Шульц (Jakob Schultz) и Джеймс Эспеланд (James Espeland) подготовили статью «Простой инструмент для обнаружения массивов научных данных» (Dataset Search: A lightweight, community-built tool to support research data discovery). Главными характеристиками разработанного в университете приложения являются хорошо организованный интерфейс просмотра и поиска информации, модель данных, основанная на принципе обнаружения наборов данных, процесс сбора данных, включающих поиск и проверку наборов данных из внешних репозиториев, административный интерфейс, позволяющий создавать, интегрировать и сохранять записи, а также интерфейс визуализации наборов данных для демонстрации того, как данные производятся и используются учеными и исследователями Университета Монтаны. Данное приложение может быть использовано и другими организациями.
УДК: 004.657+002
ГРНТИ: 20.53.19, 20.01
Источник:
Вниманию читателей предлагается статья «Определение общих характеристик метаданных в массивах данных ограниченного доступа в сфере здравоохранения: исследование оптимизации способов обнаружения и доступа к массивам данных ограниченного использования» (Identifying metadata commonalities across restricted health data sources: A mixed methods study exploring how to improve the discovery of and access to restricted datasets). В коллектив авторов вошли: Кевин Рид (Kevin B. Read), Университет провинции Саскачеван; Грант Гибсон (Grant Gibson), Канадская сеть исследовательских центров обработки данных (Canadian Research Data Centre Network, CRDCN); Амбери Лихи (Ambery Leahey), компания Scholars Portal; Линн Питерсон (Lynn Peterson), Национальный научно-исследовательский совет Канады (National Research Council of Canada); Сара Ратли (Sarah Rutley), Университет провинции Саскачеван; Джули Ши (Julie Shi), Университет Торонто; Виктория Смит (Victoria Smith), Университет Торонто (Digital Research Alliance of Canada); Келли Статис (Kelly Stathis), Международный консорциум DataCite, Канада.
Если открытые массивы данных используют принципы FAIR для более эффективного обнаружения и использования своих ресурсов, то ситуация с данными ограниченного доступа — доступные только по запросу или заявке — совершенно иная. Метаданные не являются обязательной характеристикой данных ограниченного доступа, что снижает возможности их обнаружения и использования. Целью данного исследования было определить возможности обнаружения данных ограниченного доступа и их доступность. Были проанализированы ресурсы сферы здравоохранения, содержащие данные ограниченного доступа. Перед исследователями стояла задача установить, как описываются конкретные массивы данных и процедуры доступа к ним, что имеется общего в описании этих ресурсов и в какой степени обнаруженные общие характеристики могут быть использованы в существующих схемах с участием метаданных.
В рамках исследования была проанализирована информация о способах доступа, полученная от 48 ресурсов, содержащих данные ограниченного доступа; определены общие характеристики, которые можно использовать для возможного включения метаданных в структуру данных ограниченного доступа. Общие характеристики совмещены с существующими схемами метаданных (например, DataCite). Это позволило понять, в какой степени метаданные могут аккумулировать информацию из ресурсов, содержащих данные ограниченного доступа.
Ресурсы, содержащие данные ограниченного доступа, описывают свои массивы данных (35 общих характеристик) и способы доступа (27 общих характеристик) похожим образом. Совмещение описаний массивов данных с существующими схемами метаданных (DDI-Lifecycle и Codebook) дало 91,4% и 85,7% точных совпадений соответственно в исследованных структурах массивов данных. Способы доступа не были совмещены с метаданными, доступными в существующих схемах. Обнаружено, что, хотя метаданные, описывающие массив, содержащий данные ограниченного доступа, повышают уровень обнаруживаемости данных, доступность этих массивов данных может быть значительно увеличена, если информацию о доступе к данным будут считывать структурированные метаданные. В настоящее же время схемы метаданных не имеют для данных ограниченного доступа нужного уровня детализации.
УДК: 001.103.2 + 002.1-021.342:61
ГРНТИ: 20.21.25, 20.23.21, 20.51.19; 76.75.07
DOI: 10.7191/jeslib.907
Источник:
https://publishing.escholarship.umassmed.edu/jeslib/article/id/907/