Авторы из Техасского аграрно-механического университета (США) – Чжихун Сюй (Zhihong Xu), Джон Уоттс (John Watts), Сара Бэнкстон (Sarah Bankston) и Лора Саре (Laura Sare) – в статье «Депонирование данных: изучение удобства использования Техасского репозитория» (Depositing Data: A Usability Study of the Texas Data Repository) исследуют опыт работы с репозиторием новых пользователей, незнакомых ранее с его интерфейсом, и предлагают возможные пути совершенствования.
Техасский репозиторий данных (Texas Data Repository, TDR) — это объединенная система управления научно-исследовательскими данными учреждений-членов Техасской цифровой библиотеки, мультиуниверситетского консорциума высших учебных заведений штата Техас. Это платформа для публикации, обмена и архивирования данных, созданных преподавателями, сотрудниками и студентами. Репозиторий (https://dataverse.tdl.org) был создан в 2017 г.; он использует программное обеспечение Dataverse Project, приложение с открытым исходным кодом, разработанное Гарвардским университетом. Техасский репозиторий данных призван «сделать научно-исследовательские материалы бесплатными для всех, в любом месте и в любое время»; исследователи могут публиковать и сохранять данные в соответствии с требованиями финансирующих организаций и научных журналов. В нем можно размещать наборы данных малого и среднего размера, не содержащие конфиденциальной или чувствительной информации, поскольку данные рекомендуется делать общедоступными. Депонированные данные, относящиеся к любой научной дисциплине, могут быть представлены в файле любого типа, что позволяет загружать файлы README и другую дополнительную документацию. К основным преимуществам репозитория относятся возможность формирования и хранения наборов данных, отслеживание версий и присвоение наборам данных цифрового идентификатора объекта для цитирования. Применяется гибридная модель обслуживания, в которой организации-участники могут корректировать необходимые им услуги в зависимости от потребностей и имеющегося персонала. В Техасском аграрно-механическом университете используется модель самостоятельного депонирования с техподдержкой по мере необходимости (в виде семинаров, онлайн-руководств и консультаций).
В ходе исследования авторы провели анализ собранных количественных (т.е. описательных статистических данных) и качественных данных (протоколов по методике «мышление вслух»). Результаты показали, что пользователи в целом были удовлетворены работой с репозиторием. Однако большинство участников испытывали трудности с пониманием разницы между коллекцией данных и набором данных; кроме того они часто считали добавление или редактирование метаданных совершенно непосильным. Также заполнение различных полей метаданных требовало от участников приобретения новых навыков курирования данных. Основываясь на полученных результатах, авторы дают некоторые рекомендации: необходимость разработки эффективных учебных пособий (в виде коротких видео или комбинации письменных и графических инструкций) и обучения основным концепциям депонирования данных и навигации по интерфейсу платформы и пр. Авторы отмечают, что методы, описанные в статье, могут быть применены для дополнительных исследований в различных моделях репозиториев и сервисов.
УДК: 001.103.2+001.89
ГРНТИ: 20.15.05, 20.17.17
Источник:
В очередном номере журнала опубликована статья норвежских авторов Дженнифер Тогерсен (Jennifer L. Thoegersen) и Пии Борлунд (Pia Borlund), представляющих Факультет архивного дела, библиотековедения и информатики Столичного университета Осло (Норвегия), «Отношение исследователей к обмену данными из открытых репозиториев: мета-оценка работ по изучению проблемы обмена данными» (Researcher attitudes toward data sharing in public data repositories: a meta-evaluation of studies on researcher data sharing).
Цель статьи — представить результаты анализа научных публикаций, посвященных отношению ученых к использованию данных из репозиториев. В частности, авторы сравнивают определения «обмена данными», приводимые в литературе, называют критерии, по которым оценивается использование данных репозиториев. Анализ показал, что научные публикации можно разделить на три категории: работы, посвященные отношению ученых к обмену данными и соответствующей практике (1); факторам, влияющим на практику обмена данными (2) и одновременно двум этим аспектам (3). Кроме прочего, авторы ставят вопрос о необходимости уточнения терминологии по данной проблематике.
Анализ литературы начался с поисков релевантных публикаций в следующих источниках: Library Information Science and Technology Abstracts, Library and Information Science Source, Web of Science Core Collection (медиакомпания Thomson Reuters) и Scopus. Всего было выявлено и включено в данное метаисследование 62 публикации. Основная их часть описывает ситуацию в США, тем не менее, географический охват довольно широк, как и охват научных дисциплин, по которым происходит обмен данными. Охваченный публикациями временной период — с 2008 по 2020 г., большая часть (46 из 62) опубликована после 2015 г. Результаты исследования продемонстрировали необходимость большей определенности и последовательности в использовании термина «обмен данными» для лучшего понимания феномена и проведения кросс-дисциплинарных исследований. В большинстве случаев не получилось отделить результаты, относящиеся к репозиториям открытого доступа, от результатов по репозиториям других типов. Но и в тех случаях, когда речь идет об открытых репозиториях, формы использования сильно разнятся. Отмечен также разрыв между установками ученых относительно обмена данными и их информационным поведением в этой сфере.
Оригинальность и ценность данного исследования определяется огромным научным интересом к библиотечно-информационной поддержке научных исследований, а также потребностью научных и университетских библиотек в аналитической информации подобного рода. Авторы видят большой потенциал для дополнительных исследований в данной области.
УДК: [001.83:01]-047.44+001.103
ГРНТИ: 13.31.23; 20.15.31, 20.23, 20.51; 12.41.55, 12.41.51
Источник:
https://www.emerald.com/insight/content/doi/10.1108/JD-01-2021-0015/full/html
Вниманию читателей предлагается статья «Определение общих характеристик метаданных в массивах данных ограниченного доступа в сфере здравоохранения: исследование оптимизации способов обнаружения и доступа к массивам данных ограниченного использования» (Identifying metadata commonalities across restricted health data sources: A mixed methods study exploring how to improve the discovery of and access to restricted datasets). В коллектив авторов вошли: Кевин Рид (Kevin B. Read), Университет провинции Саскачеван; Грант Гибсон (Grant Gibson), Канадская сеть исследовательских центров обработки данных (Canadian Research Data Centre Network, CRDCN); Амбери Лихи (Ambery Leahey), компания Scholars Portal; Линн Питерсон (Lynn Peterson), Национальный научно-исследовательский совет Канады (National Research Council of Canada); Сара Ратли (Sarah Rutley), Университет провинции Саскачеван; Джули Ши (Julie Shi), Университет Торонто; Виктория Смит (Victoria Smith), Университет Торонто (Digital Research Alliance of Canada); Келли Статис (Kelly Stathis), Международный консорциум DataCite, Канада.
Если открытые массивы данных используют принципы FAIR для более эффективного обнаружения и использования своих ресурсов, то ситуация с данными ограниченного доступа — доступные только по запросу или заявке — совершенно иная. Метаданные не являются обязательной характеристикой данных ограниченного доступа, что снижает возможности их обнаружения и использования. Целью данного исследования было определить возможности обнаружения данных ограниченного доступа и их доступность. Были проанализированы ресурсы сферы здравоохранения, содержащие данные ограниченного доступа. Перед исследователями стояла задача установить, как описываются конкретные массивы данных и процедуры доступа к ним, что имеется общего в описании этих ресурсов и в какой степени обнаруженные общие характеристики могут быть использованы в существующих схемах с участием метаданных.
В рамках исследования была проанализирована информация о способах доступа, полученная от 48 ресурсов, содержащих данные ограниченного доступа; определены общие характеристики, которые можно использовать для возможного включения метаданных в структуру данных ограниченного доступа. Общие характеристики совмещены с существующими схемами метаданных (например, DataCite). Это позволило понять, в какой степени метаданные могут аккумулировать информацию из ресурсов, содержащих данные ограниченного доступа.
Ресурсы, содержащие данные ограниченного доступа, описывают свои массивы данных (35 общих характеристик) и способы доступа (27 общих характеристик) похожим образом. Совмещение описаний массивов данных с существующими схемами метаданных (DDI-Lifecycle и Codebook) дало 91,4% и 85,7% точных совпадений соответственно в исследованных структурах массивов данных. Способы доступа не были совмещены с метаданными, доступными в существующих схемах. Обнаружено, что, хотя метаданные, описывающие массив, содержащий данные ограниченного доступа, повышают уровень обнаруживаемости данных, доступность этих массивов данных может быть значительно увеличена, если информацию о доступе к данным будут считывать структурированные метаданные. В настоящее же время схемы метаданных не имеют для данных ограниченного доступа нужного уровня детализации.
УДК: 001.103.2 + 002.1-021.342:61
ГРНТИ: 20.21.25, 20.23.21, 20.51.19; 76.75.07
DOI: 10.7191/jeslib.907
Источник:
https://publishing.escholarship.umassmed.edu/jeslib/article/id/907/