В октябрьском номере опубликована статья канадских специалистов Хезер Геншорн (Heather Ganshorn) и Зары Премжи (Zahra Premji) «Управление данными для систематических обзоров: необходимость в руководстве» (Data Management for Systematic Reviews: Guidance is Needed). Управление данными — компетенция, соответствующая роли, которую библиотекари могут играть в реализации систематических обзоров (под систематическим обзором авторы понимают все формы синтеза знаний). К данной компетенции авторы относят такие навыки, как использование программного обеспечения сервисов цитирования и систематических обзоров, инструментов извлечения данных, архивация данных и процессов, в том числе отслеживание версий и сбор данных по методу PRISMA. Управление данными в рамках подготовки систематических обзоров и в целях иных способов синтеза знаний осуществляется по-разному: некоторые обзоры базируются на принципах открытой науки, другие остаются недоступными для широкого круга пользователей, что оставляет знание непрозрачным и невоспроизводимым. Стандарты представления полученных данных позволили повысить уровень детализации публикуемых обзоров, а также способствовали более открытому обмену данными, полученными на разных этапах процесса подготовки обзора. Так же, как при планировании любого проекта или при заполнении формы соответствия этическим стандартам, специалисты, выполняющие систематический обзор, должны составить план управления данными, который будет дополнять протокол исследования. В статье приведено краткое описание схемы такого плана по управлению данными конкретно при проведении систематических обзоров. Также представлено сопровождающее данный план руководство LibGuide с примерами, в который пользователи могут вносить собственные дополнения и рекомендации. Разработка модели осуществлена при финансовой поддержке Portage Network.

Систематический обзор – вид научного исследования, представляющий собой анализ опубликованных законченных работ, выполненных учёными или практикующими специалистами с целью оценки и обобщения данных в рамках чётко сформулированного вопроса с использованием заранее определённых методологии и протокола, позволяющих исключить случайные и систематические ошибки, а также для обеспечения полного отчета обо всех имеющихся исследованиях по данной теме, включая серую литературу.

  

УДК: 02:004+004.65

ГРНТИ: 13.31.23; 20.19.21, 20.15.31, 20.23.17, 20.23.21

DOI: 10.7191/jeslib.2021.1220

 

Источник:

https://escholarship.umassmed.edu/jeslib/vol10/iss4/3

В майском выпуске журнала опубликована статья Анжелы Мурилло (Angela P. Murillo) из Школы информатики и компьютерных наук Университета Индианы-Университета Пердью в Индианаполисе (шт. Индиана, США) «Данные имеют значение: как ученые в сфере наук о земле и экологии определяют релевантность данных и возможность их повторного использования» (Data matters: how earth and environmental scientists determine data relevance and reusability).

В задачи данного исследования входило изучение информационных потребностей ученых в сфере наук о земле и экологии и характеристик, по которым ученые определяют релевантность данных и возможность их повторного использования. Полученные данные позволяют предложить стратегии развития фондов и рекомендации по управлению данными и их курированию информационными специалистами, работающими бок о бок с учеными. Исследование проводилось в несколько этапов с применением смешанного метода анализа. В качестве экспериментальной среды был выбран репозиторий данных DataONE. Респонденты, специалисты по геологическим наукам, наукам об окружающей среде, экологии и биологии, были набраны через Университет Северной Каролины, Университет штата Северная Каролина, Комитет по данным для науки и техники (CODATA), информационную рассылку репозитория DataONE; также в список вошли участники Ежегодной конференции Геологического общества Америки. На первом этапе был проведен качественный и количественный анализ контента депонированных данных. Второй этап, главным образом описанный в статье, представлял собой квазиэксперимент по методике «мышление вслух». Ученые описали поиск данных в репозиториях как трудоемкий процесс, поскольку записи данных в некоторых из них содержат недостаточно информации. Информационные потребности ученых выявлены в отношении исследовательских методов, инструментов и описаний данных, а также реструктуризации рефератов. Кроме того, обнаружено, что ученые заинтересованы в реорганизации представления записи и информации о цитировании. Несмотря на то, что исследование ограничено сферой наук о земле и экологии, его результаты могут быть перенесены и в другие сферы, поскольку экологические науки и науки о земле являются мультидисциплинарной областью и включают в себя биологию, экологию и геологию. Результаты исследования имеют непосредственное практическое значение для библиотекарей-специалистов по данным и по управлению репозиториями, для кураторов данных, информационных специалистов, а также ученых, использующих эти данные. Реализация рекомендаций позволит увеличить эффективность консультационной деятельности библиотек при работе с учеными-исследователями в отношении организации хранения и создания данных, скорректировать политику развития репозиториев, определить, какая информация имеет первостепенное, а какая — второстепенное значение для возможности повторного использования данных. Поскольку затронута сфера экологии, данное исследование имеет и серьезное общественное значение. Уникальность и ценность данного исследования проблемы совместного и повторного использования данных состоит в уточнении и дальнейшей детализации данных по данной проблематике. В отличие от многих других работ, акцент сделан не на социальных мотиваторах и демотиваторах, а на информации, представленной в описании данных.

  

УДК: 001.103+004.65

ГРНТИ: 20.15.17, 20.17, 20.23.17

DOI: 10.1108/CC-11-2018-0023

 

Источник:

https://www.emerald.com/insight/content/doi/10.1108/CC-11-2018-0023/full/html

Со второго десятилетия 2000-х годов все большее число финансирующих организаций и издателей рекомендует исследователям составлять планы управления научными данными. Эта методика повышает целостность данных, надежность результатов, прозрачность процесса исследований и воспроизводимость исследований. Совместное использование научных данных позволяет избежать сбора дублирующих данных и находить решения сложных междисциплинарных проблем, таких как изменение климата или пандемия.

Руководитель группы анализа научных данных библиотеки Университета Турку (Финляндия) Юкка Рантасаари (Jukka Rantasaari) в статье «Коллективный тренинг по управлению научными данными как инструмент повышения качества, целостности, надежности и воспроизводимости результатов исследований» (Multi-Stakeholder Research Data Management Training as a Tool to Improve the Quality, Integrity, Reliability and Reproducibility of Research) рассказывает о том, как курс «Основы управления научными данными» за три года (2019–2021 гг.) помог повысить уровень компетентности докторантов и постдокторантов двух финских университетов. Этот курс был разработан и реализован в Университете Турку, а в 2020 г. был запущен и в шведскоязычном образовательном учреждении - Академии Або, втором по величине университете г. Турку.

Зачастую в вузах, занимающихся активной исследовательской работой, университетские библиотеки являются главными, а во многих случаях и единственными пропагандистами обучения работе с научными данными. Однако для планирования образовательного проекта «Основы управления научными данными» и преподавания был привлечен широкий круг экспертов – преподавателей различных факультетов университета, юристов, специалистов библиотек по работе с данными, по безопасности данных и по информационным технологиям. Содержание курса включало изучение некоторых этапов жизненного цикла данных, начиная с написания плана исследования и заканчивая совместным использованием и долгосрочным сохранением данных. Курс не охватывал анализ, визуализацию, очистку, объединение и программирование данных.

По результатам опросов, проведенных после прохождения курса, в среднем уровень компетентности респондентов (n=123) улучшился на один балл по четырехуровневой шкале: от «недостаточно компетентен» до «относительно компетентен». Участники сообщили, что, несомненно, тренинг изменит в будущем их практику планирования исследовательских проектов, сбора и организации данных, управление данными и документирование, а также их отношение к правовым вопросам и конфиденциальности данных. Отмечено, что целесообразно было бы представить юридические принципы и положения о конфиденциальности в виде инструкций с конкретными примерами. Наиболее востребованными темами являются метаданные и описание, культура конкретных дисциплин, а также резервное копирование, управление версиями и хранение. Кроме того, участники знакомятся с профессионалами в области поддержки академической и исследовательской деятельности, и наоборот: эксперты узнают о проблемах, с которыми сталкиваются молодые исследователи при применении RDM.

Автор статьи отмечает, что недостатком этого образовательного проекта является значительная административная нагрузка по координации обучения, что неизбежно для многопрофильной рабочей группы специалистов и преподавателей. Поэтому достижение консенсуса по целям обучения, методам преподавания и содержанию, практическим занятиям курса и срокам между всеми участниками учебного процесса имеет первостепенное значение.

  

УДК: 001.103+027.7:002.6

ГРНТИ: 20.23; 12.41.55; 20.19.15, 20.51, 20.15.31; 13.31.23

DOI: 10.53377/lq.11726

 

Источник:

https://liberquarterly.eu/article/view/11726

В своей статье «Оценка временных затрат на курирование данных» (Measuring the time spent on data curation) исследователи Аня Перри (Anja Perry) и Себастиан Нетчер (Sebastian Netscher) пишут о том, что финансирование процессов курирования данных в научно-исследовательских проектах должно основываться на информации о временных затратах на данный процесс, в частности, на фильтрацию и документирование количественных данных, предназначенных для совместного доступа. Авторами разработаны рекомендации по выбору стоимостных показателей в управлении научно-исследовательскими данными. Они использовали материалы пилотного исследования, проведенного Архивом данных по социальным наукам GESIS (Германия) в период декабрь 2016 г. – сентябрь 2017 г. На протяжении этого времени кураторы данных Института социальных наук им. Лейбница ежедневно документировали свою деятельность, связанную с фильтрацией и документированием данных по десяти количественным обзорным исследованиям. На этом основании выявлены влияющие на стоимость факторы, которые способны также увеличить или сократить временные затраты на названные выше операции. Обнаружено, что на них влияют главным образом два фактора: объем данных и информация персонального характера, содержащаяся в них. Фактором, влияющим на временные затраты, является также неоднородность данных и самообучение кураторов в случае обработки аналогичных наборов данных или повторения процедур. Оригинальность и ценность данного исследования состоит в том, что в рамках процесса курирования данных были выделены различные операции и задачи, что может служить моделью для планирования процесса кураторства данных в исследовательских проектах; определено время, затраченное на обработку уникальных данных по социальным наукам, найдена взаимозависимость между временными затратами на отдельных этапах курирования, а также между временем и качеством обработки и сложностью данных.

  

УДК: 004.65 + 001.891

ГРНТИ: 20.21

DOI: 10.1108/JD-08-2021-0167

 

Источник:

https://www.emerald.com/insight/content/doi/10.1108/JD-08-2021-0167/full/html