Авторы из Техасского аграрно-механического университета (США) – Чжихун Сюй (Zhihong Xu), Джон Уоттс (John Watts), Сара Бэнкстон (Sarah Bankston) и Лора Саре (Laura Sare) – в статье «Депонирование данных: изучение удобства использования Техасского репозитория» (Depositing Data: A Usability Study of the Texas Data Repository) исследуют опыт работы с репозиторием новых пользователей, незнакомых ранее с его интерфейсом, и предлагают возможные пути совершенствования.

Техасский репозиторий данных (Texas Data Repository, TDR) — это объединенная система управления научно-исследовательскими данными учреждений-членов Техасской цифровой библиотеки, мультиуниверситетского консорциума высших учебных заведений штата Техас. Это платформа для публикации, обмена и архивирования данных, созданных преподавателями, сотрудниками и студентами. Репозиторий (https://dataverse.tdl.org) был создан в 2017 г.; он использует программное обеспечение Dataverse Project, приложение с открытым исходным кодом, разработанное Гарвардским университетом. Техасский репозиторий данных призван «сделать научно-исследовательские материалы бесплатными для всех, в любом месте и в любое время»; исследователи могут публиковать и сохранять данные в соответствии с требованиями финансирующих организаций и научных журналов. В нем можно размещать наборы данных малого и среднего размера, не содержащие конфиденциальной или чувствительной информации, поскольку данные рекомендуется делать общедоступными. Депонированные данные, относящиеся к любой научной дисциплине, могут быть представлены в файле любого типа, что позволяет загружать файлы README и другую дополнительную документацию. К основным преимуществам репозитория относятся возможность формирования и хранения наборов данных, отслеживание версий и присвоение наборам данных цифрового идентификатора объекта для цитирования. Применяется гибридная модель обслуживания, в которой организации-участники могут корректировать необходимые им услуги в зависимости от потребностей и имеющегося персонала. В Техасском аграрно-механическом университете используется модель самостоятельного депонирования с техподдержкой по мере необходимости (в виде семинаров, онлайн-руководств и консультаций).

В ходе исследования авторы провели анализ собранных количественных (т.е. описательных статистических данных) и качественных данных (протоколов по методике «мышление вслух»). Результаты показали, что пользователи в целом были удовлетворены работой с репозиторием. Однако большинство участников испытывали трудности с пониманием разницы между коллекцией данных и набором данных; кроме того они часто считали добавление или редактирование метаданных совершенно непосильным. Также заполнение различных полей метаданных требовало от участников приобретения новых навыков курирования данных. Основываясь на полученных результатах, авторы дают некоторые рекомендации: необходимость разработки эффективных учебных пособий (в виде коротких видео или комбинации письменных и графических инструкций) и обучения основным концепциям депонирования данных и навигации по интерфейсу платформы и пр. Авторы отмечают, что методы, описанные в статье, могут быть применены для дополнительных исследований в различных моделях репозиториев и сервисов.

  

УДК: 001.103.2+001.89

ГРНТИ: 20.15.05, 20.17.17

DOI: 10.7191/jeslib.2022.1233

 

Источник:

https://escholarship.umassmed.edu/jeslib/vol11/iss1/6/

В майском выпуске журнала опубликована статья Анжелы Мурилло (Angela P. Murillo) из Школы информатики и компьютерных наук Университета Индианы-Университета Пердью в Индианаполисе (шт. Индиана, США) «Данные имеют значение: как ученые в сфере наук о земле и экологии определяют релевантность данных и возможность их повторного использования» (Data matters: how earth and environmental scientists determine data relevance and reusability).

В задачи данного исследования входило изучение информационных потребностей ученых в сфере наук о земле и экологии и характеристик, по которым ученые определяют релевантность данных и возможность их повторного использования. Полученные данные позволяют предложить стратегии развития фондов и рекомендации по управлению данными и их курированию информационными специалистами, работающими бок о бок с учеными. Исследование проводилось в несколько этапов с применением смешанного метода анализа. В качестве экспериментальной среды был выбран репозиторий данных DataONE. Респонденты, специалисты по геологическим наукам, наукам об окружающей среде, экологии и биологии, были набраны через Университет Северной Каролины, Университет штата Северная Каролина, Комитет по данным для науки и техники (CODATA), информационную рассылку репозитория DataONE; также в список вошли участники Ежегодной конференции Геологического общества Америки. На первом этапе был проведен качественный и количественный анализ контента депонированных данных. Второй этап, главным образом описанный в статье, представлял собой квазиэксперимент по методике «мышление вслух». Ученые описали поиск данных в репозиториях как трудоемкий процесс, поскольку записи данных в некоторых из них содержат недостаточно информации. Информационные потребности ученых выявлены в отношении исследовательских методов, инструментов и описаний данных, а также реструктуризации рефератов. Кроме того, обнаружено, что ученые заинтересованы в реорганизации представления записи и информации о цитировании. Несмотря на то, что исследование ограничено сферой наук о земле и экологии, его результаты могут быть перенесены и в другие сферы, поскольку экологические науки и науки о земле являются мультидисциплинарной областью и включают в себя биологию, экологию и геологию. Результаты исследования имеют непосредственное практическое значение для библиотекарей-специалистов по данным и по управлению репозиториями, для кураторов данных, информационных специалистов, а также ученых, использующих эти данные. Реализация рекомендаций позволит увеличить эффективность консультационной деятельности библиотек при работе с учеными-исследователями в отношении организации хранения и создания данных, скорректировать политику развития репозиториев, определить, какая информация имеет первостепенное, а какая — второстепенное значение для возможности повторного использования данных. Поскольку затронута сфера экологии, данное исследование имеет и серьезное общественное значение. Уникальность и ценность данного исследования проблемы совместного и повторного использования данных состоит в уточнении и дальнейшей детализации данных по данной проблематике. В отличие от многих других работ, акцент сделан не на социальных мотиваторах и демотиваторах, а на информации, представленной в описании данных.

  

УДК: 001.103+004.65

ГРНТИ: 20.15.17, 20.17, 20.23.17

DOI: 10.1108/CC-11-2018-0023

 

Источник:

https://www.emerald.com/insight/content/doi/10.1108/CC-11-2018-0023/full/html