БиблиоГоризонт

В специальном выпуске журнала Journal of eScience Librarianship (том 10, выпуск 1) опубликованы материалы по итогам состоявшегося в марте 2020 г. саммита «Научно-исследовательские данные и обеспечение их сохранности» (Research Data and Preservation, RDAP). Это была одна из первых конференций периода пандемии, состоявшихся в онлайн-формате. Главная тема саммита и номера журнала обозначена как «Взаимодействие через данные» (Connecting Through Data). На своих страницах журнал поместил комментарий к конференции Дженифер Чапут (Jennifer Chaput) «Виртуальное взаимодействие и будущие виртуальные конференции» (Virtual Connections and Virtual Futures), в котором рассмотрены сценарии и формы будущих виртуальных форумов.

Более подробную информацию о саммите «Научно-исследовательские данные и обеспечение их сохранности» можно узнать на сайте: https://rdapassociation.org/summit

УДК: 02+004.056

ГРНТИ: 13.31; 50.37.23

DOI: 10.7191/jeslib.2021.1197

Источник:

https://escholarship.umassmed.edu/jeslib/vol10/iss1/5

Авторы, представляющие Университет штата Монтана, США, Сара Маннхаймер (Sara Mannheimer), Джейсон А. Кларк (Jason A. Clark), Кайл Хагерман (Kyle Hagerman), Якоб Шульц (Jakob Schultz) и Джеймс Эспеланд (James Espeland) подготовили статью «Простой инструмент для обнаружения массивов научных данных» (Dataset Search: A lightweight, community-built tool to support research data discovery). Главными характеристиками разработанного в университете приложения являются хорошо организованный интерфейс просмотра и поиска информации, модель данных, основанная на принципе обнаружения наборов данных, процесс сбора данных, включающих поиск и проверку наборов данных из внешних репозиториев, административный интерфейс, позволяющий создавать, интегрировать и сохранять записи, а также интерфейс визуализации наборов данных для демонстрации того, как данные производятся и используются учеными и исследователями Университета Монтаны. Данное приложение может быть использовано и другими организациями.

УДК: 004.657+002

ГРНТИ: 20.53.19, 20.01

DOI: 10.7191/jeslib.2021.1189

Источник:

https://escholarship.umassmed.edu/jeslib/vol10/iss1/3

Управление исследовательскими данными является важной темой для университетов, научных работников и финансирующих их учреждений. Исследователи из Анкары (Турция) - доцент Ближневосточного технического университета Арсев Умур Айдиноглу (Arsev Umur Aydinoglu) и сотрудники Департамента управления информацией Университета Хаджеттепе, Гуледа Доган (Guleda Dogan) и Зехра Таскин (Zehra Taskin), в статье «Управление исследовательскими данными в Турции: исследование для создания эффективного национального хранилища данных» (Research data management in Turkey: A survey to build an effective national data repository) приводят результаты опроса 1577 научных сотрудников, зарегистрированных в информационной системе ARBİS, одного из крупнейших исследовательских хранилищ в Турции. В опросе, состоящем из 19 пунктов, были вопросы, например, о текущей практике использования и производства исследовательских данных; типах, форматах и размере данных, среде хранения данных. Целью этого опроса было выявить тенденции, проанализировать поведение и мысли исследователей, а также определить уровень знаний и образовательные потребности исследователей. В заключение авторы дают рекомендации, которые могут оказать положительное влияние на обработку и управление исследовательскими данными.

УДК: 004.62+004.658

ГРНТИ: 20.53.19; 50.41.21

DOI: 10.1177/0340035220917985

Источник:

https://journals.sagepub.com/doi/full/10.1177/0340035220917985

Библиотекарь Национальной библиотеки Шотландии Сара Эймс (Sarah Ames) в статье «Платформа предоставления открытых данных Data Foundry в Национальной библиотеке Шотландии. Прозрачность, история происхождения и фонды как данные» (Transparency, provenance and collections as data: the National Library of Scotland’s Data Foundry) говорит о том, что «фонды как данные» стали основным направлением деятельности библиотек в последние годы. В статье представлен пример работы, проводимой в Национальной библиотеке Шотландии, по открытому и прозрачному представлению коллекций в виде данных - от создания новой службы по цифровым научным данным до рабочих процессов и онлайн-презентации этих данных. Рассматриваются изменения в существующих процессах, необходимых для создания Data Foundry, платформы предоставления открытых данных Национальной библиотеки Шотландии, и исследуются практические проблемы представления коллекций в виде данных в Интернете открытым, прозрачным и последовательным образом.

УДК: 02:004+024

ГРНТИ: 13.20.31, 13.31

DOI: 10.18352/lq.10371

Источник:

https://liberquarterly.eu/article/view/10880

В выпуске 1 журнала Technical Services Quarterly (том 38) опубликована рецензия редакторов Стива Келли (Steve Kelley) и Кэролин Маккаллум (Carolyn McCallum) на книгу «Связанные данные для сбитого с толку библиотекаря» (Linked data for the perplexed librarian) Скотта Карлсона (Scott Carlson), Кори Ламперт (Cory Lampert), Дарнелля Мелвина (Darnelle Melvin) и Энн Вашингтон (Anne Washington). Книга предназначена для нетехнического персонала учреждений GLAM (Galleries, Libraries, Archives, and Museums - галереи, библиотеки, архивы и музеи). Она разбита на 7 глав, в которых рассказывается о происхождении связанных данных; приводится справочная информация, касающаяся MARC, RDF, URI и сериализации; объясняется концепция онтологий; приводятся примеры связанных данных, в том числе в библиотеках, и наконец, предлагается несколько проектов связанных данных. Книга опубликована издательством ALA Editions при сотрудничестве Ассоциации библиотек и технических служб (ALCTS), подразделения Американской библиотечной ассоциации. Авторы рецензии отмечают, что книга успешно демонстрирует потенциал связанных данных, при этом не перегружая читателя техническими терминами или сложными примерами; это руководство для библиотекарей, которым необходимо разобраться в сложной концепции связанных данных и превратиться из «сбитых с толку библиотекарей» в уверенных и хорошо подготовленных профессионалов в области данных.

УДК: 02:004+025.321

ГРНТИ: 13.20.31, 13.31

DOI: 10.1080/07317131.2020.1854587

Источник:

https://www.tandfonline.com/doi/full/10.1080/07317131.2020.1854587

Старший каталогизатор-координатор библиотеки Иллинойского университета в Урбана-Шампейне (США) Цян Цзинь (Qiang Jin) в статье «Расширенное обнаружение библиотечных цифровых коллекций с помощью связанных открытых данных» (Enhanced Discovery with Linked Open Data for Library Digital Collections) рассказывает о том, как связанные открытые данные могут быть использованы для описания объектов в цифровых коллекциях. Для исследования была выбрана цифровая коллекция, содержащая 7829 британских романов XIX века из фонда библиотеки Иллинойского университета в Урбана-Шампейне. Метаданные преобразовывались из MARCXML в BIBFRAME 2.0. В ходе проекта выяснилось, что модель BIBFRAME 2.0 – это реальный способ улучшить обнаружение цифровых коллекций внутри и за пределами библиотечных сообществ.

УДК: 02:004+025.321

ГРНТИ: 13.20.31, 13.31

DOI: 10.1080/07317131.2020.1854575

Источник:

https://www.tandfonline.com/doi/full/10.1080/07317131.2020.1854575

Автор статьи «Гораздо больше, чем просто технология: систематический обзор Викиданных в библиотеках» (Much more than a mere technology: A systematic review of Wikidata in libraries) Карим Тарани (Karim Tharani) пишет, что Викиданные набирают популярность в библиотеках как открытая глобальная платформа для совместной работы и обмена метаданными библиотеки. На основе систематического обзора литературы по библиотечным и информационным исследованиям анализируется, как и почему Викиданные используются в библиотеках, а также каковы некоторые преимущества и препятствия, возникшие в результате ранних экспериментов с Викиданными в течение первого десятилетия их существования. Обзор показал, что Викиданные в библиотеках обычно описываются как открытая и многократно используемая база знаний структурированных данных, способная связывать локальные метаданные с сетью глобальных метаданных. Библиотеки начали экспериментировать с Викиданными, чтобы расширить глобальный охват и доступ к своим уникальным коллекциям и работам ученых. Хотя Викиданные обладают большим потенциалом для того, чтобы стать хранилищем для устранения неоднозначности и увязки авторитетных данных, их устойчивая интеграция в библиотечную деятельность остается сложной задачей. Викиданные – это нечто большее, чем просто технология, они предоставляют библиотекарям возможность принять идею социальной справедливости и развивать библиотечное дело на благо мирового общества.

УДК: 025.355+025.321

ГРНТИ: 13.31

DOI: 10.1016/j.acalib.2021.102326

Источник:

https://www.sciencedirect.com/science/article/pii/S0099133321000173?via%3Dihub

Многочисленные исследования демонстрируют, что низкое качество данных в библиографических и авторитетных записях является одним из основных препятствий в управлении данными. Бранка Бадовинац (Branka Badovinac) из Института информационных наук (Марибор, Словения) в статье «Определение качества данных в библиографических и авторитетных записях: тематическое исследование системы COBISS.SI» (Defining Data Quality in Bibliographic and Authority Records: A Case Study of the COBISS.SI System) представляет опыт словенских исследователей в разработке и применении на практике методов определения и измерения качества библиографических и авторитетных записей в базе данных COBIB. В статье приводятся результаты тематического исследования 2019 г., и оценивается применимость предлагаемой структуры контроля качества данных для регулярного и систематического обнаружения и решения как отдельных, так и системных проблем. Проведенное исследование показало, что этот подход позволяет наблюдать за качеством данных с течением времени и определять ключевые проблемы качества для анализа, оценки и дальнейшего развития каталога COBISS+.

COBISS (Co-operative Online Bibliographic System & Services) – библиотечная информационная система, разработанная и поддерживаемая Институтом информационных наук (IZUM). Эта организационная модель связывает отдельные библиотеки в единую библиотечную информационную систему с общей структурой каталогизации и общими инструментами. Она включает сводный каталог/библиографическую базу данных COBIB, локальные библиографические базы данных участвующих библиотек, базу данных COLIB по библиотекам, базу авторитетных записей CONOR и ряд других ресурсов. На конец 2019 г. словенский сегмент системы COBISS.SI включал в себя 916 национальных, университетских, публичных, специализированных и школьных библиотек.

УДК: 025.32:004

ГРНТИ: 13.31

DOI: 10.1080/01639374.2021.1910603

Источник:

https://www.tandfonline.com/doi/full/10.1080/01639374.2021.1910603

В июльском номере Library Journal опубликована статья «Новые технологии четвертой промышленной революции/Ежегодная конференция ALA 2021 г.» (New technologies of the fourth industrial revolution/ ALA Annual 2021). Старший редактор колонки «Технология» Мэтт Энис (Matt Enis) представляет обзор доклада «Новые технологии четвертой промышленной революции: искусственный интеллект, Интернет вещей, роботизация и не только» (New Technologies of the Fourth Industrial Revolution: AI, IoT, Robotics, and Beyond). Доклад был прочитан в рамках Ежегодной конференции и выставки Американской библиотечной ассоциации (ALA) Бохюном Кимом (Bohyun Kim), приглашенным докладчиком и автором новой книги «Цифровой перелом – движение вперед» (Moving Forward with Digital Disruption). Доклад построен на материалах книги. «Новые цифровые технологии несут изменения, которые гораздо стремительнее и обширнее, чем когда бы то ни было, охватывают то, как мы живем, работаем, взаимодействуем друг с другом. Та идея, что степень развития цифровых технологий количественно достигла стадии цифровой революции, все чаще находит поддержку», — считает профессор Бохюн Ким, главный технолог библиотек Университета Род-Айленда, Кингстон, США. Ким приводит примеры того, как технологии размывают границы между миром физического, миром цифрового и миром биологического — это расширенная реальность (дополненная, смешанная, виртуальная), машинное обучение, Интернет вещей, синтетическая биология, применение 3-D биопрототипирования. Эти технологии трансформируют целые системы в производстве и управлении, жизни в целом. Ким останавливается на технологиях Больших данных, связав этот вопрос с темой Интернета вещей — поскольку огромный массив данных генерируется и передается от устройства к устройству… Библиотеки активно внедряют и используют новейшие технологии. Во многих есть творческие пространства, студии виртуальной реальности, многие имеют сервисы управления научно-исследовательскими данными. Эти технологии не противоречат традиционной миссии библиотек, они релевантны потребностям пользователей. Однако Ким отмечает также, что технологии не всегда несут в себе общественное благо, и следует видеть не только их преимущества, но и их ограниченность. При этом, подчеркнул Ким, миссия библиотек остается прежней: мотивировать через знание, информационно поддерживать исследовательскую и образовательную деятельность.

УДК: 330.341.1:62+004-049.8

ГРНТИ: 06.54.07; 50.01

Источник:

https://www.libraryjournal.com/?detailStory=New-Technologies-of-the-Fourth-Industrial-Revolution-ALA-Annual-2021

Грегори Х. Лизер (Gregory H. Leazer), адъюнкт-профессор департамента информационных исследований Калифорнийского университета (Лос-Анджелес, США) в статье «Сильная и слабая степень универсализма в библиографических услугах» (Strong and Weak Universalism in Bibliographic Services) анализирует эссе Патрика Уилсона (Patrick Wilson) «Два вида власти: эссе по библиографическому контролю» и рассматривает мнения ученых-документалистов по следующим вопросам:

- как универсалистские утверждения соотносятся с моделью информационного обслуживания Уилсона;

- как три принципа библиографической универсальности – универсального знания, обслуживания всех пользователей и универсального доступа к знаниям — соотносятся с тем утверждением Уилсона, что библиографический учет носит политический характер в силу того, что каталогизаторы должны принимать решения исходя из требований и форм контроля со стороны сообщества.

Патрик Уилсон - ученый, философ, профессор Калифорнийского университета в Беркли и декан Школы библиотечных и информационных исследований. Он широко известен в библиотечном и информационном сообществах благодаря своим работам, посвященным философским основам библиографии. В его книге «Два вида власти: эссе по библиографическому учету» (1968 г.) впервые высказано предложение о создании Высшего библиографического совета. В задачи такого совета входило бы рассмотрение спорных вопросов, разработка общих принципов и положений библиографического учета. «Библиографический учет, — утверждается в эссе, — это своего рода власть; а просьбы или требования власти — в широком, но все же правильном понимании этого термина, являются политическими запросами».

УДК: 025.32

ГРНТИ: 13.31.23

DOI: 10.1080/01639374.2021.1964011

Источник:

https://www.tandfonline.com/doi/full/10.1080/01639374.2021.1964011

Очередной выпуск журнала Library Technology Reports содержит доклад «Прикладные профили метаданных» (Metadata Application Profiles), представленный двумя сотрудниками библиотек Вашингтонского университета, руководителем отдела метаданных и проектов по каталогизации Теодором Геронтакосом (Theodore Gerontakos) и специалистом по метаданным Бенджамином Ризенбергом (Benjamin Riesenberg). Авторы разделяют профили на две больших категории — в зависимости от того, идет речь о связанных данных или нет. Задачи, которые решают прикладные профили метаданных, достаточно разнообразны, включая реализацию метаданных и их совместимость. Профили метаданных включают в себя четыре элемента: приложение, сущности, свойства, описывающие эти сущности, и значения, присвоенные этим сущностям. Создатели прикладных профилей метаданных собирают эти элементы из уже существующих источников, в том числе с использованием онтологий, схем, схем кодирования словарей, схем кодирования синтаксиса. Прикладные профили метаданных могут быть представлены в традиционном, машиночитаемом или гибридном формате. В докладе приводятся примеры, демонстрирующие специфические характеристики прикладных профилей метаданных.

Для читателей, желающих получить базовые знания о среде описания ресурсов (RDF), авторы доклада рекомендуют следующие материалы, содержащие доступное введение в основные концепции и полезные примеры:

1. Schreiber, Guus, and Yves Raimond, eds. “RDF 1.1 Primer.” W3C Working Group Note, World Wide Web Consortium. June 24, 2014. https://www.w3.org/TR/rdf11-primer

2. Cyganiak, Richard, David Wood, and Markus Lanthaler, eds. “RDF 1.1 Concepts and Abstract Syntax.” W3C Recommendation, World Wide Web Consortium. February 25, 2014. https://www.w3.org/TR/rdf11-concepts

УДК: 025.321

ГРНТИ: 13.31.23

DOI: 10.5860/ltr.57n6

Источник:

https://journals.ala.org/index.php/ltr/issue/view/807

В третьем выпуске журнала под рубрикой «Практические вопросы курирования данных» опубликована статья «Актуальные задачи развития практики и инфраструктуры курирования в Университете Иллинойса в Урбана-Шампейне» (Responding to Reality: Evolving Curation Practices and Infrastructure at the University of Illinois at Urbana-Champaign). Авторы – сотрудники университета Хо Луонг (Ho Q. Luong), Коллин Фаллоу (Colleen Fallaw), Женевьев Шмитт (Genevieve Schmitt), Сюзан Бракстон (Susan M. Braxton) и Хейди Имкер (Heidi Imker).

Банк данных Иллинойса представляет собой структуру, позволяющую размещать научные данные для публичного использования. Описана политика депонирования результатов научной деятельности в Банке данных. В течение пяти лет в Университете Иллинойса в Урбана-Шампейне проводился анализ работы службы научных данных. По итогам анализа данная служба признана самым полезным сервисом учреждения. Внутренние метрики применяются для мониторинга роста, документальных потоков в рамках курирования, и отслеживания актуальных задач, возникающих в процессе обслуживания научных работников. В статье представлены примеры таких задач и их решения.

Некоторые из метрик Банка данных Иллинойса собираются в рамках самой системы, однако их большинство отслеживается автономно с использованием табличного процессора Google Spreadsheet. По окончании формирования каждого массива данных информация анализируется. Несмотря на то, что данные иногда являются достаточно неоднозначными (например, зависят от того, насколько ученый следует предлагаемому сценарию), данные курирования дают общее представление о репозитории, помогают дать оценку рабочим процессам и сервисам. Метрики помогают также определить приоритетность задач развития Банка данных. Процессы курирования помогают оптимизировать и совершенствовать массивы, что положительно сказывается на возможности многократного использования научных данных. Дальнейшее развитие технической инфраструктуры – также в интересах как кураторов, так и пользователей. Эти процессы объединяют усилия авторов и кураторов в деле совершенствования баз данных и облегчают передачу больших файлов.

УДК: 004.65+004.658

ГРНТИ: 50.41.21

DOI: 10.7191/jeslib.2021.1202

Источник:

https://escholarship.umassmed.edu/jeslib/vol10/iss3/3

В своей статье «Практическое курирование данных: извлечение табличных данных из PDF-файлов с использованием инструмента аналитики данных» (Data curation in practice: Extract tabular data from PDF files using a data analytics tool) Эллис Дж. Чой (Allis J. Choi) и Сунг Син (Xuying Xin), Университет штата Пенсильвания, рассказывают о репозитории университета, который носит название ScholarSphere, и практике курирования данных, принятой для хранящихся в нем файлов и массивов данных. В частности, они представляют Microsoft Power BI Desktop — инструмент извлечения табличных данных из PDF-файлов, которые составляют до 80% депонированных материалов университетского комплекса. Данный инструмент позволяет использовать дополнительные данные из PDF-файлов со встроенными таблицами, извлечь которые, как правило, не очень просто. В рамках настоящего исследования подвергнут анализу следующий набор данных: https://doi.org/10.7554/elife.44898.

Курирование данных — процесс управления данными, обеспечивающий их повторное использование и сохранение, а также соблюдение принципов FAIR (легкость обнаружения, доступность, функциональная совместимость, возможность повторного использования). Данный процесс является важной частью исследовательского цикла, поскольку созданные учеными массивы данных должны быть обнаруживаемыми и пригодными для повторного использования — часто это становится условием получения гранта. Кроме того, многими организациями принята политика открытого доступа. В реализации данных принципов ключевые роли играют репозиторий и курирование данных, в нем содержащихся.

УДК: 004.65+004.658

ГРНТИ: 50.41.21

DOI: 10.7191/jeslib.2021.1209

Источник:

https://escholarship.umassmed.edu/jeslib/vol10/iss3/10/

Обсуждение тем, связанных с управлением и обменом научными данными, их совместным и повторным использованием и сохранением, является актуальной задачей для сообщества университетских библиотек. Это задача решается, в том числе, через личное общение, участие в консультациях, программах обучения и тематических мероприятиях, таких как Love Data Week. Это ежегодное международное событие, проводимое библиотеками и другими информационными организациями в США и по всему миру. Из-за пандемии COVID-19 оно прошло в онлайн-формате с 8 по 12 февраля 2021 г. Тема 2021 года: «Данные для лучшего будущего» (Data: Delivering a Better Future).

В статье «Love Data Week 2021 во время COVID-19: контент-анализ мероприятий» (Love Data Week in the time of COVID-19: A content analysis of Love Data Week 2021 events) авторы – Алиса Б. Род (Alisa B. Rod), Марсела Й. Исустер (Marcela Y. Isuster), Мартин Чендлер (Martin Chandler) – анализируют характер и контекст мероприятий в рамках Love Data Week 2021 и дают обзор текущих тенденций в области предоставления научных данных, в частности, о влиянии пандемии COVID-19. Авторы собрали качественную информацию о 242 мероприятиях, проведенных в 37 организациях, и закодировали информацию с помощью метода ручного контент-анализа. Большинство из этих организаций (30) – университеты, а из оставшихся – пять организаций, связанных с информацией (например, Межуниверситетский консорциум политических и социальных исследований, Национальная медицинская библиотека и Служба данных Великобритании), и еще две – поставщики ресурсов (LabArchives и Springer Nature).

Контент-анализ – это систематический метод кодирования, анализа и вывода значения из качественных типов данных, в том числе неструктурированного текста, такого как описания каких-либо событий. В статье представлены описательные результаты контент-анализа, включая основные темы мероприятий (программное обеспечение или цифровые инструменты, управление исследовательскими данными, осведомленность об услугах или продуктах) и основной формат проведения мероприятий (семинары). Авторы обсуждают значение для будущих исследований проведения Love Data Week и тематических недель в целом как успешного способа увеличения охвата, создания сообщества и отслеживания возникающих тенденций в контексте сервисов научно-исследовательских данных. Материалы, используемые авторами, находятся в открытом доступе на портале Scholars Portal Dataverse: https://doi.org/10.5683/SP3/LZ1GYN

Следующая неделя Love Data Week пройдет с 14 по 18 февраля 2022 г. Тема 2022 года: «Данные для всех» (Data is for everyone) #LoveData22

Регистрация для участия: https://myumi.ch/7ejG9

УДК: 002:004+004.65

ГРНТИ: 13.20.31; 20.51; 13.31.23; 20.15.31, 20.23.29, 20.19

DOI: 10.1016/j.acalib.2021.102449

Источник:

https://www.sciencedirect.com/science/article/pii/S0099133321001403#!

Джеймс Э. Эндрюс (James E. Andrews), Хезер Уорд (Heather Ward) и ЧонВон Юн (JungWon Yoon) в статье «UTAUT как модель оценки отношения библиотекарей к внедрению искусственного интеллекта и связанных с ним технологий» (UTAUT as a Model for Understanding Intention to Adopt AI and Related Technologies among Librarians) изучают как университетские и публичные библиотеки относятся к интеграции новых технологий в свою профессиональную практику. Для анализа были выбраны шесть технологий – искусственный интеллект (ИИ), Интернет вещей, облачные вычисления, большие данные, роботы и дополненная и виртуальная реальность. В ходе опроса, проведенного с 16 ноября 2020 г. по 6 января 2021 г. среди библиотекарей Северной Америки, было отобрано 236 респондентов, из них 115 (48,7%) – это сотрудники университетских библиотек и 121 (51,3%) - публичных библиотек. В качестве теоретической основы авторами использовалась Единая теория принятия и использования технологий UTAUT (Unified Theory of Acceptance and Use of Technology) - интегрированная причинно-следственная модель, разработанная для описания и прогнозирования принятия и использования технологий в различных областях. UTAUT позволяет оценить различие между определяющими факторами (ожидаемая производительность, ожидаемые усилия, социальное влияние и благоприятные условия) и опосредующими факторами (пол, возраст, опыт и добровольность использования) и понять, как эти определяющие и опосредующие факторы влияют на поведенческое намерение и последующее поведение при использовании. Четыре определяющих фактора помогают формировать положительное или отрицательное суждение человека о новой технологии. Также авторы выполнили моделирование на основе структурных уравнений (SEM) и соответствующий статистический анализ (с использованием SPSS и AMOS). Результаты исследования показали, что ожидаемая производительность и отношение к использованию ИИ и связанных с ним технологий оказали значительное влияние на намерение библиотекарей внедрить эти технологии, в то время как факторы «социальное влияние» и «ожидаемые усилия» не имели существенного влияния. Авторы пришли к выводу, что модель UTAUT является жизнеспособной интегрированной теоретической основой для будущих направлений разработки и продвижения внедрения и использования новых технологий в библиотеках.

УДК: 02:004.8

ГРНТИ: 13.20.31; 28.23; 19.31; 20.15.31; 13.31.23

DOI: 10.1016/j.acalib.2021.102437

Источник:

https://www.sciencedirect.com/science/article/abs/pii/S0099133321001282

Статья Сары Маннхеймер (Sara Mannheimer) «Повторное использование качественных данных и крупные социальные исследования с точки зрения курирования данных» (Data Curation Implications of Qualitative Data Reuse and Big Social Research) основана на презентации «Поддержка ответственных исследований с получением Больших данных общественного характера: объединение практикующих сообществ» (Supporting Responsible Research with Big Social Data by Connecting Communities of Practice), состоявшейся в рамках Саммита RDAP (Registration Data Access Protocol) 2021 г. Материалы доступны в интернете: https://osf.io/e4u7v.

Большие данные общественного характера (например, данные социальных сетей и блогов) и архивированные качественные данные (например, транскрипты интервью, полевые журналы, дневники) обладают сходством, между тем сообщества, которые являются источником этих данных, не идентичны и практически не пересекаются. В данной статье рассматриваются общие задачи повторного использования качественных данных и Больших данных общественного характера в сфере курирования данных. Автор провела анализ литературы и применила индуктивное кодирование в отношении 300 статей, посвященных вопросу о повторном использовании качественных данных и крупным социологическим исследованиям. В представленной литературе выявлено шесть основных проблем, связанных с использованием и повторным использованием данных, присутствующих в качественных данных и крупных социологических исследованиях – это контекст, качество данных, сопоставимость данных, информированное согласие, право на частную жизнь и конфиденциальность, интеллектуальная собственность и право собственности на данные.

Автор настаивает на том, что специалисты, занятые курированием данных, должны понимать сущность этих проблем, вырабатывать стратегию и соответственно решать задачи их курирования через документирование, комбинирование массивов данных и их объединение через ссылки; поддержку надежных репозиториев; использование и продвижение стандартов для метаданных; обсуждение с исследователями и экспертами организаций альтернативных стратегий для контента; обеспечение деидентификации; обеспечение ограниченного доступа к данным; разработку договоров об использовании данных; управление правами и лицензирование данных; разработку и реализацию альтернативных стратегий архивирования. Решение этих задач по курированию данных обеспечит эффективную практику использования качественных данных и данных крупных социологических исследований.

Registration Data Access Protocol (RDAP) — протокол доступа к регистрационным данным, стандартизирован рабочей группой Инженерного совета Интернета в 2015 г. после изучения экспериментальных разработок и подробнейших обсуждений. RDAP является протоколом-преемником протокола WHOIS и используется для поиска релевантных регистрационных данных на таких ресурсах Интернет, как имена доменов, IP-адреса и номера автономных систем.

УДК: 004.65:303.425

ГРНТИ: 20.01; 04.15; 20.23.17, 20.23.21, 20.23.25

DOI: 10.7191/jeslib.2021.1218

Источник:

https://escholarship.umassmed.edu/jeslib/vol10/iss4/5/

В том же выпуске журнала опубликована статья «Должностные обязанности специалиста по данным в библиотеке и его взгляд на управление научно-исследовательскими данными» (Data Services Librarians’ Responsibilities and Perspectives on Research Data Management). Авторы — Брэдли Уэйд Бишоп (Bradley Wade Bishop), Эшли Орехек (Ashley M. Orehek), Кристофер Икер (Christopher Eaker), Плато Смит (Plato L. Smith). Данное исследование является частью серии работ, посвященных роли библиотекарей и перспективам развития сервисов управления научно-исследовательскими данными в высшем образовании. На основе анализа опыта специалистов определяются функции, которые выполняет библиотекарь в рамках реализации данного сервиса, а также возможности их совершенствования для удовлетворения потребностей академического сообщества. На базе предшествующих исследований авторы определяют контекст, в котором реализуются данные сервисы, а также очерчивают круг данных, которые понадобились им для качественного исследования должностных обязанностей специалистов и задач, которые они решают. Специалисты, принявшие участие в опросе, представляли 10 государственных и 10 частных университетов, вошедших в рейтинг лучших университетов США 2020 г. Им было задано 30 вопросов об их должностных обязанностях и перспективах управления научно-исследовательскими данными. Интервью были записаны и расшифрованы. Стенограммы подверглись анализу в NVivo с использованием методов обоснованной теории: открытого, осевого и избирательного кодирования. На основании ответов респондентов и синонимичных значений была проведена классификация и определены основные направления работы и развития данных сервисов. Построена матрица должностных обязанностей библиотечных специалистов по данным, на основании которой могут строиться дальнейшие исследования и учебные курсы, происходить специализация в профессиональной сфере. Эти обязанности включают в себя: поиск вторичных данных, анализ планов по управлению данными, осуществление информирования, обучение управлению научно-исследовательскими данными. В некоторых случаях к этим обязанностям относится также курирование данных и управление репозиторием организации. Результаты исследования могут оказаться полезными для подготовки библиотечных кадров, при приеме специалистов на работу, при решении задач управления научно-исследовательскими данными.

УДК: 023.5:027.7; 004.65:027.7

ГРНТИ: 20.15.31; 13.31; 14.35; 12.41.55

DOI: 10.7191/jeslib.2022.1226

Источник:

https://escholarship.umassmed.edu/jeslib/vol11/iss1/4/

В первом выпуске журнала Technical Services Quarterly в колонке «Онлайн-технологии» размещены две краткие публикации, посвященные веб-ресурсам по каталогизации.

В первой - Тамара Фульц (Tamara Fultz), сотрудница библиотеки Томаса Дж. Уотсона Художественного музея Метрополитен (Нью-Йорк, США), рассказывает об учебных модулях Программы совместной каталогизации Библиотеки Конгресса США по работе с редактором связанных данных Sinopia (LC-PCC Sinopia Training Modules). Этот редактор был разработан в рамках финансируемого грантом Меллона проекта «Связанные данные для производства» (https://ld4p.org) и предназначен для создания метаданных, в частности, с точки зрения описания ресурсов. Sinopia является веб-инструментом; предпочтительный браузер – Firefox. Учебные материалы, о которых идет речь в публикации, доступны на сайте Библиотеки Конгресса США: https://www.loc.gov/catworkshop/Sinopia-Training/index.html. Они состоят из девяти модулей, каждый из которых представляет собой презентацию в PowerPoint (последнее обновление – 9 марта 2021 г.). Для успешного обучения необходимы базовое понимание стандартов описания ресурсов и доступа (RDA), принципов связанных данных и модели данных для библиографического описания BIBFRAME.

Первые два модуля носят ознакомительный характер и учат ориентироваться в редакторе. В модуле 3 рассматривается поиск в Sinopia. В модуле 4 основное внимание уделяется вкладке «Шаблоны ресурсов» панели навигации Sinopia. Модуль охватывает шаблоны PCC, концепцию шаблонов, выбор соответствующего шаблона, навигацию по шаблону и типы данных, которые пользователи могут вводить в Sinopia. В модулях 5 и 6 более подробно рассматривается ввод данных с использованием литералов (текстовых строк) или поисковых данных (с использованием контролируемых словарей). В модуле 7 рассказывается, как пользоваться инструментами предварительного просмотра, сохранения и редактирования описаний ресурсов. В модуле 8 обсуждается создание связей между различными уровнями описания (произведение, экземпляр и элемент) или создание ссылок на связанные произведения, такие как роман и экранизация романа. Наконец, в модуле 9 описывается, как копировать существующие описания в Sinopia при каталогизации нового издания или переиздания.

Автор отмечает, что текущей версии редактора не хватает двух важных функций — возможности конвертировать описания Sinopia в машиночитаемую запись каталогизации (MARC) и копировать описания из внешних источников.

УДК: 025.355

ГРНТИ: 20.15.31; 13.31; 20.23.29; 19.31; 20.23, 20.51

DOI: 10.1080/07317131.2021.2011127

Источник:

https://www.tandfonline.com/doi/full/10.1080/07317131.2021.2011127

В сдвоенном номере журнала за май-июнь опубликован доклад Фрэнка Доннелли (Frank Donnelly) «Перепись населения в США: концепции и использование результатов в дальнейших исследованиях» (US Census Data: Concepts and Applications for Supporting Research). Перепись населения в США – одно из старейших в мире демографических исследований и мероприятий по подсчету населения такого масштаба. Перепись проводится раз в 10 лет Федеральной службой государственной статистики (она же — Бюро переписи, Census Bureau). В задачи Бюро входит, в том числе, пропорциональное перераспределение между штатами мест в Палате представителей США. На основе статистических данных создан фонд высококачественных, географически привязанных данных, описывающих демографические и социоэкономические характеристики населения США. Данные поступают в режиме реального времени и анализируются по категориям. Доклад знакомит с основами сбора и предоставления статистических данных: концепциями организации переписи, основными наборами данных, обеспечением доступа к ним онлайн и через API, вопросами использования географических информационных систем, данных за прошлые годы и микроданных. Данные представлены на многочисленных порталах и веб-сайтах, которые отражают статистическую информацию в различных аспектах и форматах, что делает ее релевантной потребностям самых разных групп пользователей, в том числе ученых и исследователей. Доклад содержит многочисленные ссылки на эти ресурсы, объединенные соответственно своим источникам, назначению и тематике. Богатейший массив данных является общественным достоянием, доступ к нему открыт и предоставляется бесплатно. Автор уделяет особое внимание возможностям библиотек по работе со статистическими данными, рассказывает, как организовать обслуживание пользователей, о том, как использовать эти данные в планировании развития библиотеки и ее исследовательской деятельности. Библиотеки осуществляют поддержку мероприятий, организуемых Бюро переписи, работают с сообществом (особенно при проведении национальной переписи населения), являются собственно местом ее проведения, предоставляя помещения, компьютерную технику, волонтеров. Библиотеки помогают пользователям находить и интерпретировать статистические данные в научных целях. Эта форма обслуживания получила особое развитие в университетских библиотеках. Кроме того, библиотеки выступают как потребители статистической информации, отражающей возрастной, гендерный, расовый, языковой и образовательный состав пользовательского сообщества, что позволяет создавать дополнительные функциональные сервисы, такие как визуализация данных, производные наборы данных и т.д. Доклад носит просветительско-информационный характер.

УДК: 311.3:021(73)

ГРНТИ: 05.21.21; 04.15

DOI: 10.5860/ltr.58n4

Источник:

https://journals.ala.org/index.php/ltr/issue/viewIssue/832/598

Авторы из Техасского аграрно-механического университета (США) – Чжихун Сюй (Zhihong Xu), Джон Уоттс (John Watts), Сара Бэнкстон (Sarah Bankston) и Лора Саре (Laura Sare) – в статье «Депонирование данных: изучение удобства использования Техасского репозитория» (Depositing Data: A Usability Study of the Texas Data Repository) исследуют опыт работы с репозиторием новых пользователей, незнакомых ранее с его интерфейсом, и предлагают возможные пути совершенствования.

Техасский репозиторий данных (Texas Data Repository, TDR) — это объединенная система управления научно-исследовательскими данными учреждений-членов Техасской цифровой библиотеки, мультиуниверситетского консорциума высших учебных заведений штата Техас. Это платформа для публикации, обмена и архивирования данных, созданных преподавателями, сотрудниками и студентами. Репозиторий (https://dataverse.tdl.org) был создан в 2017 г.; он использует программное обеспечение Dataverse Project, приложение с открытым исходным кодом, разработанное Гарвардским университетом. Техасский репозиторий данных призван «сделать научно-исследовательские материалы бесплатными для всех, в любом месте и в любое время»; исследователи могут публиковать и сохранять данные в соответствии с требованиями финансирующих организаций и научных журналов. В нем можно размещать наборы данных малого и среднего размера, не содержащие конфиденциальной или чувствительной информации, поскольку данные рекомендуется делать общедоступными. Депонированные данные, относящиеся к любой научной дисциплине, могут быть представлены в файле любого типа, что позволяет загружать файлы README и другую дополнительную документацию. К основным преимуществам репозитория относятся возможность формирования и хранения наборов данных, отслеживание версий и присвоение наборам данных цифрового идентификатора объекта для цитирования. Применяется гибридная модель обслуживания, в которой организации-участники могут корректировать необходимые им услуги в зависимости от потребностей и имеющегося персонала. В Техасском аграрно-механическом университете используется модель самостоятельного депонирования с техподдержкой по мере необходимости (в виде семинаров, онлайн-руководств и консультаций).

В ходе исследования авторы провели анализ собранных количественных (т.е. описательных статистических данных) и качественных данных (протоколов по методике «мышление вслух»). Результаты показали, что пользователи в целом были удовлетворены работой с репозиторием. Однако большинство участников испытывали трудности с пониманием разницы между коллекцией данных и набором данных; кроме того они часто считали добавление или редактирование метаданных совершенно непосильным. Также заполнение различных полей метаданных требовало от участников приобретения новых навыков курирования данных. Основываясь на полученных результатах, авторы дают некоторые рекомендации: необходимость разработки эффективных учебных пособий (в виде коротких видео или комбинации письменных и графических инструкций) и обучения основным концепциям депонирования данных и навигации по интерфейсу платформы и пр. Авторы отмечают, что методы, описанные в статье, могут быть применены для дополнительных исследований в различных моделях репозиториев и сервисов.

УДК: 001.103.2+001.89

ГРНТИ: 20.15.05, 20.17.17

DOI: 10.7191/jeslib.2022.1233

Источник:

https://escholarship.umassmed.edu/jeslib/vol11/iss1/6/

БиблиоГоризонт
дайджест зарубежных публикаций
в библиотечно-информационной сфере

"Виртуальное взаимодействие и будущие виртуальные конференции" (Virtual Connections and Virtual Futures)

"Простой инструмент для обнаружения массивов научных данных" (Dataset Search: A lightweight, community-built tool to support research data discovery)

"Связанные данные для сбитого с толку библиотекаря" (Linked data for the perplexed librarian)

"Расширенное обнаружение библиотечных цифровых коллекций с помощью связанных открытых данных" (Enhanced Discovery with Linked Open Data for Library Digital Collections)

"Гораздо больше, чем просто технология: систематический обзор Викиданных в библиотеках" (Much more than a mere technology: A systematic review of Wikidata in libraries)

«Новые технологии четвертой промышленной революции/Ежегодная конференция ALA 2021 г.» (New technologies of the fourth industrial revolution/ ALA Annual 2021)

«Сильная и слабая степень универсализма в библиографических услугах» (Strong and Weak Universalism in Bibliographic Services)

«Прикладные профили метаданных» (Metadata Application Profiles)

«Love Data Week 2021 во время COVID-19: контент-анализ мероприятий» (Love Data Week in the time of COVID-19: A content analysis of Love Data Week 2021 events)

«Повторное использование качественных данных и крупные социальные исследования с точки зрения курирования данных» (Data Curation Implications of Qualitative Data Reuse and Big Social Research)

«Перепись населения в США: концепции и использование результатов в дальнейших исследованиях» (US Census Data: Concepts and Applications for Supporting Research)

«Депонирование данных: изучение удобства использования Техасского репозитория» (Depositing Data: A Usability Study of the Texas Data Repository)