БиблиоГоризонт

В своей статье «От ChatGPT к CatGPT. Возможности искусственного интеллекта для библиотечной каталогизации» (From ChatGPT to CatGPT. The Implications of Artificial Intelligence on Library Cataloging) Рихард Бжустович (Richard Brzustowicz) рассказывает о возможности решать функциональные библиотечные задачи при помощи технологий искусственного интеллекта (ИИ). Автор анализирует потенциал языковых моделей, подобных ChatGPT, в отношении трансформации библиотечной каталогизации. Опираясь на эксперименты, проведенные им с использованием ChatGPT, автор демонстрирует возможность генерировать точные записи при помощи протокола RDA и иных стандартов, таких как набор элементов метаданных Дублинского ядра (Dublin Core). Автор задал ChatGPT задачу сгенерировать 6 библиографических записей, в том числе одной не имеющей соответствия в WorldCat, после чего сравнил полученные записи с составленными каталогизатором-человеком. Была проведена оценка точности, эффективности ChatGPT и способности его справляться с различными видами и стандартами каталогизации и метаданных. Автор убедился, что ИИ может генерировать записи, соответствующие различным стандартам метаданных; может извлекать с достаточной точностью необходимые метаданные, такие как заглавие, автор, издатель, дата публикации, предметные рубрики, иные элементы описания. Кроме того, ChatGPT генерировал записи независимо от формата, носителя или языка материала, как совпадающие с существующими авторитетными записями, так и полностью оригинальные. В диалоге с ChatGPT автор выяснил, что ИИ прошел обучение на данных из различных каталогов, в том числе Библиотеки Конгресса США, Национальной медицинской библиотеки США, Британской Библиотеки, COPAC (Каталога университетских и национальных библиотек Великобритании), Europeana, а также Цифровой библиотеки HathiTrust. Это уже указывает на некую проблему, поскольку эти каталоги имеют различную политику в отношении доступа и использования своих данных. Отмечено несколько аспектов проблем, связанных с интеллектуальной собственностью и способностью ChatGPT генерировать контент, например, нарушение авторских прав, неправильное определение авторства, право на сам сгенерированный ChatGPT контент, а также ненамеренное раскрытие чувствительной или конфиденциальной информации.

Полученные результаты демонстрируют потенциал ChatGPT как инструмента модернизации и повышения эффективности процесса создания записей в библиотеке. Автор приходит к выводу, что для ответственного внедрения данной инновационной технологии в сфере библиотечной каталогизации необходимы дальнейшие исследования и разработки, а также процедуры и технологии контроля со стороны человека.

УДК: 004.8:025.3

ГРНТИ: 13.31.19, 13.31.33

DOI: 10.5860/ital.v42i3.16295

Источник:

https://ital.corejournals.org/index.php/ital/article/view/16295