• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Атрибуция архивных рукописных писем с использованием сиамских нейронных сетей

Наталия Михайловна Пронина
1454-1480
Аннотация:

Предложен метод автоматической атрибуции архивных рукописных писем на основе сиамской нейронной сети, решающий ключевую проблему цифровой гуманитаристики – установление авторства исторических документов. Актуальность исследования обусловлена массовой оцифровкой архивов XVII–XIX вв., атрибуция которых затруднена из-за неполных исходных сведений об авторах.


Метод адаптирован к работе с реальным корпусом текстов и учитывает характерные для архивов проблемы: некачественные оцифровки, значительную вариативность почерка и выраженный дисбаланс классов (от 1 до 50 и более образцов на автора). Применение сиамской архитектуры позволяет получать дискриминативные векторные представления, эмбеддинги, на основе которых выполняется не только классификация документов известных авторов, но и эффективно выявляются рукописи, не принадлежащие ни одному из них. Это сужает круг кандидатов для последующей экспертной проверки.


Представлен алгоритм предобработки данных и проведено сравнительное исследование двух подходов к анализу текста: на уровне фрагментов изображения (300 × 300 пикселей) и уровне отдельных строк. Разработанный инструмент предлагает архивным работникам и филологам эффективное решение для предварительной сортировки и атрибуции крупных массивов рукописных документов.

Ключевые слова: сиамская нейронная сеть, идентификация, верификация, атрибуция, рукописный текст, архивные документы, сверточная нейронная сеть, рекуррентная нейронная сеть.

Принципы формирования и представления междисциплинарных коллекций в цифровом пространстве научных знаний

Сергей Александрович Кириллов, Ирина Николаевна Соболевская, Александр Николаевич Сотников
294-314
Аннотация:

Исследованы вопросы формирования междисциплинарных тематических коллекций в цифровом пространстве научных знаний. Рассмотрены содержание работ по формированию и представлению междисциплинарной коллекции, правила организации и представления междисциплинарных цифровых коллекций в информационной среде электронной библиотеки «Научное наследие России». Отмечено, что организация работ по формированию междисциплинарной коллекции в цифровом пространстве знаний предполагает следующие этапы: определение тематики междисциплинарной коллекции, определение структуры разделов междисциплинарной коллекции, определение источников для представления в междисциплинарной коллекции, диспетчеризацию работ с источниками, формирование метаданных, формирование цифровых копий объектов (включая оцифровку и верстку электронного объекта), размещение созданных цифровых копий на специализированной странице междисциплинарной коллекции. Показаны типы и виды междисциплинарных коллекций. Разработаны основные типы разделов, присутствующих в большинстве междисциплинарных проектов. Отмечено, что информация, представляемая в междисциплинарной коллекции, включает две составляющие – метаданные, описывающие характеристики ресурсов, и собственно цифровые информационные ресурсы, а именно, представленные в цифровой форме объекты библиотечного, музейного и архивного хранения – это печатные и рукописные издания, графика, фото-, аудио-, видео-материалы, музейные предметы. Предложена методика отбора материалов для формирования междисциплинарной коллекции на примере создания коллекции, посвященной нобелевским лауреатам, гражданам России и СССР, а также родившимся на территории России и СССР.

Ключевые слова: виртуальная выставка, электронная библиотека, научное наследие, базы данных, электронные фонды, цифровые копии.

Поиск слов в рукописном тексте на основе штриховой сегментации

Иван Дмитриевич Морозов, Леонид Моисеевич Местецкий
1435-1453
Аннотация:

Рукописные архивные документы составляют фундаментальную часть культурного наследия человечества, однако их анализ остается трудоемкой задачей для профессиональных исследователей-историков, филологов и лингвистов. В отличие от коммерческих приложений систем OCR (Optical Character Recognition, оптического распознавания символов), работа с историческими рукописями требует принципиально иного подхода из-за чрезвычайного многообразия почерков, наличия правок и деградации материалов.


Предложен метод поиска в рукописных текстах, основанный на штриховой сегментации. Вместо полного распознавания текста, часто недостижимого для исторических документов, метод позволяет эффективно отвечать на поисковые запросы исследователей. Ключевая идея заключается в декомпозиции текста на элементарные штрихи, формировании семантических векторных представлений с помощью контрастного обучения, последующей кластеризации и классификации для создания адаптивного словаря почерка.


Экспериментально показано, что поиск сравнением кортежей редуцированных последовательностей наиболее информативных штрихов по расстоянию Левенштейна обеспечивает достаточное качество для рассматриваемой задачи. Метод демонстрирует устойчивость к индивидуальным особенностям почерка и вариациям написания, что особенно важно для работы с авторскими архивами и историческими документами.


Предложенный подход открывает новые возможности для ускорения научных исследований в гуманитарной сфере, позволяя сократить время поиска нужной информации с недель до минут, что качественно меняет возможности исследовательской работы с большими архивами рукописных документов.

Ключевые слова: рукописный текст, поиск, штриховый анализ, сегментация, векторное представление, контрастное обучение, кластеризация.

Электронные текстовые ресурсы и долговременное хранение данных в Карельском научном центре РАН

Андрей Анатольевич Крижановский, Анатолий Дмитриевич Сорокин, Виктор Алексеевич Лебедев, Эльвира Викторовна Ямса, Валентина Геннадьевна Старкова, Юлия Андреевна Новикова, Александр Владимирович Чирков, Наталья Борисовна Крижановская, Юлия Васильевна Чиркова
305-367
Аннотация:

Описаны электронные ресурсы Карельского научного центра РАН, связанные с работой электронных библиотек, репозиториев и поисковых систем. Эти ресурсы предназначены для сбора, организации и распространения научной и технической информации (в виде научных публикаций, архивных документов) с целью ее использования в теоретических и прикладных научных дисциплинах. Охарактеризованы этапы разработки названных ресурсов на фоне истории развития отдельных, связанных с ними подразделений (Научная библиотека, Научный архив). Предложены направления развития электронных ресурсов Центра.

Статья распространяется на правах свободной лицензии Creative Commons Attribution-ShareAlike 4.0.

Ключевые слова: Карельский научный центр РАН, электронное архивирование, электронная библиотека.
1 - 4 из 4 результатов
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2025 Казанский (Приволжский) федеральный университет; Институт развития информационного общества