• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Семантический анализ документов в системе управления цифровыми научными коллекциями

Шамиль Махмутович Хайдаров
61-85
Аннотация: Предложены методы семантического анализа документов в системе управления цифровыми научными коллекциями, в том числе электронными научными журналами. Рассмотрены методы обработки документов, содержащих математические формулы, а также способы конвертации этих документов из формата OpenXML в формат TeX. Разработан алгоритм поиска по формулам в коллекциях математических документов, хранящихся в формате OpenXML. Алгоритм реализован в виде онлайн-сервиса на платформе science.tatarstan.
Ключевые слова: семантический анализ, издательские системы.

Электронные текстовые ресурсы и долговременное хранение данных в Карельском научном центре РАН

Андрей Анатольевич Крижановский, Анатолий Дмитриевич Сорокин, Виктор Алексеевич Лебедев, Эльвира Викторовна Ямса, Валентина Геннадьевна Старкова, Юлия Андреевна Новикова, Александр Владимирович Чирков, Наталья Борисовна Крижановская, Юлия Васильевна Чиркова
305-367
Аннотация:

Описаны электронные ресурсы Карельского научного центра РАН, связанные с работой электронных библиотек, репозиториев и поисковых систем. Эти ресурсы предназначены для сбора, организации и распространения научной и технической информации (в виде научных публикаций, архивных документов) с целью ее использования в теоретических и прикладных научных дисциплинах. Охарактеризованы этапы разработки названных ресурсов на фоне истории развития отдельных, связанных с ними подразделений (Научная библиотека, Научный архив). Предложены направления развития электронных ресурсов Центра.

Статья распространяется на правах свободной лицензии Creative Commons Attribution-ShareAlike 4.0.

Ключевые слова: Карельский научный центр РАН, электронное архивирование, электронная библиотека.

Анализ моделей векторных представлений слов в задаче разметки семантических ролей в русскоязычных текстах

Лейсан Маратовна Кадермятова, Елена Викторовна Тутубалина
1026-1043
Аннотация: Изучено влияние использования векторных представлений слов на качество установления семантических ролей в русскоязычных текстах. Задача установления семантических ролей в русскоязычных текстах получила широкое распространение после выхода на свет корпуса FrameBank. Были исследованы модели векторных представлений слов word2vec, fastText и ELMo (Embeddings from Language Models). Анализировались метрики качества микро- и макро-F1 как оценочные показатели результатов автоматической разметки актантов. Был проведен ряд экспериментов, демонстрирующих, что модели ELMo, основанные на токенах предикатно-аргументных конструкций, показывают больший прирост качества по сравнению со всеми остальными моделями, в том числе, в сопоставлении с моделями ELMo, обученными на леммах, как по величине микро-F1, так и по величине макро-F1.
Ключевые слова: машинное обучение, обработка естественного языка, векторные представления слов, семантические роли.

Автоматический анализ тональности текстов по отношению к заданному объекту и его характеристикам

Наталья Валентиновна Лукашевич
88-119
Аннотация:

Статья посвящена рассмотрению подходов к анализу тональности текстов по отношению к заданному объекту, а также его характеристикам (аспектам). Для решения задачи анализа тональности по отношению к характеристикам сущности необходимо решать также задачи извлечения аспектов для сущности, категоризацию или кластеризацию аспектов по аспектным категориям, определение тональности текста по отношению к заданному аспекту или аспектной категории. Также в статье описывается задание по анализу тональности отзывов пользователей в рамках открытого тестирования систем анализа тональности SentiRuEval.

Ключевые слова: анализ тональности, машинное обучение, тематическое моделирование, оценочная лексика, SentiRuEval.

От составителя

Наталья Валентиновна Лукашевич
86-87
Аннотация:

Настоящий выпуск журнала «Электронные библиотеки» представляет собой тематический сборник статей, посвященный проблеме автоматического анализа тональности текстов на русском языке.

Задача анализ тональности состоит в автоматическом определении отношения автора текста (позитивном, негативном или нейтральном) к объектам и ситуациям, о которых говорится в анализируемом тексте. В настоящее время автоматический анализ тональности используется в самых различных приложениях, включая мониторинг репутации компаний и публичных персон, анализ общественных настроений в том или ином регионе, анализ сообществ в социальных сетях и многое другое.

В данном тематическом выпуске представлены статьи участников открытого тестирования систем анализа тональности на русском языке SentiRuEval, провeденном в 2014–2015 годах. В данном тестировании участникам были предложены для решения две основные задачи. 

Алгоритм определения переводов статей с использованием статистических данных

Александр Сергеевич Козицын, Сергей Александрович Афонин, Андрей Александрович Зензинов
494-505
Аннотация: В настоящее время происходит активное внедрение наукометрических систем для автоматизации процесса анализа эффективности деятельности научных организаций с целью применения различных методов стимулирования научной деятельности. Одними из наиболее важных индикаторов являются количество публикаций и их цитируемость. Для оценки этих показателей необходимы средства автоматизированного построения связей между оригинальными статьями и их переводами. В настоящей работе проанализированы существующие методы оценки близости оригинального текста и его возможного перевода, показана их недостаточная эффективность для построения связей между статьями и описаня разработанный авторами метод автоматического поиска переводов статей в больших коллекциях библиографических данных. Особенностью разработанного алгоритма является использование статистических данных о публикации статей в различных журналах и информации о соавторах анализируемых статей. Представленный в настоящей работе алгоритм позволяет осуществлять поиск переводов статей без предварительной настройки на заданные пары языков оригинала и перевода статьи, а также не требует использования больших коллекций обучающих выборок. Апробация программной реализации алгоритма проводилась в наукометрической системе Московского государственного университета (МГУ) им. М.В. Ломоносова. Результаты тестирования показали ее достаточную эффективность и возможность использования разработанного алгоритма для автоматического построения рекомендаций пользователям для отметки в системе переводных версий статей.
Ключевые слова: библиографические данные, анализ графов, перевод, статья, статистика, наукометрия, цитирование, автоматизированные системы.

Формирование расширенных поисковых запросов на основе тезауруса предметной области в онтологии знаний семантической библиотеки

Ольга Муратовна Атаева, Владимир Алексеевич Серебряков, Наталия Павловна Тучкова
271-291
Аннотация: Обсуждены возможности расширения поискового запроса при наличии тезауруса предметной области. Роль контекста, задаваемого связями терминов тезауруса, заключается как в уточнении запроса, так и в увеличении масштабов выборки по запросу. Особое значение процесс расширения запроса имеет для научных предметных областей, где поиск опирается на специальную терминологию. В этом случае необходимо использовать тезаурусы предметных областей, чтобы минимизировать появление информационного шума. Предлагаемый подход позволяет учитывать особенности применения аналогичной терминологии в различных предметных областях. Примеры использования тезауруса отдельных разделов уравнений математической физики и смежных областей демонстрируют эффективность выбранного подхода исследований. Благодаря связям с понятиями информационных ресурсов других областей знаний, расширение информационного запроса захватывает поисковые поля отдаленных предметных областей и различных типов данных, текстов, символьных, звуковых и видеоархивов. Исследования показали, что расширение запроса на основе семантики контекста улучшает качество поиска научных публикаций в цифровой информации и повышает эффективность научных междисциплинарных исследований.
Ключевые слова: сравнение научных текстов, семантический поиск, тезаурус для онтологии знаний, информационный запрос с помощью тезауруса, семантические библиотеки.

Результаты исследований по обнаружению заимствований с использованием анализа цитирований

Вадим Николаевич Гуреев, Николай Алексеевич Мазов
322-331
Аннотация:

Переводной плагиат как одна из наиболее распространенных в научном информационном пространстве разновидностей плагиата представляет собой трудноразрешимую проблему, поскольку практически не поддается автоматизированному выявлению. Между тем за последние пять лет в этом направлении наблюдается прогресс. Авторами настоящей работы, а также группой зарубежных исследователей из нескольких университетов независимо друг от друга был предложен подход к выявлению плагиата на основе анализа цитирований, при котором для анализируемой подозрительной публикации находится возможный первоисточник с идентичным или схожим списком цитируемой литературы, что в итоге позволяет сличать текст на разных языках. Разработанная методика обнаружения неправомерных заимствований в научных текстах успешно прошла тестовые исследования. В статье приведены результаты четырехлетних исследований.

Ключевые слова: обнаружение заимствований, переводной плагиат, выявление плагиата, анализ цитирования, база данных цитирований.

Резервы синтаксического конструирования систем программирования

Лидия Васильевна Городняя
43-61
Аннотация: Работа посвящена анализу возможностей использования современного потенциала информационных технологий при решении задач обработки больших и сложных данных на примере текстов программ и определений языков программирования. Рассмотрена проблема совершенствования современных систем программирования и создания новых языков программирования, нацеленных на эффективное решение задач разработки надёжных и удобных информационных систем.
Ключевые слова: системы программирования, декомпозиция программ, реализационная прагматика, определение языков программирования.

Эволюция методов визуализации коллекций научных публикаций

Зинаида Владимировна Апанович
2-42
Аннотация: Методы визуализации информации давно зарекомендовали себя как инструмент, позволяющий понимать данные большого объема. Визуализация коллекций научных публикаций является частным случаем визуализации информации. В статье рассмотрены задачи, решаемые при помощи визуализации, модели и методы анализа текстовой информации, а также новые подходы к визуализации документов. Особое внимание уделено тому, каким образом методы визуализации связаны с методами анализа коллекций научных публикаций.
Ключевые слова: визуализация коллекций документов, анализ текстов, алгоритмы визуализации текстов и метаданных, LDA, NMF, word2vec.

О лицензионном договоре на издание служебного произведения

Татьяна Алексеевна Полилова
119-141
Аннотация: В соответствии с Гражданским кодексом РФ научное произведение является результатом интеллектуальной деятельности, которому предоставляется государственная охрана. Автору научного произведения (в частности, статьи) принадлежат право авторства, право на имя и иные неимущественные права. Если статья создается в рамках выполнения автором своих служебных обязанностей, исключительное право на служебное произведение принадлежит работодателю.
С согласия работодателя автор заключает с издательством лицензионный договор на опубликование статьи в научном издании на условиях, предложенных издателем. Заключение лицензионного договора не влечет за собой переход исключительного права к издателю. Даже если работодатель поручил автору заключить авторский договор с издателем на условиях исключительной лицензии, работодатель сохраняет за собой право использовать произведение, в том числе, право опубликовать произведение на своем сайте.
За автором (правообладателем) навсегда сохраняется право создавать производные произведения. Нередко навязываемые издателем условия лицензионного договора, ограничивающие право автора создавать произведения на основе ранее опубликованной статьи, ничтожны (т. е. не имеют юридической силы).
Опубликование автором производных произведений, содержащих фрагменты текста из предыдущих статей автора, не должно огульно считаться нарушением издательской этики. Термины «самоплагиат», «автоплагиат» являются некорректными.
В Гражданском кодексе РФ закреплен механизм простых (неисключительных) лицензий, позволяющий нескольким издателям опубликовать статью без ее переработки. Опубликование статьи в нескольких изданиях — это один из законных способов реализации права автора (правообладателя) на широкое обнародование произведения.
Ключевые слова: научная публикация, служебное произведение, исключительное право, лицензионный договор, авторский договор, исключительная лицензия, простая лицензия, производное произведение, повторное использование текста, избыточная публикация.

In situ двухдиапазонная 3D-дефектоскопия стенописей архитектурных памятников

Влада Владимировна Кугуракова, Евгений Юрьевич Зыков, Алексей Валерьевич Касимов, Айрат Габитович Ситдиков, Андрей Андреевич Скобелев, Евгения Флюровна Шайхутдинова
538-558
Аннотация: Статья посвящена проблеме создания методики мониторинга состояния и систематизации сведений о фресковой живописи объектов культурного наследия. Проблема может быть решена путем компиляции традиционного метода картографирования фресок с применением современных средств визуализации. Описана новая технология Project Tango для фиксации текстур сложных 3D внутренних объёмов архитектурных памятников. Предложены методика экспресс сканирования с автоматическим картограммированием для дальнейшего сравнительного анализа изменения состояния стенописей и методика оценки процента утраты.
Ключевые слова: дефектоскопия, трехмерная визуализация, Project Tango, инфракрасный датчик, SLAM, SFM, PTAM, Structure from motion, Monocular vision, Stereo vision, архитектурный памятник, объект культурного наследия, мониторинг, картограммирование.

Проблема корректного использования терминов в компьютерной реконструкции

Екатерина Владимировна Разувалова, Константин Александрович Руденко
242-253
Аннотация: Рассмотрены проблемы соотношения и взаимодействия двух терминов, используемых при реконструкции исторической среды, – визуализация и виртуализация. Рассмотрена история их образования и формирования, а также сделаны выводы по более корректному их использованию. Важно помнить, что визуализация различной информации была за долго до изобретения компьютера и создания 3D-платформ. Человечество давно использует цифры, тексты, картины, зарисовки, макеты для наглядного представления данных, превращая их в визуальные элементы. Это неотъемлемая часть повседневной жизни современного человека.
Ключевые слова: визуализация, виртуализация, компьютерная реконструкция, визуальная модель, виртуальный̆ мир.
1 - 13 из 13 результатов
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2025 Казанский (Приволжский) федеральный университет; Институт развития информационного общества