• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Тактическая сортировка управленческих задач при их администрировании посредством меток Приоритетов, Спецификаций и Аффилиаций

Феликс Освальдович Каспаринский
733-745
Аннотация: Проанализирована специфика функционала программ управления стратегическими, тактическими и оперативными задачами. Предложена методика предварения названий оперативных задач тактическими метками Приоритетов, Спецификаций и Аффилиаций. Аббревиатуры меток формируются таким образом, чтобы обеспечить правильную расстановку приоритетов при сортировке задач по алфавитному порядку. Квадранты матрицы Приоритетов Д. Эйзенхауэра обозначаются двухбуквенными метками: важно срочно (IF – Important, Fast); важно бессрочно (IS – Important, Slow); не важно, но оперативно (UF – Unimportant, Fast): не важно и не срочно (US – Unimportant, Slow). Метки матрицы Спецификаций информационной среды (RA, RI, SA, SI) компонуются из взаимоисключающих свойств доступности Сети (I – Internet и A – Autonomous) и наличия редуцированного или специального функционала (R– Reduced и S – Special). Метки Транспортной спецификации (TA, TB, TC, TP) позволяют сортировать задачи, требующие перемещения (T – Translocation) на самолёте (A – Airplane), автобусе (B – Bus), автомобиле (C – Car) и пешком (P – Pedestrian), соответственно. Трёхбуквенные метки Аффилиации (принадлежности физическому или юридическому лицу) формируются из первых букв имени, отчества и фамилии или наименования лаборатории, компании, проекта. Тактические метки ускоряют принятие решений при формировании ежедневного списка оперативных задач.
Ключевые слова: задача, планирование, управление, приоритет, спецификация, аффилиация, метка, оперативный, тактический.

Проектирование интегрированных заданий при обучении компьютерному моделированию

Ольга Александровна Широкова , Татьяна Юрьевна Гайнутдинова
378-393
Аннотация:

Рассмотрено возможное использование LMS Moodle при разработке курса «Использование компьютерного моделирования в образовании». Курс основан на внедрении в учебный процесс междисциплинарной интеграции высшей математики, компьютерного моделирования, программирования и предполагает использование систем компьютерной математики и программных сред. Представлены примеры конкретных интегрированных заданий.


При проектировании учебного курса «Использование компьютерного моделирования в образовании» в LMS Moodle использован следующий набор элементов: «лекция», «задание», «тест», «форум», «ресурс», «wiki», «чат», «глоссарий».


Использование методики составления интегрированных заданий на базе LMS Moodle показало, что: интегрированные задания с использованием информационных технологий способствуют повышению уровня усвоения материала сложных разделов высшей математики; содержание курса высшей математики является фундаментальной основой материала, изучаемого в предлагаемом курсе, и способствует глубокому пониманию математических дисциплин; интегрированные проектные задания формируют практические умения и навыки компьютерного моделирования с использованием программирования в различных программных средах.

Ключевые слова: интегрированные задания, высшая математика, компьютерное моделирование, программирование, LMS Moodle, системы компьютерной математики.

How to Assign Grades to Tasks so as to Maximize Student Efforts

Laxman Bokati, Vyacheslav Kalashnikov, Natalalia Kalashnykova, Olga Kosheleva, Vladik Kreinovich
773-779
Аннотация: In some classes, students want to get a passing grade (e.g., C or B) by spending the smallest amount of effort. In such situations, it is reasonable for the instructor to assign the grades for different tasks in such a way that the resulting overall student's effort is the largest possible. In this paper, we show that to achieve this goal, we need to assign, to each task, the number of points proportional to the efforts needed for this task.
Ключевые слова: Grade assignment, maximizing student efforts.

Базы знаний для описания информационных ресурсов в молекулярной спектроскопии. 3. Формирование базовой и прикладной онтологии

А.И. Привезенцев, Д.В. Царьков, А.З. Фазлиев
Аннотация: Статья посвящена описанию свойств решений задач в предметной области «Количественная спектроскопия» и детализирует результаты работы [1]. Для представления свойств решений задач используется язык OWL DL. В качестве примера рассмотрена прикладная онтология источников информации о свойствах решений прямой и обратной задачи нахождения вакуумных волновых чисел в молекулярной спектроскопии диоксида углерода и его изотопологов. Показано, что создание источника информации, характеризующих свойства решения задачи, позволяет классифицировать решения задач количественной спектроскопии и организовывать семантический поиск достоверных данных в публикациях. Дано краткое описание особенностей табличного метода используемого в машине вывода FACT++.
Ключевые слова: количественная спектроскопия, язык OWL DL, вакуумные волновые числа, молекулярная спектроскопия диоксида углерода, семантический поиск.

Исследование когнитивной функции при генерации эллиптических предложений в планиметрических задачах

Владимир Андреевич Пархоменко, Ксения Александровна Найденова, Татьяна Александровна Мартирова, Александр Валентинович Щукин
316-335
Аннотация:

Работа посвящена изучению когнитивной функции, связанной с генерацией эллиптических предложений в русском языке. Исследование проводилось на основе тестирования этой когнитивной способности с помощью компьютерной системы, специально разработанной авторами для этой цели. Тестирование этой когнитивной способности предложено и реализовано впервые. Система является расширением Moodle и открыто размещена в репозитории github. Эллиптические конструкции ограничиваются глагольными и именными эллипсисами, которые теоретически возможно полностью восстановить на основе контекста предложения. Исследование проводилось с участием в качестве респондентов студентов СПбПУ. В качестве предметной области были выбраны тексты планиметрических задач. В результате анализа данных тестирования получены следующие результаты: установлено влияние знаний респондента предметной области (планиметрии) на результаты тестирования; обнаружена тенденция к самообучению респондентов, что проявляется в сокращении времени и увеличении баллов по мере прохождения тестов; показано, что респонденты слабо мотивированы, если не видят отзыв на ответ по выполненному заданию.


Обсуждены проблемы дальнейшего развития системы тестирования и её применения при адаптации опросников (заданий) для оценки знаний студентов СПбПУ в области автоматизации обнаружения ошибок в программах, а также диагностики функционального состояния специалистов операторского профиля и экспресс-диагностики деменции. Перспективным представляется также применение системы для совершенствования процессов синтаксического разбора эллиптических предложений и автоматизации восстановления эллипсисов в предметной области планиметрии.

Ключевые слова: онлайн-система тестирования, разработка системы тестирования, когнитивная функция, эллипсис, планиметрия.

Базы знаний для описания информационных ресурсов в молекулярной спектроскопии. 5. Качество экспертных данных

А.Ю. Ахлёстин, Н.А. Лаврентьев, А.И. Привезенцев, А.З. Фазлиев
Аннотация: Показано, что доверие к контенту информационных ресурсов можно оценивать с помощью критерия опубликования и разделять ресурсы на доверяемую и сомнительную части. Задача оценки доверия состоит их четырех подзадач: (1) построения мультимножеств физических величин, содержащихся в первичных источниках данных, (2) согласования значений физических величин, (3) формирования количественных ограничений для критерия опубликования в разных интервалах изменения физических величин и (4) декомпозиции экспертных данных. Кратко описаны критерии достоверности спектральных данных и ограничения необходимые для решения задач согласования данных. Представлено табличное представление результатов согласования. На примере вакуумных волновых чисел описаны ограничения характерные для критерия опубликования. Оценки доверия, полученные из решения задачи декомпозиции, представлены в форме OWL-онтологий. Построение онтологической базы знаний подобного типа для виртуальных центров данных в дисциплинах с большими объемами данных измерений обеспечит автоматический выбор информационных ресурсов с высокой степенью доверия.
Ключевые слова: спектроскопия, согласование данных, доверие к контенту ресурсов, критерий опубликования.

Извлечение аспектов товаров или услуг из отзывов потребителей с использованием модели условных случайных полей

Юлия Владимировна Рубцова, Сергей Андреевич Кошельников
203-221
Аннотация: Описана система, принимавшая участие в соревновании SentiRuEval-2015 по автоматическому извлечению аспектов из отзывов и оценке этих аспектов по тональности. В основе разработанной системы лежит алгоритм условных случайных полей (CRF), она использовалась в решении двух подзадач и тестировалась на двух предметных областях: рестораны и автомобили. Для обеих задач и обеих предметных областей показаны высокие показатели метрики полноты. Это означает, что система может вполне успешно находить аспектные термины. Вместе с тем, полученный низкий показатель точности свидетельствует о том, что система принимает за аспектные достаточно много терминов, которые аспектными не являются. В целом же система показала сравнительно хорошие результаты по сравнению с другими участниками соревнования.
Ключевые слова: извлечение знаний, извлечение аспектов, CRF.

Семантическое сходство в задаче аспектно-эмоционального анализа

Евгений Вячеславович Котельников, Павел Дмитриевич Блинов
120-137
Аннотация:

Исследуется проблема аспектно-эмоционального анализа текста. По сравнению с общим анализом тональности такой вариант является более сложным по причине наличия ряда сопутствующих подзадач, таких, как выделение аспектных терминов, определение тональности по отношению к этим терминам и аспектным категориям. Однако решение данной проблемы значительно расширяет возможности систем автоматического анализа неструктурированного текста.

Приведен обзор предыдущих работ в области аспектно-эмоционального анализа, описаны обучающие и тестовые данные семинара SentiRuEval. Для задачи извлечения аспектных терминов использовано векторное пространство распределенных представлений слов. Тональность аспектных терминов определяется на основе функций совместной информации и семантического сходства. Приведены сравнительные результаты на тестовых данных и заключительные выводы.

Ключевые слова: аспектно-эмоциональный анализ текста, взаимная информация, распределённые представления слов, машинное обучение, SentiRuEval.

Qualitative Analysis of the Relationship Between Teachers and Students`not-Knowing in the Process of Solving Reasoning Tasks

Kevin Fierro, Mourat Tchoshanov, Gulshat Shakirova
749-758
Аннотация: Mason and Spence’s (1999) work demonstrate a detailed view into the concept of knowing. Although they highlight the importance of not-knowing as a first step, it is a topic that is not well researched. This study aims at expanding that research, by analyzing not-knowing expressions from teacher to student and possible connections to be found. During a course of geometric reasoning student teachers were asked to reason with a tangram while simultaneously recording their expressions of not-knowing and reflecting on it periodically. Student teachers were then tasked to teach this lesson to their students, who would also reflect and express their forms of not-knowing. Findings presented no real link between teacher-student expressions of not-knowing, but two major conclusions were made. Individuals altogether struggle conveying their not-knowing clearly and when they did express it, these expressions leaned heavily on not-knowing-that and not-knowing-how forms. A discussion follows to interpret said findings. A conclusion is made detailing key points in the study and what comes next for the concept of not-knowing.
Ключевые слова: knowing, not knowing, secondary school mathematics teachers.

О проблеме актуальности прикладных задач в информационном обществе

Елена Кирилловна Каштанова
392-400
Аннотация: Информационное общество характеризуется постоянным обновлением идей, теорий, техники и технологий. В этих условиях достижение актуального уровня для прикладных задач представляет определенную проблему. В статье предложены варианты формирования комплекса прикладных задач.
Ключевые слова: прикладная задача, информационное общество, компетенция, теория вероятностей, математическая статистика.

Учёт структуры документа в методе автоматического аннотирования математических понятий в образовательных текстах

Константин Сергеевич Николаев
558-577
Аннотация:

Обогащение образовательных текстов семантическим содержимым (в частности, дополнение документа гиперссылками на страницы сервиса, отображающего подробную информацию о понятиях, используемых в тексте) способствует повышению эффективности усвоения материала обучающимися. Существующие методы семантической разметки образовательных текстов не учитывают структурные особенности таких документов, что приводит к избыточному распознаванию понятий.


В статье описано развитие метода автоматического аннотирования математических понятий в образовательных математических текстах путем добавления функционала для учета структуры образовательного документа. Основное назначение метода заключается в обработке образовательных материалов курса дистанционного образования «Технология решения планиметрических задач». Соблюдение единого шаблона при создании страниц курса позволяет применить анализ веб-разметки страниц и ключевых слов, примененных создателями курса. Основной задачей в данном процессе является определение типа ячеек таблицы, в которых находятся текстовые фрагменты образовательных материалов. В соответствии с рекомендациями создателей курса, определения необходимо выделять в ячейках, содержащих постановку задачи, а также в тех блоках, где указаны входные данные задачи. Определение типа ячеек таблиц производится с помощью анализа их атрибутов и поиска ключевых слов в их содержимом. Такое ограничение распознаваемых фрагментов текста позволяет улучшить восприятие страниц курса учеником и повысить качество усвоения учебного материала.

Ключевые слова: семантический анализ, математическая онтология, дидактические отношения, математическое образование, разметка документа.

Применение машинного обучения к задаче генерации поисковых запросов

Александр Михайлович Гусенков, Алина Рафисовна Ситтикова
272-293
Аннотация:

Исследованы две модификации рекуррентных нейронных сетей: сети с долгой краткосрочной памятью и сети с управляемым рекуррентным блоком с добавлением механизма внимания к обеим сетям, а также модель Transformer в задаче генерации запросов к поисковым системам. В качестве модели Transformer использована модель GPT-2 от OpenAI, которая обучалась на запросах пользователей. Проведен латентно-семантический анализ для определения семантических сходств между корпусом пользовательских запросов и запросов, генерируемых нейронными сетями. Для проведения анализа корпус был переведен в формат bag of words, к нему применена модель TFIDF, проведено сингулярное разложение. Семантическое сходство вычислялось на основе косинусной меры. Также для более полной оценки применимости моделей к задаче был проведен экспертный анализ для оценки связности слов в искусственно созданных запросах.

Ключевые слова: обработка естественного языка, генерация естественного языка, машинное обучение, нейронные сети.

Задача сортировки на графах в олимпиадах по программированию

Михаил Иванович Киндер, Андрей Витальевич Казанцев
384-391
Аннотация: Разобрана задача сортировки данных, отношение порядка между которыми описано в виде отношения смежности вершин на произвольном графе. Выделены подзадачи и вопросы, относящиеся к «окрестности» проблемы; их решение представляет собой своеобразные уровни «погружения» в решение общей задачи. Обсуждены алгоритмы решения отдельных подзадач для графов специального вида, а также различные подходы к решению проблемы сортировки в общем случае. Задача сортировки такого типа предлагалась на Кубке международной школы ISI-Junior по спортивному программированию в июле 2019 года (г. Иннополис).
Ключевые слова: олимпиады по информатике, олимпиады по математике, олимпиады по спортивному программированию, многоуровневые задачи, исследовательские задачи для школьников, задача сортировки на графах.

Эффективность интегрированного обучения математике и информационным технологиям

Ольга Александровна Широкова, Татьяна Юрьевна Гайнутдинова, Марина Юрьевна Денисова
531-547
Аннотация:

Предложена методика, связанная с использованием при обучении математике интегрированных проектных заданий, основанных на практическом применении полученных знаний по математическим дисциплинам во взаимосвязи с компьютерным моделированием и программированием. Представлены примеры конкретных интегрированных проектных заданий.

Ключевые слова: математическое образование, компьютерные технологии, интегрированные проектные задания, компьютерное математическое моделирование, программирование.

Экспериментальное исследование порогового метода HSV и нейронной сети U-Net в задаче распознавания пожаров

Максим Владимирович Бобырь, Наталья Анатольевна Милостная, Богдан Андреевич Бондаренко, Максим Максимович Бобырь
829-851
Аннотация:

Проведен сравнительный анализ методов сегментации изображений пожара с использованием пороговой обработки в цветовом пространстве HSV и нейронной сети U-Net. Цель исследования заключалась в оценке эффективности этих подходов по времени выполнения и точности детекции огня на основе метрик RMSE, IoU, Dice и MAPE. Эксперименты были проведены на четырех различных изображениях пожара с вручную подготовленными истинными масками пожаров. Результаты показали, что метод HSV обеспечивает высокую скорость обработки (0.0010–0.0020 с), но склонен к детекции не только огня, но и дыма, что снижает его точность (IoU 0.0863–0.3357, Dice 0.1588–0.5026). Нейронная сеть U-Net демонстрирует более высокую точность сегментации огня (IoU – до 0.6015, Dice – до 0.7512) за счет избирательного выделения пламени, однако требует значительно большего времени (1.2477–1.3733 с) и может недооценивать общую площадь пожара (MAPE – до 78.5840%). Визуальная оценка подтвердила различия в поведении методов: HSV захватывает дым как часть целевой области, тогда как U-Net фокусируется исключительно на огне. Выбор между методами зависит от приоритетов задачи: скорости или точности. Предложены направления дальнейших исследований, включая оптимизацию U-Net и разработку гибридных подходов.

Ключевые слова: сегментирование, локализация пожаров, HSV-сегментация, U-Net.

Представление трёхмерных объектов для логических преобразований в реальном времени

Илья Евгеньевич Плотников, Даниил Иванович Костюк
484-505
Аннотация:

Дан сравнительный анализ методов представления трёхмерных объектов для выполнения булевых операций в реальном времени в среде игрового движка Unity. Рассмотрены четыре основных подхода: полигональное представление на основе конструктивной твердотельной геометрии (CSG), функции знакового расстояния (SDF), воксельные методы и CAD-системы с представлением границ (B-Rep) и NURBS-поверхностями.


Проведено экспериментальное исследование производительности полигональных алгоритмов булевых операций и SDF-функций на основе реализации ray marching. Выявлено, что полигональные методы характеризуются высокими начальными затратами на построение системы, но обеспечивают стабильную производительность при длительных операциях и сохранение результатов преобразований. SDF-функции демонстрируют высокую скорость выполнения операций и гибкость в создании сглаженных переходов между объектами, однако ограничены в применении для долговременных задач из-за особенностей вычислительной модели.


Определены области эффективного применения каждого подхода: полигональные методы рекомендуются для задач, требующих точного геометрического контроля и интеграции с традиционными графическими конвейерами, в то время как SDF-функции оптимальны для процедурной генерации, многослойного рендеринга материалов и создания динамических визуальных эффектов. Результаты исследования могут быть использованы при разработке интерактивных симуляторов, игровых приложений и систем виртуальной реальности.

Ключевые слова: булевы операции, трёхмерное моделирование, конструктивная твердотельная геометрия, функции знакового расстояния, SDF-функции, Unity, реальное время, полигональные сетки, ray marching.

Преподавание математических дисциплин с использованием цифровой образовательной платформы Мирера

Александр Георгиевич Леонов
312-323
Аннотация:

Изложен опыт цифровой трансформации математических дисциплин на базе авторской цифровой образовательной платформы (ЦОП) Мирера. ЦОП Мирера оптимизирована на российскую систему организации высшего образования, ориентирована на разработку и проведение курсов, в которых сочетаются онлайн- и оффлайн-технологии проведения учебного процесса. ЦОП Мирера предоставляет авторам курсов инструменты разработки компьютеризированных курсов с автоматизированной проверкой правильности и самостоятельности выполненных обучаемыми текущих и контрольных заданий с помощью методов искусственного интеллекта. В платформу встроены различные оригинальные типы тестов, поддерживающие как в описании задач, так и в вариантах ответов, контент в различных форматах, включая формульные фрагменты в TeX-нотации, последовательности элементов (для автоматизированной проверки знания студентом структуры доказательства теорем курса или схем решения типовых задач), смысловой анализ текстовых ответов и т. п.

Ключевые слова: адаптивное обучение, цифровая образовательная платформа, ЦОП Мирера, программирование, web-приложения.

Обучение учащихся способам саморегуляции при решении математических задач

Мария Андреевна Кислякова
609-618
Аннотация: Актуальная проблема современной теории и методики обучения математике – обучение способам саморегуляции в процессе решения математических задач. Приведены рекомендации и примеры проведения осознанной саморегуляции учащихся при решении математических задач.
Ключевые слова: методы обучения, математические задания, методы саморегуляции.

Классификация изображений с использованием обучения с подкреплением

Артем Александрович Елизаров, Евгений Викторович Разинков
1172-1191
Аннотация:

В последнее время активно развивается такое направление машинного обучения, как обучение с подкреплением. Как следствие предпринимаются попытки использования обучения с подкреплением для решения задач компьютерного зрения, в частности для решения задачи классификации изображений. Задачи компьютерного зрения являются на сегодняшний день одними из наиболее актуальных задач искусственного интеллекта.


В статье предложен метод классификации изображений в виде глубокой нейронной сети с использованием обучения с подкреплением. Идея разработанного метода сводится к решению задачи о контекстном многоруком бандите с помощью различных стратегий достижения компромисса между эксплуатацией и исследованием и алгоритмов обучения с подкреплением. Рассмотрены такие стратегии, как -жадная, -softmax, -decay-softmax и метод UCB1, и такие алгоритмы обучения с подкреплением, как DQN, REINFORCE и A2C. Проведен анализ влияния различных параметров на эффективность работы.

Ключевые слова: машинное обучение, классификация изображений, обучение с подкреплением, задача о контекстном многоруком бандите.

Применение синтетических данных в задаче обнаружения аномалий в сфере информационной безопасности

Артем Игоревич Гурьянов
187-200
Аннотация:

В настоящее время в машинном обучении высокую актуальность имеют синтетические данные. Современные алгоритмы генерации синтетических данных дают возможность генерации данных, очень близких по статистическим свойствам к исходным данным. Синтетические данные используются на практике в широком спектре задач, в том числе связанных с аугментацией данных.


Предложен метод аугментации данных, совмещающий подходы увеличения объема выборки с помощью синтетических данных и генерации синтетических аномалий. Метод использован для решения задачи в сфере информационной безопасности, заключающейся в поиске аномалий в журналах сервера с целью обнаружения атак.


Модель, обученная в рамках решения названной задачи, показала высокие результаты. Это демонстрирует эффективность использования синтетических данных для увеличения объема выборки и генерации аномалий, а также возможность с высокой результативностью использовать эти подходы совместно.

Ключевые слова: синтетические данные, обнаружение аномалий, информационная безопасность, генерация аномалий, аугментация данных, машинное обучение.

Методика сравнения программных решений распознавания текстов научных публикаций по качеству извлечения метаданных

Илия Игоревич Кузнецов, Олег Пантелеевич Новиков, Дмитрий Юрьевич Ильин
654-680
Аннотация:

Метаданные научных публикаций используются для построения каталогов, определения цитируемости публикаций и решения других задач. Автоматизация извлечения метаданных из PDF-файлов позволяет ускорить выполнение обозначенных задач, а от качества извлеченных данных зависит возможность их дальнейшего использования. Проанализированы существующие программные решения, в итоге отобраны три: GROBID, CERMINE, ScientificPdfParser. Предложена методика сравнения этих программных решений распознавания текстов научных публикаций по качеству извлечения метаданных. На основе методики проведен эксперимент по извлечению четырех типов метаданных (название, аннотация, дата публикации, имена авторов). Для сравнения программных решений использован набор из 112457 публикаций с разбиением на 23 предметные области, сформированный на основе данных Semantic Scholar. Приведен пример выбора эффективного программного решения извлечения метаданных в условиях заданных приоритетов для предметных областей и типов метаданных с использованием взвешенной суммы. Определено, что для приведенного примера CERMINE показывает эффективность на 10,5% выше, чем GROBID, и на 9,6% выше, чем ScientificPdfParser.

Ключевые слова: распознавание текста, научные публикации, метаданные, качество извлечения данных, методика.

Применение методики проведения математических боев при обучении геометрии

Андрей Александрович Масленков, Александр Ефимович Масленков, Сергей Александрович Масленков
655-659
Аннотация: Разработаны проекты по планиметрии как домашние, однотипные варианты из 12 задач в виде чертежей на одной странице. Защита проектов – это геометрические бой, аналог математического боя.
Ключевые слова: планиметрия, проекты, чертежи, защита проектов, геометрический бой.

Использование синтаксиса для анализа тональности твитов на русском языке

Юлия Владимировна Адаскина, Полина Вадимовна Паничева, Андрей Михайлович Попов
163-184
Аннотация:

Представлен подход к решению задачи анализа тональности в рамках тестирования SentiRuEval – открытого соревнования систем анализа тональности на русском языке. Описанный алгоритм был применен в дорожке по анализу тональности твитов о банках и телекоммуникационных компаниях. Для этих данных была разработана и оценена классификация на три класса: положительный, отрицательный и нейтральный.

Для решения поставленной задачи использовались различные алгоритмы машинного обучения. Признаками для классификатора являлись лингвистические данные, полученные из текста с помощью разработанного нами морфо-синтаксического анализатора. Нормализованные слова, а также синтаксические связи, оказались решающими признаками для достижения наилучшего результата, который был получен с помощью статистического алгоритма опорных векторов.

Оценка, проведенная организаторами конкурса, выявила высокое качество предложенного подхода, который занял первую строчку по трем из четырех мерам качества.
Ключевые слова: анализ тональности, синтаксические связи, русский язык, статистические методы, классификация текстов.

Поиск слов в рукописном тексте на основе штриховой сегментации

Иван Дмитриевич Морозов, Леонид Моисеевич Местецкий
1435-1453
Аннотация:

Рукописные архивные документы составляют фундаментальную часть культурного наследия человечества, однако их анализ остается трудоемкой задачей для профессиональных исследователей-историков, филологов и лингвистов. В отличие от коммерческих приложений систем OCR (Optical Character Recognition, оптического распознавания символов), работа с историческими рукописями требует принципиально иного подхода из-за чрезвычайного многообразия почерков, наличия правок и деградации материалов.


Предложен метод поиска в рукописных текстах, основанный на штриховой сегментации. Вместо полного распознавания текста, часто недостижимого для исторических документов, метод позволяет эффективно отвечать на поисковые запросы исследователей. Ключевая идея заключается в декомпозиции текста на элементарные штрихи, формировании семантических векторных представлений с помощью контрастного обучения, последующей кластеризации и классификации для создания адаптивного словаря почерка.


Экспериментально показано, что поиск сравнением кортежей редуцированных последовательностей наиболее информативных штрихов по расстоянию Левенштейна обеспечивает достаточное качество для рассматриваемой задачи. Метод демонстрирует устойчивость к индивидуальным особенностям почерка и вариациям написания, что особенно важно для работы с авторскими архивами и историческими документами.


Предложенный подход открывает новые возможности для ускорения научных исследований в гуманитарной сфере, позволяя сократить время поиска нужной информации с недель до минут, что качественно меняет возможности исследовательской работы с большими архивами рукописных документов.

Ключевые слова: рукописный текст, поиск, штриховый анализ, сегментация, векторное представление, контрастное обучение, кластеризация.

Инструмент для оперативной диагностики памяти нейросетевых архитектур языковых моделей

Павел Андреевич Гавриков, Азамат Комилжон угли Усманов, Дмитрий Реваев, Сергей Николаевич Бузыканов
1346-1367
Аннотация:

Большие языковые модели (Large Language Models, LLM) прошли путь от простых N-граммных систем до современных универсальных архитектур, однако ключевым ограничением остается квадратичная сложность механизма самовнимания по длине входной последовательности. Это существенно увеличивает потребление памяти и вычислительных ресурсов, а с появлением задач, требующих рекордно длинных контекстов, создает необходимость разработки новых архитектурных решений. Поскольку для исследования предлагаемой архитектуры требуется длительное и дорогостоящее обучение полновесной сети, необходимо разработать инструмент, который позволял бы быстро дать предварительную оценку архитектуре с точки зрения внутренней памяти.


В настоящей работе предложен метод количественной оценки внутренней памяти нейросетевых архитектур на основе синтетических тестов, не требующих больших корпусов данных. Под внутренней памятью понимается объем информации, который модель способна воспроизвести без обращения к исходным входам.


Для верификации подхода разработан программный комплекс, апробированный на архитектурах GPT-2 и Mamba. Использованы задачи копирования, инверсии и извлечения значения по ключу. Проведенное сравнение по точности предсказаний, распределению ошибок и вычислительным затратам позволяет оперативно оценивать эффективность и перспективность архитектур LLM.

Ключевые слова: большие языковые модели, архитектура нейросетей, внутренняя память, долговременное хранение информации, обработка последовательностей, измерение функциональной памяти, сравнение архитектур.
1 - 25 из 96 результатов 1 2 3 4 > >> 
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2026 Казанский (Приволжский) федеральный университет; Институт развития информационного общества