• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Некоторые программные инструменты для автоматизированного пополнения терминологического словаря предметной области

Роман Анатольевич Румянцев, Ольга Авенировна Невзорова
91-122
Аннотация: Описано приложение OntoDictionary, которое предназначено для работы с научными математическими статьями и онтологиями, созданными в редакторе Protege. Приложение способно создавать словарь онтологии, разбивать его элементы на концепты и обрабатывать их в булевом поиске. Имеется функционал для выделения определённых именных групп из математических статей. Новизна заключается в создании и методе обработки именных групп, содержащих формулы. Формулы обрабатываются независимо от их типа. Построен отбор кандидатов в термины. По всему функционалу произведён ряд экспериментов с онтологией математического знания OntoMathPRO, которая также была разработана в Казанском федеральном университете.
Ключевые слова: математическое знание, онтология, концепт, поисковый индекс, именная группа, кандидаты в термины.

Анализ моделей машинного обучения на основе методов объяснимого искусственного интеллекта в образовательной аналитике

Дмитрий Артурович Минуллин, Фаиль Мубаракович Гафаров
294-315
Аннотация:

Проблема прогнозирования досрочного отчисления студентов российских вузов является актуальной, поэтому требуется разработка новых инновационных подходов для её решения. Для решения данной проблемы возможна разработка предиктивных систем на основе использования данных о студентах, имеющихся в информационных системах вузов. В настоящей работе исследованы модели машинного обучения для прогнозирования досрочного отчисления студентов, обученные на основе данных о характеристиках и успеваемости студентов. Основная научная новизна работы заключается в использовании методов объяснимого ИИ для интерпретации и объяснения функционирования обученных моделей машинного обучения. Методы объяснимого искусственного интеллекта позволяют понять, какие из входных признаков (характеристик студента) оказывают наибольшее влияние на результаты прогнозов обученных моделей, а также могут помочь понять, почему модели принимают те или иные решения. Полученные результаты расширяют понимание влияния различных факторов на досрочное отчисление студентов.

Ключевые слова: образовательная аналитика, интеллектуальный анализ данных, машинное обучение, объяснимый искусственный интеллект.

Онтология вспомогательных и политематических предметных классов единого цифрового пространства научных знаний

Светлана Александровна Власова, Николай Евгеньевич Каленов, Александр Николаевич Сотников
22-42
Аннотация:

Одними из основных компонентов Единого Цифрового Пространства Научных Знаний (ЕЦПНЗ) являются предметные онтологии отдельных тематических подпространств, включающие в себя основные понятия, относящиеся к данному научному направлению. Задача построения предметных онтологий на первом этапе требует формирования массива ключевых терминов в заданной области науки с последующим установлением связей между ними. Настоящая работа является развитием исследований, проводимых авторами в области создания ЕЦПНЗ. В рамках предыдущих исследований была предложена унифицированная структура представления онтологии элементов ЕЦПНЗ (подпространств, классов и атрибутов объектов, связей между объектами или атрибутами). В процессе моделирования онтологии на примере универсального и ряда тематических подпространств ЕЦПНЗ выявилась необходимость некоторой корректировки структуры онтологии, касающейся справочников ЕЦПНЗ, для обеспечения возможности описания вложенных атрибутов данных. Кроме того, в онтологию введено понятие «тип словаря значений атрибутов данных», определены два типа словарей – «статические» и «динамические». Эта информация позволяет упростить алгоритмы формально-логического контроля при формировании контента ЕЦПНЗ. Указание на тип словаря введено в структуру справочников атрибутов объектов. В представленной работе описана модифицированная структура онтологии на примере 11-ти вспомогательных и 10-ти предметных классов универсального подпространства (УПП) ЕЦПНЗ. Приведены примеры справочников каждого класса, построенные в соответствии с моделью структуры онтологии, перечень атрибутов объектов и примеры статических словарей.

Ключевые слова: цифровое пространство научных знаний, онтология, классы объектов, атрибуты, структуризация, связанные данные.

Применение методов скоринговой оценки кредитных рисков в мониторинге корпоративного заемщика

Ольга Андреевна Тазенкова
689-709
Аннотация:

Предложен метод оценки риска дефолта корпоративного заемщика на этапе мониторинга на основе скоринговой оценки. Приведено доказательство гипотезы в том, что скоринговые методы оценки кредитных рисков возможны к применению не только на этапе первичной оценки потенциального заемщика при принятии решения о кредитовании, но и на этапе его мониторинга при сопровождении сделки. Мониторинг представляет собой периодическую проверку кредитного качества корпоративного заемщика, с кем заключен кредитный договор. Это делается с целью своевременного выявления негативных сигналов, а также своевременного реагирования на угрожающие тенденции в деятельности заемщика.


Некоторые кредитные организации экономят на мониторинге, полагаясь на систему принятия решения, считая ее безупречной. Однако данная экономия может оказаться фатальной ошибкой, так как многое в течение «жизни» предприятия со временем изменяется. Этому способствуют как внешние факторы (политические, экономические), так и внутренние (неверная стратегия развития организации, неспособность оценить собственные кредитные возможности, недобросовестные контрагенты).


Предлагаемый метод представляет собой систему автоматических риск-сигналов, которые прошли проверку на предсказательную способность, исключая ручные процедуры. В предлагаемое решение включены маркеры (риск-сигналы), которые имеют предсказательную способность выше средней, что может привести к дефолту корпоративного заемщика. Дополнительно применена цветовая маркировка – красный, желтый, зеленый, которая позволяет визуализировать критичность выявленного риск-сигнала в зависимости от предсказательной способности – наглядное представление рисков заемщика с целью облегчения интерпретации.


Анализ разработанного метода показал, насколько возможно ускорить процесс проведения мониторинга, что позволит обеспечить оперативность реагирования на выявленные риск-сигналы, а также спрогнозировать вероятное ухудшение кредитного качества заемщика в кредитном или гарантийном портфеле без ущерба для качества оценки риска.

Ключевые слова: моделирование, корпоративный заемщик, мониторинг, дефолт, кредитный риск, риск-карта, скоринг.

Искусственный интеллект в решении проблемы онкопрофилактики: ретроспективное исследование

Петр Александрович Филоненко, Владимир Николаевич Кох, Павел Дмитриевич Блинов
1253-1266
Аннотация:

Исследована возможность эффективного решения задачи популяционной онкопрофилактики с помощью методов искусственного интеллекта (ИИ), прогнозирующих риск злокачественных новообразований (ЗНО) на основе минимального набора данных из электронной медицинской карты (ЭМК) – кодов медицинских диагнозов и услуг. Для решения поставленной задачи рассмотрен широкий спектр современных подходов, включающих методы классического машинного обучения, анализа выживаемости, глубокого обучения и больших языковых моделей (LLM). Численные эксперименты показали, что наилучшей способностью ранжирования пациентов по уровню риска ЗНО обладает градиентный бустинг, использующий модели анализа выживаемости в качестве дополнительных предикторов, что позволяет учитывать как популяционные, так и индивидуальные факторы риска ЗНО. Из данных ЭМК были сконструированы предикторы, включающие демографические характеристики, паттерны обращений за медицинской помощью и клинические маркеры. Это решение было протестировано в ретроспективных экспериментах под контролем профильных врачей-онкологов. В ретроспективном эксперименте с участием более 1.9 млн пациентов установлено, что в группу риска попадает до 5.4 раза больше пациентов с ЗНО при том же уровне медицинских обследований. Предложенный метод представляет собой масштабируемое решение, использующее исключительно коды диагнозов и услуг, не требующее специализированной инфраструктуры и интегрируемое в процесс онконастороженности, что делает его применимым для решения задач популяционной онкопрофилактики.

Ключевые слова: ИИ в медицине, популяционная онкопрофилактика, ретроспективные эксперименты.

Реализация влияния средств икт на методы обучения математике в высшем образовании

Анатолий Егорович Поличка
686-693
Аннотация: Приведен вариант методики подготовки и реализации содержания математической дисциплины одного гуманитарного направления подготовки обучаемых для использования средств ИКТ. В качестве примера выбрано использование электронной почты и средств мобильного ИКТ обучаемых.
Ключевые слова: авторская методическая система обучения, дидактические возможности средств ИКТ, принцип дискретизации.

Базы знаний для описания информационных ресурсов в молекулярной спектроскопии. 5. Качество экспертных данных

А.Ю. Ахлёстин, Н.А. Лаврентьев, А.И. Привезенцев, А.З. Фазлиев
Аннотация: Показано, что доверие к контенту информационных ресурсов можно оценивать с помощью критерия опубликования и разделять ресурсы на доверяемую и сомнительную части. Задача оценки доверия состоит их четырех подзадач: (1) построения мультимножеств физических величин, содержащихся в первичных источниках данных, (2) согласования значений физических величин, (3) формирования количественных ограничений для критерия опубликования в разных интервалах изменения физических величин и (4) декомпозиции экспертных данных. Кратко описаны критерии достоверности спектральных данных и ограничения необходимые для решения задач согласования данных. Представлено табличное представление результатов согласования. На примере вакуумных волновых чисел описаны ограничения характерные для критерия опубликования. Оценки доверия, полученные из решения задачи декомпозиции, представлены в форме OWL-онтологий. Построение онтологической базы знаний подобного типа для виртуальных центров данных в дисциплинах с большими объемами данных измерений обеспечит автоматический выбор информационных ресурсов с высокой степенью доверия.
Ключевые слова: спектроскопия, согласование данных, доверие к контенту ресурсов, критерий опубликования.

Об описании некоторых краевых задач в семантической библиотеке LibMeta

Ольга Муратовна Атаева, Владимир Алексеевич Серебряков, Наталия Павловна Тучкова
2-21
Аннотация:

Использован подход онтологического проектирования для описания семантики некоторых краевых задач в цифровой библиотеке LibMeta.


Для описания задач в библиотеке LibMeta установлены связи терминов и понятий с классическими определениями математической энциклопедии и других первоисточников. Установление связей позволяет сформировать словарь и тезаурус прикладной предметной области краевых задач и поместить результаты в семантическую среду цифровой библиотеки. Примеры такого подхода продемонстрированы с использованием возможностей семантической библиотеки LibMeta, в которую в процессе развития интегрированы в оцифрованном виде версия математической энциклопедии, энциклопедии математической физики, классификаторы, прикладные математические тезаурусы и словари. Новые термины из публикаций после добавления в контент библиотеки отразились со связями в математической энциклопедии. Тезаурус для задач предметной области теории упругости был впервые создан путем интеграции предметных словарей, классификаторов, метаданных публикаций профильного журнала и энциклопедического контента библиотеки LibMeta. Цель таких исследований состоит в предоставлении пользователю дополнительных сервисов в поиске публикаций в прикладной научной области.

Ключевые слова: прикладная онтология, тезаурус предметной области, источники данных, разработка онтологии, цифровая семантическая библиотека LibMeta.

Предложения по разработке средств повышения эффективности управления в условиях эпидемий

Виктор Иванович Балута, Владимир Петрович Осипов, Татьяна Владимировна Сивакова
20-41
Аннотация:

Статья посвящена рассмотрению методов моделирования эпидемий применительно к COVID-19 и обоснованию путей повышения эффективности управленческих решений с учетом прогнозируемых последствий. В работе приведён обзор методов моделирования для прогнозирования и оценки последствий эпидемиологической обстановки. Научная новизна работы заключается в использовании средств поддержки принятия решений для оперативной оценки ситуации и прогноза ее развития. Для поставленной задачи предлагается использовать мультиагентный подход имитационного моделирования.

Ключевые слова: поддержка принятия решений, эпидемическая ситуация, суперкомпьютерное моделирование, социально-экономические последствия, математические модели, мультиагентный подход.

Создание генератора псевдослов и классификация их схожести со словами словаря русского языка методами машинного обучения

Кирилл Алексеевич Ромаданский, Артемий Евгеньевич Ахаев, Тагмир Радикович Гилязов
145-162
Аннотация:

Под псевдословом понимается единица речи или текста, которая выглядит как реальное слово на русском языке, но на самом деле не имеет значения, а под настоящим или естественным словом – единица речи или текста, которая имеет толкование и представлена в словаре. Представлены две модели для работы с русским языком: генератор псевдослов и классификатор, оценивающий степень схожести введенной последовательности символов с настоящими словами. Классификатор использован для оценки результатов генератора. Обе модели основаны на рекуррентной нейронной сети с долгой краткосрочной памятью и обучены на датасете существительных русского языка. В результате создан файл, содержащий список сгенерированных псевдослов, оцененных классификатором. Псевдослова могут найти применение в задачах нейминга, брендирования и макетирования, в искусстве, для создания креативных произведений, и в языковых исследованиях, для изучения структуры языка и слов.

Ключевые слова: генерация слов, псевдослово, нейронная сеть, рекуррентная нейронная сеть, долгая краткосрочная память.

Опыт верификации реализаций протокола TLS 1.3

Алексей Вячеславович Никешин, Виктор Зиновьевич Шнитман
902-922
Аннотация:

Представлен опыт верификации реализаций сервера криптографического протокола TLS версии 1.3. TLS – широко распространенный криптографический протокол, предназначенный для создания защищенных каналов передачи данных и обеспечивающий необходимую для этого функциональность: конфиденциальность передаваемых данных, целостность данных, аутентификацию сторон. Новая версия протокола TLS 1.3 была представлена в августе 2018 года и имеет ряд существенных отличий по сравнению с предыдущей версией 1.2. Ряд разработчиков протокола TLS уже включил поддержку последней версии в свои реализации. Данные обстоятельства делают актуальным проведение исследований в области верификации и безопасности реализаций новой версии протокола TLS. В работе использован новый тестовый набор для верификации реализаций протокола TLS 1.3 на соответствие спецификациям интернета, разработанный на основе спецификации RFC 8446 с использованием технологии UniTESK и методов мутационного тестирования. Текущая работа является частью проекта верификации протокола TLS 1.3 и охватывает часть дополнительной функциональности и необязательных расширений протокола.


Для тестирования реализаций на соответствие формальным спецификациям применена технология UniTESK, предоставляющая средства автоматизации тестирования на основе использования конечных автоматов. Состояния тестируемой системы задают состояния автомата, а тестовые воздействия – переходы этого автомата. При выполнении перехода заданное воздействие передается на тестируемую реализацию, после чего регистрируются реакции реализации и автоматически выносится вердикт о соответствии наблюдаемого поведения спецификации. Мутационные методы тестирования используются для обнаружения нестандартного поведения тестируемой системы с помощью передачи некорректных данных. В поток обмена протокола, создаваемый в соответствии со спецификацией, вносятся некоторые изменения: либо изменяются значения полей сообщений, сформированных на основе разработанной модели протокола, либо изменяется порядок сообщений в потоке обмена. Модель протокола позволяет вносить изменения в поток данных на любом этапе сетевого обмена, что позволяет тестовому сценарию проходить через все значимые состояния протокола и в каждом таком состоянии проводить тестирование реализации в соответствии с заданной программой. На данный момент было обнаружено несколько отклонений реализаций от спецификации.


Представленный подход доказал свою эффективность в нескольких наших проектах при тестировании сетевых протоколов, обеспечив обнаружение различных отклонений от спецификации и других ошибок.

Ключевые слова: безопасность, TSL, TSLv1.3, протоколы, тестирование, оценка устойчивости, Интернет, стандарты, формальные методы спецификации.

Гибридная система программирования для учебных исполнителей на Python

Миля Вячеславовна Райко
398-414
Аннотация:

Рассмотрена методика разработки учебных формальных исполнителей с использованием комбинированного пиктограммно-текстового интерфейса на языке программирования Python. Актуальность исследования обусловлена необходимостью совершенствования подходов к обучению алгоритмизации и программированию в школьном курсе информатики. Представлен разработанный инструментарий для создания формальных исполнителей, сочетающий наглядность пиктограмм с возможностями текстового программирования. Особое внимание уделено практическим аспектам реализации, включая использование встроенных методов Python для обработки графических и текстовых данных.

Ключевые слова: формальный исполнитель, визуализация, программирование, пиктограммный интерфейс, Python.

Автоматизация построения расписания занятий в вузе: математическая модель и методы реализации

Ришат Ильшатович Хабипов
461-470
Аннотация:

Построение расписания – это распределение дискретного множества событий в заданном временном интервале, с соблюдением заданных ограничений. Целью работы является описание математической модели автоматизации процесса составления расписания в образовательном учреждении. Рассмотрены также подходы к составлению оптимального расписания. В исследуемых задачах используется большое количество первоначальной исходной информации, различающейся по своему составу, и содержится большое количество требований, которые должны быть обязательно учтены. Поэтому составление расписания относится к классу NP-полных задач целочисленного программирования, который подразумевает, что с ростом числа значений заданных переменных сложность решения будет расти экспоненциально. Отметим, что качество сформированного расписания занятий напрямую влияет на эффективность учебного процесса вуза.

Описан процесс формирования расписания занятий: на первом этапе нужно сформировать начальное расписание на основе имеющихся студенческого контингента и преподавателей, учебных аудиторий, а также ряда дополнительных ограничений; на втором этапе происходит оптимизация первоначального расписания; на третьем этапе допускается корректировка полученного расписания сотрудниками вуза.

Ключевые слова: задача составления расписания, алгоритмы целочисленного линейного программирования, учебные планы, расписание занятий.

Идентификация авторов в рамках предметной области в семантической библиотеке

Ольга Муратовна Атаева, Владимир Алексеевич Серебряков, Наталия Павловна Тучкова
198-217
Аннотация:

Рассмотрены особенности задачи идентификации авторов и определения авторского вклада в публикации в цифровых библиографических коллекциях. Особенности проблемы недостаточной идентификации проявляются в повторах информации, двойниковании, наличии авторов с полностью совпадающими именами, самоцитировании, автоплагиате и собственно плагиате. Предлагается использовать информацию о публикациях, которая уже накоплена в цифровой библиотеке в виде связанных данных предметной области и множества данных тезауруса адресата, как автора и пользователя библиотеки. Эта информация содержит связи, благодаря которым для идентификации авторства можно использовать контексты ключевых слов, множества соавторов и ассоциативные связи терминов в словарях и тезаурусах. Важно, что рассматривается массив научных публикаций, поскольку они имеют сложившуюся традиционную структуру, что позволяет сравнивать фиксированные элементы текста (аннотации, ключевые слова, коды классификаторов и т. д.). Таким образом, даже при полном совпадении имен в публикациях можно ставить вопрос об авторстве, если в цифровой библиотеке публикации соответствуют различным предметным областям. Разрешение таких противоречий осуществляется путем оценки множества связей всех элементов вторичной информации о публикации. Результатом сравнения может быть добавление автора в некоторую предметную область, т. е. расширение тезауруса адресата и персонального тезауруса автора, или появление в библиотеке полных тезок, но из разных областей знаний. Показано, что современные средства анализа данных позволяют оценить вклад автора в публикацию, несмотря на то, что конечно, реальный вклад в научное исследование может оценить только научное сообщество.

Ключевые слова: сравнение научных текстов, семантический поиск, тезаурус для онтологии знаний, информационный запрос с помощью тезауруса, семантические библиотеки, способы идентификации авторов, тезаурус адресата, вторичная информация, частотный словарь индивидуума, LibMeta.

Модель самотрансформации графов, основанная на операции изменения конца ребра

Игорь Борисович Бурдонов
315-335
Аннотация: Рассмотрена распределенная сеть, топология которой описана неориентированным графом. Сеть может сама изменять свою топологию, используя специальные «команды», подаваемые ее узлами. В работе предложена предельно локальная атомарная трансформация acb изменения конца c ребра ac, «движущегося» вдоль ребра cb от вершины c к вершине b. В результате этой операции ребро ac удаляется, а ребро ab добавляется. Такая трансформация выполняется по «команде» от общей вершины c двух смежных ребер ac и cb. Показано, что из любого дерева можно получить любое другое дерево с тем же множеством вершин, использовав только атомарные трансформации. Если степени вершин дерева ограничены числом d (d3), то трансформация не нарушает этого ограничения. В качестве примера цели такой трансформации рассмотрены задачи максимизации и минимизации индекса Винера дерева с ограниченной степенью вершин без изменения множества его вершин. Индекс Винера – это сумма попарных расстояний между вершинами графа. Максимальный индекс Винера имеет линейное дерево (дерево с двумя листовыми вершинами). Для корневого дерева с минимальным индексом Винера определены его вид и способ вычисления числа вершин в ветвях соседей корня. Предложены два распределенных алгоритма: трансформации дерева в линейное дерево и трансформации линейного дерева в дерево с минимальным индексом Винера. Доказано, что оба алгоритма имеют сложность не выше 2n–2, где n – число вершин дерева. Также рассмотрена трансформация произвольных неориентированных графов, в которых могут быть циклы, кратные ребра и петли, без ограничения на степени вершин. Показано, что любой связный граф с n вершинами может быть преобразован в любой другой связный граф с k вершинами и тем же числом ребер за время не более 2(n+k)–2.
Ключевые слова: распределенная сеть, самотрансформация графов, индекс Винера.

Развитие DVM-системы

Валерий Федорович Алексахин, Владимир Александрович Бахтин, Ольга Федоровна Жукова, Дмитрий Александрович Захаров, Виктор Алексеевич Крюков, Наталия Викторовна Поддерюгина, Ольга Антониевна Савицкая
247-270
Аннотация: DVM-система предназначена для разработки параллельных программ научно-технических расчетов на языках C-DVMH и Fortran-DVMH. Эти языки используют единую DVMH-модель параллельного программирования и являются расширением стандартных языков Си и Фортран спецификациями параллелизма, оформленными в виде директив для компилятора. DVMH-модель позволяет создавать эффективные параллельные программы для гетерогенных вычислительных кластеров, в узлах которых в качестве вычислительных устройств наряду с универсальными многоядерными процессорами могут использоваться ускорители, графические процессоры или сопроцессоры Intel Xeon Phi. В статье представлены новые возможности DVM-системы, которые были разработаны в последнее время.
Ключевые слова: автоматизация разработки параллельных программ, DVM-система, ускоритель, ГПУ, Фортран, Си, нерегулярная сетка, неструктурированная сетка.

Унифицированное представление онтологии единого цифрового пространства научных знаний

Николай Евгеньевич Каленов, Александр Николаевич Сотников
80-103
Аннотация:

Единое цифровое пространство научных знаний (ЕЦПНЗ) представляет собой цифровую информационную среду, агрегирующую разнородную информацию, связанную с различными аспектами научных знаний. Одной из важных функций ЕЦПНЗ является предоставление информации для решения задач искусственного интеллекта, что обусловливает необходимость поддержки данных в структуре, соответствующей правилам Semantic Web. Особенностями ЕЦПНЗ являются, с одной стороны, политематичность и разнородность элементов контента, с другой – высокая динамика появления новых видов объектов и связей между ними, что обусловлено спецификой развития науки. При реализации ЕЦПНЗ должна быть обеспечена возможность навигации по разнородным ресурсам пространства с использованием семантических связей между ними. Возможности ЕЦПНЗ в значительной мере определяются структурой онтологии пространства, модель которой предложена в данной работе. В рамках модели проведена иерархическая структуризация онтологии ЕЦПНЗ; выделены и определены такие элементы, как «подпространство», «класс объектов», «объект», «атрибуты объекта», три типа попарных связей объектов и атрибутов (универсальные, квазиуниверсальные и специфические). Структура каждого типа элементов определяется «справочником» унифицированного вида; конкретные значения атрибутов и связей содержатся в словарях унифицированной структуры. Выделен класс объектов «Форматы», описывающих правила формирования атрибутов и значений связей. Предложена формализация представлений справочников и словарей ЕЦПНЗ. Предлагаемая модель позволяет достаточно просто добавлять в пространство, по мере необходимости, новые виды объектов, их попарных связей и атрибутов.

Ключевые слова: цифровое пространство научных знаний, онтологии, структуризация, связанные данные, атрибуты данных, семантический WEB.

Опыт верификации реализаций клиента протокола TLS 1.3

Алексей Вячеславович Никешин, Виктор Зиновьевич Шнитман
104-121
Аннотация:

Представлен опыт верификации реализаций клиента криптографического протокола TLS версии 1.3. TLS сегодня является одним из наиболее востребованных криптографических протоколов, предназначенных для создания защищенных каналов передачи данных. Протокол обеспечивает необходимую для своих задач функциональность: конфиденциальность передаваемых данных, целостность данных, аутентификацию сторон. В новой версии протокола TLS 1.3 была существенно переработана архитектура, устранен ряд недостатков предыдущих версий, выявленных как при разработке реализаций, так и в процессе их эксплуатации.


В работе использован новый тестовый набор для верификации реализаций клиента протокола TLS 1.3 на соответствие спецификациям интернет, разработанный на основе спецификации RFC 8446 с использованием технологии UniTESK и методов мутационного тестирования. Для тестирования реализаций на соответствие формальным спецификациям применена технология UniTESK, предоставляющая средства автоматизации тестирования на основе использования конечных автоматов. Состояния тестируемой системы задают состояния автомата, а тестовые воздействия – переходы этого автомата. При выполнении перехода заданное воздействие передается на тестируемую реализацию, после чего регистрируются реакции реализации и автоматически выносится вердикт о соответствии наблюдаемого поведения спецификации. Мутационные методы тестирования используются для обнаружения нестандартного поведения тестируемой системы (завершение из-за фатальной ошибки, «подвисание», ошибки доступа к памяти) с помощью передачи некорректных данных, такие ситуации часто остаются за рамками требований спецификаций. В сообщения, сформированные на основе разработанной модели протокола, вносятся какие-либо изменения. Модель протокола дает возможность вносить изменения в поток данных на любом этапе сетевого обмена, что позволяет тестовому сценарию проходить через все значимые состояния протокола и в каждом таком состоянии проводить тестирование реализации в соответствие с заданной программой. Представленный подход доказал свою эффективность в нескольких наших проектах при тестировании сетевых протоколов, обеспечив обнаружение различных отклонений от спецификации и других ошибок. Текущая работа является частью проекта верификации протокола TLS 1.3 и охватывает реализации клиентской части протокола.

Ключевые слова: безопасность, TLS, TLSv1.3, протоколы, тестирование, оценка устойчивости, интернет, стандарты, формальные методы спецификации.

Принципы справедливости как честности в издательской деятельности в сфере образования

Наталья Владимировна Родионова
46-66
Аннотация: Представлены результаты исследования проблемы плагиата. Рассматриваются причины его распространения в издательской и образовательной деятельности и способы искоренения. Обоснованы такие корневые причины этого явления, как утрата традиции доверия в издательской деятельности с обновлением состава авторов; нечувствительность к издательской этике современных авторов, выращенных в период лояльности к плагиату; коммерциализация способов борьбы с плагиатом; слабая мотивация авторов к издательской деятельности. Для обоснования методологического подхода к решению проблемы нечестности в издательской деятельности, включая плагиат, предложена концепция справедливости как честности Дж. Ролза. С ее помощью обоснована идея о формировании системы взаимоотношений «издательство–авторы» на основе принципов справедливости как честности. Предложен подход к формированию этического рамочного порядка в цепи взаимоотношений «издательство–авторы –студенты–разработчики ПО–работодатели» на основе принципов справедливости, таких, как равенство прав требований собственных выгод, взаимной честности; этических ограничений на действия, наносящие ущерб находящимся в наихудшем положении, которыми являются студенты-читатели. Предложена процедура разработки и согласования принципов справедливости в издательской деятельности с помощью сайта издательства. Эти принципы целесообразно отражать в этическом кодексе издательской деятельности.
Ключевые слова: смена поколений авторов, нечувствительность к издательской этике, несправедливость издательств, сотворение справедливости, справедливость как жестокость, справедливость как честность.

Сигнатурные методы анализа временных рядов

Кирилл Алексеевич Мащенко
681-700
Аннотация:

Сигнатурные методы представляют собой мощный инструмент анализа временных рядов, который преобразует их в форму, удобную для задач машинного обучения. В статье рассмотрены основные понятия сигнатуры пути, ее свойства и геометрический смысл, а также методы вычисления для различных типов временных рядов. Приведены примеры применения сигнатурных методов в различных областях, включая финансы, медицину и образование, продемонстрированы их преимущества перед традиционными подходами. Особое внимание уделено генерации синтетических данных на основе сигнатур, что особенно актуально в условиях ограниченного объема исходных данных. Представлены результаты экспериментальных исследований по генерации и предсказанию траекторий цифрового следа обучения студентов, подтверждающие эффективность сигнатурных методов для применения в задачах машинного обучения по анализу и прогнозированию временных рядов.

Ключевые слова: сигнатура, сигнатурные методы, временные ряды, генерация данных, анализ траекторий, цифровой след.

Инструмент для оперативной диагностики памяти нейросетевых архитектур языковых моделей

Павел Андреевич Гавриков, Азамат Комилжон угли Усманов, Дмитрий Реваев, Сергей Николаевич Бузыканов
1346-1367
Аннотация:

Большие языковые модели (Large Language Models, LLM) прошли путь от простых N-граммных систем до современных универсальных архитектур, однако ключевым ограничением остается квадратичная сложность механизма самовнимания по длине входной последовательности. Это существенно увеличивает потребление памяти и вычислительных ресурсов, а с появлением задач, требующих рекордно длинных контекстов, создает необходимость разработки новых архитектурных решений. Поскольку для исследования предлагаемой архитектуры требуется длительное и дорогостоящее обучение полновесной сети, необходимо разработать инструмент, который позволял бы быстро дать предварительную оценку архитектуре с точки зрения внутренней памяти.


В настоящей работе предложен метод количественной оценки внутренней памяти нейросетевых архитектур на основе синтетических тестов, не требующих больших корпусов данных. Под внутренней памятью понимается объем информации, который модель способна воспроизвести без обращения к исходным входам.


Для верификации подхода разработан программный комплекс, апробированный на архитектурах GPT-2 и Mamba. Использованы задачи копирования, инверсии и извлечения значения по ключу. Проведенное сравнение по точности предсказаний, распределению ошибок и вычислительным затратам позволяет оперативно оценивать эффективность и перспективность архитектур LLM.

Ключевые слова: большие языковые модели, архитектура нейросетей, внутренняя память, долговременное хранение информации, обработка последовательностей, измерение функциональной памяти, сравнение архитектур.

Тестирование методов анализа тональности текста, основанных на словарях

Елена Викторовна Тутубалина, Владимир Владимирович Иванов, Мария Загулова, Никита Мингазов, Ильсеяр Алимова, Валентин Малых
138-162
Аннотация:

Технологии анализа тональности текста развиваются интенсивно, что обусловлено ростом объемов открытых источников, представляющих мнения пользователей интернета по различным вопросам. В статье описаны методы для анализа тональности текстов отзывов и коротких сообщений (твитов), приводятся результаты оценки их качества, которая производилась в рамках российского семинара SentiRuEval-2015.

Ключевые слова: извлечение информации, анализ тональности, классификация текстов, машинное обучение с учителем.

Анализ моделей векторных представлений слов в задаче разметки семантических ролей в русскоязычных текстах

Лейсан Маратовна Кадермятова, Елена Викторовна Тутубалина
1026-1043
Аннотация: Изучено влияние использования векторных представлений слов на качество установления семантических ролей в русскоязычных текстах. Задача установления семантических ролей в русскоязычных текстах получила широкое распространение после выхода на свет корпуса FrameBank. Были исследованы модели векторных представлений слов word2vec, fastText и ELMo (Embeddings from Language Models). Анализировались метрики качества микро- и макро-F1 как оценочные показатели результатов автоматической разметки актантов. Был проведен ряд экспериментов, демонстрирующих, что модели ELMo, основанные на токенах предикатно-аргументных конструкций, показывают больший прирост качества по сравнению со всеми остальными моделями, в том числе, в сопоставлении с моделями ELMo, обученными на леммах, как по величине микро-F1, так и по величине макро-F1.
Ключевые слова: машинное обучение, обработка естественного языка, векторные представления слов, семантические роли.

Новые возможности преобразования Фурье: как описать произвольный частотно-фазовый модулированный сигнал?

Равиль Рашидович Нигматуллин, Александр Алексеевич Литвинов, Сергей Игоревич Осокин
378-397
Аннотация:

В работе построено преобразование любого произвольного сигнала в строго периодическую форму, которое позволяет применять обычное преобразование Фурье для аппроксимации уже преобразованного сигнала. Наиболее интересным приложением (по мнению авторов) является аппроксимация сигналов с частотно-фазовой модуляцией, которые фактически находятся внутри найденного преобразования. Это новое преобразование будет полезным для описания откликов различных сложных систем, когда отсутствует обычная модель описания. В качестве доступных данных мы рассматриваем метеоданные, соответствующие измерениям концентрации метана (CH4) в атмосфере в течение 4 недель наблюдений. Было важно рассмотреть интегральные (кумулятивные) данные и найти их амплитудно-частотную характеристику (АЧХ). Если рассматривать каждый столбец как сигнал с частотно-фазовой модуляцией, то АЧХ можно оценить с помощью преобразования Фурье, период которого равен 2π, что справедливо для любого анализируемого случайного сигнала. Такое «универсальное» преобразование Фурье позволяет описать широкий набор случайных сигналов и сравнить их между собой по АЧХ. Эти новые возможности традиционного Фурье-анализа позволяют преобразованию Фурье стать еще более востребованным инструментом в арсенале методов, используемых исследователями в области обработки данных.

Ключевые слова: преобразование Фурье, случайный сигнал, частотно-фазовый модулированный сигнал, амплитудно-частотная характеристика, сложные системы, метеорологические данные, вихревые ковариации.

Интеллектуальный робот-химик: на пути к автономной лаборатории

Муса Шамильевич Адыгамов, Антон Олегович Голубь, Эмиль Ринатович Сайфуллин, Тимур Рустемович Гимадиев, Никита Юрьевич Серов
997-1014
Аннотация:

Представлена программно-аппаратная платформа, которая позволяет проводить химические синтезы в автоматическом режиме, включая приготовление реакционных смесей, их нагрев и перемешивание, а также отбор проб с разбавлением после синтеза и отправку на анализ методом высокоэффективной жидкостной хроматографии с последующей автоматической обработкой результатов. Для управления отдельными элементами роботизированной установки создана собственная библиотека ChemBot на языке Python, а для управления всей системой – клиентский веб-сервер; для просмотра состояния установки и хода выполнения синтезов разработан веб-интерфейс. Работа всей платформы по выполнению экспериментов протестирована при выполнении синтезов по альдольной конденсации, где варьировались соотношение реагентов, катализатор и его количество, температура и время синтеза. Написание собственного кода для контроля и управления всей системой стало важным шагом на пути интеграции роботизированной установки и искусственного интеллекта (ИИ), что в перспективе позволит осуществить переход к автономной лаборатории, когда предсказание целевой молекулы и ее синтеза, экспериментальное осуществление и анализ, а также, при необходимости, уточнение или изменение использованной модели будут осуществляться в автоматическом режиме, без вмешательства человека.

Ключевые слова: искусственный интеллект, роботизация, химический синтез, автономная лаборатория, хемоинформатика.
1 - 25 из 57 результатов 1 2 3 > >> 
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2025 Казанский (Приволжский) федеральный университет; Институт развития информационного общества