• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Квантование Vision Transformer: CPU-центричный анализ компромисса между размером модели и скоростью инференса

Амир Рамисович Нигматуллин, Рустам Арифович Лукманов, Ахмад Таха
262-286
Аннотация:

Использование моделей Vision Transformer (ViT) в реальной медицинской практике, например в больницах или диагностических центрах, часто затруднено, потому что на рабочих компьютерах врачей обычно нет мощных графических процессоров (GPU), а имеющиеся вычислительные ресурсы ограничены. В настоящей работе рассмотрен полный путь практической реализации модели на этапе применения (pipeline инференса), направленный на снижение вычислительных затрат без существенной потери качества.


Предложенный подход объединяет несколько методов оптимизации.
Во-первых, использована дистилляция знаний (knowledge distillation) – метод обучения, при котором компактная модель копирует поведение более крупной и точной модели-учителя. Во-вторых, применено экспоненциальное скользящее среднее (Exponential Moving Average, EMA) весов, позволяющее стабилизировать обучение и повысить обобщающую способность модели.
В-третьих, исследована посттренировочная квантизация до целочисленного формата INT8 (post-training quantization, PTQ), направленная на уменьшение размера модели и ускорение инференса. Дополнительно рассмотрен упрощенный вариант квантизации совместно с обучением (QAT-lite), при котором эффекты квантизации частично учитываются во время дообучения модели.


Эксперименты проведены на датасете ISIC, содержащем дерматоскопические изображения кожных новообразований. Оценка качества моделей включает стандартные метрики классификации: точность (accuracy), макроусредненную F1-меру и площадь под ROC-кривой (ROC-AUC). Проанализированы характеристики производительности на центральном процессоре (CPU), включая задержку инференса, пропускную способность, потребление памяти и итоговый размер модели.


Полученные результаты показали, что посттренировочная INT8-квантизация позволяет сохранить качество, близкое к модели в формате FP32, при существенном снижении требований к памяти и вычислительным ресурсам. В то же время использование QAT-lite не демонстрирует устойчивых и воспроизводимых улучшений по сравнению с PTQ.

Ключевые слова: Визуальный трансформер (ViT), дистилляция знаний, экспоненциальная скользящая средняя (EMA), посттренировочная квантизация, обучение с учетом квантования.

Электронное обучение математике студентов инженерных специальностей: первичный опыт

Татьяна Владимировна Дмитриева
36-48
Аннотация: На основе литературных источников проанализирован опыт вузов, реализующих электронное обучение. Обозначены основные достоинства, недостатки, противоречия, проблемы, задачи, возможности их решения. Сформулированы основные требования к электронному обучению, обеспечивающие его эффективность. Выявлены ошибки внедрения элементов электронного обучения. Разработаны рекомендации с целью минимизации нежелательных эффектов.
Ключевые слова: электронное обучение, желаемые характеристики, особенности образовательной ситуации, трудности, замечания, предложения.

Мульти-таймфреймовые Drummond-патчи и JEPA-предобучение для краткосрочного прогноза розничных OHLC-рядов

Александр Семёнович Сизов, Юрий Алексеевич Халин, Артём Александрович Белых
351-367
Аннотация:

Предложен метод построения инвариантных к масштабу представлений временных рядов розничной выручки на базе трехбарной (по трем соседним периодам) геометрии Драммонда (DG), расширенной мульти-таймфреймовым контекстом (день, частичная календарная неделя и скользящая 7-дневка). На этих «патчах» выполнено self-supervised предобучение по схеме Joint-Embedding Predictive Architecture (JEPA) со спатио-темпоральным маскированием, после чего модель дообучена с выходными слоями, оценивающими неопределенность, для прогноза на следующий день и следующую неделю. Проанализированы свойства аффинной инвариантности признаков и идентифицируемости недельной фазы; эмпирически продемонстрировано улучшение по сравнению с сильными базовыми моделями на реальных данных.

Ключевые слова: геометрия Драммонда, Joint-Embedding Predictive Architecture (JEPA), временные ряды, Open-High-Low-Close (OHLC), розничная торговля, краткосрочный прогноз, самообучение.

О модели поиска синонимов

Ольга Муратовна Атаева, Владимир Алексеевич Серебряков, Наталия Павловна Тучкова
1006-1022
Аннотация:

Рассмотрена задача нахождения наиболее релевантных документов в результате расширенного и уточненного запроса. Для ее решения предложены модель поиска и механизм предварительной обработки текста, а также совместное использование поисковой системы и модели, построенной на основе индекса с помощью алгоритмов word2vec для генерации расширенного запроса с синонимами и уточнения результатов поиска на основе подбора похожих документов в цифровой семантической библиотеке. В работе исследуется построение векторного представления документов применительно к массиву данных цифровой семантической библиотеки LibMeta. Решалась задача обогащения пользовательских запросов синонимами. При построении модели поиска совместно с алгоритмами word2vec использован подход «сначала индексация, затем обучение», что позволяет получить более точные результаты поиска. Обучение модели проводилось на базе контента библиотеки для предметной области «Математика». Приведены примеры расширенного запроса с использованием синонимов.

Ключевые слова: модель поиска, алгоритм word2vec, синонимы, информационный запрос, расширение запроса.

Обучение учащихся способам саморегуляции при решении математических задач

Мария Андреевна Кислякова
609-618
Аннотация: Актуальная проблема современной теории и методики обучения математике – обучение способам саморегуляции в процессе решения математических задач. Приведены рекомендации и примеры проведения осознанной саморегуляции учащихся при решении математических задач.
Ключевые слова: методы обучения, математические задания, методы саморегуляции.

Решение задачи классификации эмоционального тона сообщения с определением наиболее подходящей архитектуры нейронной сети

Данис Ильмасович Багаутдинов, Рихам Салман, Владислав Алексеевич Алексеев, Рустамджон Муроджонович Усмонов
396-413
Аннотация:

Для определения наиболее эффективного подхода к решению задачи классификации эмоционального тона сообщения проведено обучение выбранных моделей нейронной сети на различных наборах обучающих данных. На основе такого показателя, как процентное соотношение правильно данных ответов на тестовом наборе данных, сравнены комбинации наборов обучающих данных и различных моделей, обученных на основе этих данных. Произведено обучение четырех моделей нейронной сети на трех различных наборах обучающих данных. В результате сравнения точности ответов каждой модели, обученной на разных обучающих данных, сделаны выводы о выборе модели нейронной сети, наиболее подходящей для решения поставленной задачи.

Ключевые слова: NLP, sentiment detection, neural networks, comparison of neural network models, LSTM, CNN, BiLSTM.

Распределенная тренировка ML-модели на мобильных устройствах

Денис Васильевич Симон, Ирина Сергеевна Шахова
1076-1092
Аннотация: В настоящее время потребность в наличии решений по распределенной тренировке ML-модели в мире возрастает. Однако существующие инструменты, в частности, TensorFlow Federated, – в самом начале своего развития, сложны в реализации и пригодны на текущий момент исключительно для симуляции на серверах. Для мобильных устройств надежно работающих подходов для достижения этой цели не существует. В статье спроектирован и представлен подход к такой распределенной тренировке ML-модели на мобильных устройствах, реализуемый с использованием существующих технологий. В его основе лежит концепция model personalization. В данном подходе эта концепция улучшена как следствие смягчения выявленных недостатков. Процесс реализации выстроен так, чтобы на всех этапах работы с ML-моделью использовать только один язык программирования Swift (применяются Swift for TensorFlow и Core ML 3), делая такой подход еще более удобным и надежным благодаря общей кодовой базе.
Ключевые слова: ML-модель, распределенная тренировка ML-модели, мобильная разработка, программная инженерия, машинное обучение, on-device ML, on-device training, edge computing.

Типы эмбеддингов и их применение в интеллектуальной академической генеалогии

Андреас Хачатурович Мариносян
240-261
Аннотация:

Рассмотрена проблема построения интерпретируемых векторных представлений научных текстов для задач интеллектуальной академической генеалогии. Предложена типология эмбеддингов, включающая три класса: статистические, выученные нейросетевые и структурированные символьные. Обоснована необходимость объединения достоинств нейросетевых (высокая семантическая точность) и символьных (интерпретируемость измерений) подходов. Для реализации такого гибридного подхода предложен алгоритм построения выученных символьных эмбеддингов путем регрессионного преобразования вектора внутреннего представления нейросетевой модели в интерпретируемый набор оценок.


Экспериментальная оценка алгоритма проведена на корпусе фрагментов авторефератов диссертаций по педагогическим наукам. Компактный трансформерный энкодер с регрессионной головой обучался воспроизводить тематические оценки, сгенерированные передовой генеративной языковой моделью. Сравнение шести режимов обучения (три типа регрессионной головы и два состояния энкодера) показало, что дообучение верхних слоев энкодера является ключевым фактором повышения качества. По результатам тестирования была выбрана наилучшая конфигурация, которая достигла коэффициента детерминации R² = 0.57 и точности определения трех наиболее релевантных концептов, равной 74%. Результаты подтверждают, что для определенного рода задач, в которых требуется формальное представление выходных данных, возможна аппроксимация поведения генеративной модели компактным энкодером с регрессионной головой при существенно меньших вычислительных затратах. В более широкой перспективе разработка алгоритмов построения выученных символьных эмбеддингов будет способствовать созданию такой модели формальной репрезентации научного знания, в которой конвергенция нейросетевых и символьных методов обеспечит как масштабируемость обработки научных текстов, так и интерпретируемость векторных представлений, кодирующих содержание.

Ключевые слова: эмбеддинги, академическая генеалогия, трансформерный энкодер, регрессионная голова, символьные эмбеддинги, тематический профиль, обработка естественного языка, интерпретируемость, большие языковые модели, наукометрия.

Механизмы применения мобильных устройств для задач распределенных вычислений

Нуршат Рушанович Низамов, Ирина Сергеевна Шахова
200-213
Аннотация: Описана система, реализующая механизмы применения мобильных устройств для операционной системы Android в рамках решения задач, требующих использования распределенных вычислений. Особое внимание уделено компонентам данной системы, отвечающим за управление задачами и распределение ресурсов.
Ключевые слова: распределенные вычисления, мобильные приложения, Android, мобильные устройства.

Цифровая платформа для суперкомпьютерного математического моделирования процессов напыления

Никита Игоревич Тарасов, Виктория Олеговна Подрыга, Сергей Владимирович Поляков, Алексей Валерьевич Тимаков
697-721
Аннотация:

Представлена цифровая платформа суперкомпьютерного моделирования в задачах напыления частиц на подложки. Целью работы является обсуждение общей архитектуры, технологического стека и особенностей реализации пользовательского интерфейса платформы. В ее основу положены веб-технологии доступа и управления расчетами, позволяющие реализовать пользовательскую систему для проведения полного цикла вычислительного эксперимента, включающего конфигурацию прикладных приложений, их запуск на удаленных вычислительных ресурсах, мониторинг прохождения задач, анализ и интерактивную визуализацию результатов. Взаимодействие пользователя с вычислительными ресурсами реализовано посредством графического интерфейса, не требующего от компьютера пользователя наличия дополнительного программного обеспечения, кроме веб-браузера. Важным преимуществом платформы является возможность проведения широкомасштабных компьютерных исследований в многопользовательском режиме, вытекающая из естественных принципов построения клиент-серверных приложений. Представляемая цифровая веб-платформа была успешно апробирована на вычислительных кластерах ИПМ им. М.В. Келдыша РАН при решении ряда актуальных математических задач нанотехнологии. Также с ее помощью последние 3 года проводится групповое обучение студентов МФТИ современным информационным технологиям.

Ключевые слова: суперкомпьютерное моделирование, цифровая платформа, веб-интерфейс, газодинамическое напыление частиц.

Синхронизация сессий дополненной реальности в нативных мобильных приложениях

Дмитрий Андреевич Евдокименко, Ринат Гафурович Ханов, Ирина Сергеевна Шахова
167-180
Аннотация:

Представлена реализация алгоритма синхронизации сессий дополненной реальности в мобильных iOS-приложениях, позволяющего создавать такие сессии с несколькими участниками для их совместного взаимодействия с одними и теми же виртуальными объектами.

Ключевые слова: дополненная реальность, augmented reality, AR, ARKit, сессия дополненной реальности, синхронизация сессий дополненной реальности.

Применение методов машинного обучения для выявления взаимосвязи академической успеваемости и данных профиля социальной сети

Ильяс Раисович Ихсанов, Ирина Сергеевна Шахова
95-118
Аннотация: Предложена модель машинного обучения для выявления взаимосвязи между данными профиля социальной сети и академической успеваемости учащегося, а также прогнозирования среднего балла успеваемости по данным параметрам.
Ключевые слова: машинное обучение, социальные сети, психометрия, академическая успеваемость, образование, абитуриент.

Математическая речь и развитие уровня математического знания учащихся

Айгюн Абульфат Меджидова
660-666
Аннотация: Затронуты следующие вопросы: обучение математике на современном этапе и его цели; математическая речь учащихся как основной компонент математической подготовки; пути развития математической речи учащихся.
Ключевые слова: математическое обучение, математическая речь, цели обучения.

Анализ моделей векторных представлений слов в задаче разметки семантических ролей в русскоязычных текстах

Лейсан Маратовна Кадермятова, Елена Викторовна Тутубалина
1026-1043
Аннотация: Изучено влияние использования векторных представлений слов на качество установления семантических ролей в русскоязычных текстах. Задача установления семантических ролей в русскоязычных текстах получила широкое распространение после выхода на свет корпуса FrameBank. Были исследованы модели векторных представлений слов word2vec, fastText и ELMo (Embeddings from Language Models). Анализировались метрики качества микро- и макро-F1 как оценочные показатели результатов автоматической разметки актантов. Был проведен ряд экспериментов, демонстрирующих, что модели ELMo, основанные на токенах предикатно-аргументных конструкций, показывают больший прирост качества по сравнению со всеми остальными моделями, в том числе, в сопоставлении с моделями ELMo, обученными на леммах, как по величине микро-F1, так и по величине макро-F1.
Ключевые слова: машинное обучение, обработка естественного языка, векторные представления слов, семантические роли.

VR-телеуправление «многорукими» устройствами: проблемы, гипотезы, постановка задачи

Влада Владимировна Кугуракова, Игорь Дмитриевич Сергунин, Евгений Юрьевич Зыков, Олег Дмитриевич Сергунин, Алексей Валерьевич Уланов, Динара Рустамовна Габдуллина, Артем Шамилевич Гилемянов
441-471
Аннотация:

Рассмотрены различные решения, существующие в области дистанционного управления роботизированными устройствами, оснащенными манипуляторами. Представлены новые подходы к организации совместного телеуправления множеством манипуляторов, с использованием различных пользовательских входов. Проанализированы следующие сценарии использования: архитектура системы с множеством манипуляторов и пользовательские интерфейсы управления, включая такие перспективные направления, как глубокое машинное обучение и нейроинтерфейсы.

Ключевые слова: виртуальная реальность, телеуправление, робот, ко-бот, робототехника, совместное телеуправление, телеимпенданс, когнитивное радио.

Применение технологий мобильного обучения для формирования компетенций проектного менеджера

Михаил Михайлович Абызов, Ирина Сергеевна Шахова
146-166
Аннотация: Представлен обзор способов измерения прогресса разработки программного продукта в рамках гибкой методологии SCRUM, а также дано описание разработки программного инструмента, отслеживающего текущее состояние проекта по временным характеристикам. Анализируя их, такой инструмент способен подсказать проектному менеджеру, на что именно ему следует обратить внимание в текущей проектной обстановке, и помочь в выборе действий для достижения эффективных результатов.
Ключевые слова: управление проектами, проектный менеджер, обучение проектных менеджеров, мобильное приложение, SCRUM, Mobile Learning.

Информационно-аналитическая система сегментации изображений с помощью нейро-нечеткого подхода

Максим Владимирович Бобырь, Богдан Андреевич Бондаренко
601-621
Аннотация:

Представлена информационно-аналитическая система (ИАС) для высокоскоростной сегментации изображений в градациях серого, основанной на модифицированном методе дефаззификации с использованием треугольных функций принадлежности. Цель исследования заключается в анализе влияния упрощения формулы дефаззификации на точность и контрастность выделения объектов. Предложенный подход включает адаптивное обучение весового коэффициента, позволяющее динамически корректировать процесс дефаззификации в зависимости от целевых значений. Проведено сравнение базового метода усреднения значений принадлежности и модифицированного варианта с учетом нелинейных весов. Эксперименты, проведенные на изображениях формата 1024x720, продемонстрировали, что разработанная ИАС обеспечивает высокую точность сегментации и улучшенную контрастность объектов при минимальных вычислительных затратах. Результаты подтверждают превосходство предложенного метода над традиционными подходами, подчеркивая перспективы применения искусственного интеллекта в задачах компьютерного зрения.

Ключевые слова: ИАС, нейро-нечеткий алгоритм, сегментация изображений, дефаззификация, искусственный интеллект, метод отношения площадей.

Методы и алгоритмы повышения выразительности связанных данных (обзор)

Ольга Авенировна Невзорова
808-834
Аннотация: В обзорной статье рассмотрены методы и алгоритмы повышения выразительности связанных данных, подготовленных для публикации в Вебе. Представлены основные подходы к обогащению онтологий, описаны методы, на которых они базируются, а также приведен инструментарий, реализующий эти подходы и инструменты применения соответствующих методов.Основным этапом в общей схеме жизненного цикла данных в облаке открытых связанных данных является этап построения набора связанных RDF-триплетов. Для улучшения классификации данных и анализа их качества применяются различные методы повышения выразительности связанных данных. Основные идеи рассматриваемых методов связаны с обогащением существующих онтологий (расширением базовой схемы знаний) путем добавления или совершенствования терминологических аксиом. Методы обогащения опираются на методы, применяемые в различных областях, таких как представление знаний, машинное обучение, статистика, обработка текстов на естественном языке, анализ формальных понятий и теория игр.
Ключевые слова: связанные данные, онтология, обогащение онтологии, семантический веб.

Обучение геометрии с использованием возможностей программы «Живая математика»

Елена Евгеньевна Алексеева, Марина Викторовна Васильева, Юлия Николаевна Кашицына
83-92
Аннотация: Рассмотрено применение цифровых образовательных ресурсов в процессе обучения математике в основной школе. Показана возможность использования при обучении геометрии электронного учебно-методического комплекта «Живая математика» с методическими рекомендациями по теме «Замечательные точки треугольника. Прямая Эйлера». Статья адресована педагогам и студентам педагогических вузов, методистам, учителям математики.
Ключевые слова: информационные технологии, динамическая математика, задачи по геометрии, треугольник, ортоцентр, центр тяжести, вписанная и описанная окружности, прямая Эйлера.

Разработка мобильной системы сбора цифрового следа для использования при горизонтальном обучении

Роберт Ринатович Алимбеков, Айрат Фаридович Хасьянов
104-120
Аннотация:

Горизонтальное обучение — это современная модель, альтернативная традиционному вертикальному обучению и основанная на сотрудничестве, взаимодействии между студентами в рамках образовательного процесса. При этом для промежуточной аттестации по дисциплине преподавателю необходимо оценить вклад каждого студента в решение групповой задачи.


На сегодняшний день пользователями мобильных приложений в разных областях оставляется огромное количество цифровых следов. Основными типами оставляемого цифрового следа являются текст, фотографии, видеозаписи, аудиозаписи, а также текущее местоположение.


Для содействия преподавателю при горизонтальном обучении нами разработано мобильное приложение, собирающее все вышеперечисленные виды цифрового следа, а также веб-приложение, анализирующее его.

Ключевые слова: сотовая связь, мобильное приложение, цифровой след, сбор цифрового следа, учет, анализ.

Извлечение заголовков из PDF-документов научной тематики

Дмитрий Сергеевич Филиппов
392-411
Аннотация:

Актуальность представленного исследования обусловлена бедностью существующих подходов к извлечению заголовков из PDF-документов, предложенных в более ранних исследованиях, которые используют либо машинное обучение, либо простые эвристики. Цель настоящего исследования – предоставить более проработанные подходы к общей задаче извлечения заголовка документа и предложить лучший алгоритм выделения его из документов научной тематики. Основная методика, использованная нами при выборе решения, – рассмотреть, как можно большее количество различных ситуаций относительно форматирования заголовка, возникающих в разных документах, и предложить решение для каждой из них, а затем обобщить их в полноценный подход. Результаты выбранного подхода показали его эффективность по сравнению с методами других исследователей, если в нашем распоряжении находятся документы с различными вариациями оформления, структурной организации и форматирования. Данное исследование показало, что глубокое исследование задачи – перспективный путь для разработки лучших решений и инструментов. Статья будет полезна исследователям и разработчикам, которые часто встречаются с проблемой извлечения заголовков как одной из подзадач анализа документов.

Ключевые слова: Pdf processing, title extraction, header extraction, strategy based approach, title heuristic, structural analysis, style information, text analysis, document analysis, information extraction, анализ текстов, автоматическая обработка документов.

Каким должен быть язык учебного программирования

Лидия Васильевна Городняя
830-856
Аннотация:

Статья посвящена обоснованию решений в проекте тренажёра на базе языка учебного программирования, предназначенного для начального ознакомления с базовыми понятиями взаимодействия процессов и управления вычислениями. На этапе перехода к многопроцессорным архитектурам возрастает актуальность развития особой языково-информационной поддержки введения в программирование. Сколь ни сложен мир параллелизма, системе подготовки программистов предстоит его освоить и создать методику полноценного ознакомления с его не очевидными явлениями. Это достаточная причина для разработки языка учебного программирования, ориентированного на начальное обучение школьников младших и средних классов, а также студентов младших курсов и непрофессионалов, оперированию взаимодействующими процессами и программированию параллельных вычислений. В основу языка положен многолетний опыт управления взаимодействием игрушечных роботов, перемещающихся на клетчатой доске.


Материал статьи представляет интерес для программистов, студентов и аспирантов, специализирующихся в области системного и теоретического программирования, и для всех тех, кто интересуется проблемами современной информатики, программирования и информационных технологий, особенно проблемами параллельных вычислений, суперкомпьютерами и вообще применением многопроцессорных комплексов и компьютерных сетей.

Ключевые слова: учебное программирование, функциональное программирование, взаимодействие процессов, многопроцессорные конфигурации, определение языка программирования, парадигмы программирования, декомпозиция программ, критерии декомпозиции, семантические системы, схемы преподавания системного программирования, лаконичные определения.

Опыт построения системы автоматического определения тональности объектов на основе синтактико-семантического анализатора

Павел Юрьевич Поляков, Мария Викторовна Калинина, Владимир Владимирович Плешко
185-202
Аннотация: Исследуется применение лингвистического подхода для решения задачи автоматического определения тональности объекта. Исследование проводилось в рамках цикла тестирования систем автоматического анализа тональности SentiRuEval. Задание, предложенное организаторами дорожки, заключалось в том, чтобы определить мнение пользователя (положительное, отрицательное или нейтральное) по отношению к операторам сотовой связи на материале сообщений социальной сети Twitter и новостей. Авторы настоящей работы исключили новостные сообщения из тестовой коллекции, так как формальные тексты существенно отличаются от неформальных по своей структуре и лексике и, следовательно, требуют другого подхода. При решении поставленной задачи был использован лингвистический метод, основанный на синтактико-семантическом анализе. Согласно этому подходу тональная лексика привязывается к объекту на одной из двух последовательных стадий. Первая стадия включает в себя использование семантических шаблонов, которые сравниваются с деревом синтаксического разбора предложения; вторая стадия использует эвристики для связывания тональной лексики с объектом оценки в случае, когда синтаксические связи между ними отсутствуют. Машинное обучение не применялось. Метод продемонстрировал очень хорошие результаты, которые примерно совпадают с лучшими результатами методов с использованием машинного обучения и гибридных методов.
Ключевые слова: определение тональности, анализ мнений, тональность объектов, тональность атрибутов, синтактико-семантический анализ, семантические шаблоны.

Инструмент для оперативной диагностики памяти нейросетевых архитектур языковых моделей

Павел Андреевич Гавриков, Азамат Комилжон угли Усманов, Дмитрий Реваев, Сергей Николаевич Бузыканов
1346-1367
Аннотация:

Большие языковые модели (Large Language Models, LLM) прошли путь от простых N-граммных систем до современных универсальных архитектур, однако ключевым ограничением остается квадратичная сложность механизма самовнимания по длине входной последовательности. Это существенно увеличивает потребление памяти и вычислительных ресурсов, а с появлением задач, требующих рекордно длинных контекстов, создает необходимость разработки новых архитектурных решений. Поскольку для исследования предлагаемой архитектуры требуется длительное и дорогостоящее обучение полновесной сети, необходимо разработать инструмент, который позволял бы быстро дать предварительную оценку архитектуре с точки зрения внутренней памяти.


В настоящей работе предложен метод количественной оценки внутренней памяти нейросетевых архитектур на основе синтетических тестов, не требующих больших корпусов данных. Под внутренней памятью понимается объем информации, который модель способна воспроизвести без обращения к исходным входам.


Для верификации подхода разработан программный комплекс, апробированный на архитектурах GPT-2 и Mamba. Использованы задачи копирования, инверсии и извлечения значения по ключу. Проведенное сравнение по точности предсказаний, распределению ошибок и вычислительным затратам позволяет оперативно оценивать эффективность и перспективность архитектур LLM.

Ключевые слова: большие языковые модели, архитектура нейросетей, внутренняя память, долговременное хранение информации, обработка последовательностей, измерение функциональной памяти, сравнение архитектур.

Методика организации SPOC курса по обучению планиметрии будущих учителей математики

Анастасия Эдуардовна Дюпина, Марина Викторовна Фалилеева
49-56
Аннотация: Представлено использование теории геометрического мышления ван Хиле для организации смешанного обучения студентов педагогического отделения Института математики и механики им. Н.И. Лобачевского Казанского (Приволжского) федерального университета на основе SPOC курса «Элементарная математика: планиметрия». Обучение планиметрии включает в себя применение различных IT-приемов и средств, способных повысить качество усвоения материала и формировать необходимые профессиональные компетенции будущего учителя математики. В курсе реализуются технологии проектно-модульного и перевернутого обучения.
Ключевые слова: цифровые образовательные ресурсы, геометрическое мышление, Moodle, SPOC, обучение планиметрии, подготовка учителей.
1 - 25 из 40 результатов 1 2 > >> 
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2026 Казанский (Приволжский) федеральный университет; Институт развития информационного общества