• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Использование синтаксиса для анализа тональности твитов на русском языке

Юлия Владимировна Адаскина, Полина Вадимовна Паничева, Андрей Михайлович Попов
163-184
Аннотация:

Представлен подход к решению задачи анализа тональности в рамках тестирования SentiRuEval – открытого соревнования систем анализа тональности на русском языке. Описанный алгоритм был применен в дорожке по анализу тональности твитов о банках и телекоммуникационных компаниях. Для этих данных была разработана и оценена классификация на три класса: положительный, отрицательный и нейтральный.

Для решения поставленной задачи использовались различные алгоритмы машинного обучения. Признаками для классификатора являлись лингвистические данные, полученные из текста с помощью разработанного нами морфо-синтаксического анализатора. Нормализованные слова, а также синтаксические связи, оказались решающими признаками для достижения наилучшего результата, который был получен с помощью статистического алгоритма опорных векторов.

Оценка, проведенная организаторами конкурса, выявила высокое качество предложенного подхода, который занял первую строчку по трем из четырех мерам качества.
Ключевые слова: анализ тональности, синтаксические связи, русский язык, статистические методы, классификация текстов.

Дальнейшее развитие исследований полей давления в арктическом регионе России

Наталия Павловна Тучкова, Константин Павлович Беляев, Гурий Михайлович Михайлов, Алексей Николаевич Сальников
1217-1232
Аннотация:

Представлены результаты исследований атмосферного давления в Арктическом регионе России в период с 1948 по 2008 годы. Проведен анализ климатического сезонного хода полей атмосферного давления. В качестве основного метода исследования использован вероятностный и статистический анализ временных рядов поля давления длиной в 60 лет в фиксированных точках области Арктической зоны России. Всего было исследовано около 90000 ежедневных (с шестичасовым шагом) значений давления. На основе этих данных построен климатический сезонный ход как осреднение значений данного временного ряда в каждой точке пространства и для фиксированной даты. Изучены характеристики сезонного хода, его амплитуда и фаза. Эти характеристики были проанализированы, проведена их геофизическая интерпретация. В частности, определены минимальное и максимальное значения ряда по всей области и построены временные ряды этих характеристик. Показано, что отклонение носит несимметричный характер, это составляет неочевидный результат исследований. Для максимума и минимума построены наилучшие аппроксимации, и эти аппроксимации протестированы известными методами статистического анализа, включая методы максимального правдоподобия, наименьших квадратов и методы (критерии) согласия, в частности, χ2-критерий. Проведенное исследование имеет приложение как чисто физическое (позволяет объяснить природу, генезис и распространение крупномасштабных атмосферных образований в климатическом году), так и прогностическое (позволяет понять и отследить тенденции в климате, а также количественно оценить масштабы и изменчивость крупномасштабных атмосферных процессов). Численные расчеты выполнялись на суперкомпьютере Ломоносов-2 Московского государственного университета имени М.В. Ломоносова.

Ключевые слова: анализ временных рядов, климатический сезонный ход, максимальные и минимальные значения давления внутри климатического года.

Аналитический обзор методов разрешения морфологической многозначности

Рамиль Раисович Гатауллин
98-114
Аннотация:

Проанализированы основные методы разрешения морфологической многозначности применительно к татарскому языку. Описано текущее состояние работ и приведены основные результаты по данному направлению, сделаны выводы о применимости методов разрешения с оценкой их точности.

Ключевые слова: разрешение морфологической многозначности, контекстные методы, статистико-вероятностные методы, татарский язык.

Алгоритм определения переводов статей с использованием статистических данных

Александр Сергеевич Козицын, Сергей Александрович Афонин, Андрей Александрович Зензинов
494-505
Аннотация: В настоящее время происходит активное внедрение наукометрических систем для автоматизации процесса анализа эффективности деятельности научных организаций с целью применения различных методов стимулирования научной деятельности. Одними из наиболее важных индикаторов являются количество публикаций и их цитируемость. Для оценки этих показателей необходимы средства автоматизированного построения связей между оригинальными статьями и их переводами. В настоящей работе проанализированы существующие методы оценки близости оригинального текста и его возможного перевода, показана их недостаточная эффективность для построения связей между статьями и описаня разработанный авторами метод автоматического поиска переводов статей в больших коллекциях библиографических данных. Особенностью разработанного алгоритма является использование статистических данных о публикации статей в различных журналах и информации о соавторах анализируемых статей. Представленный в настоящей работе алгоритм позволяет осуществлять поиск переводов статей без предварительной настройки на заданные пары языков оригинала и перевода статьи, а также не требует использования больших коллекций обучающих выборок. Апробация программной реализации алгоритма проводилась в наукометрической системе Московского государственного университета (МГУ) им. М.В. Ломоносова. Результаты тестирования показали ее достаточную эффективность и возможность использования разработанного алгоритма для автоматического построения рекомендаций пользователям для отметки в системе переводных версий статей.
Ключевые слова: библиографические данные, анализ графов, перевод, статья, статистика, наукометрия, цитирование, автоматизированные системы.

Сезонная и многолетняя изменчивость атмосферного давления в Арктике, статистический и временной анализ

Константин Павлович Беляев, Гурий Михайлович Михайлов, Алексей Николаевич Сальников, Наталия Павловна Тучкова
57-73
Аннотация:

Проведен статистический и временной анализ сезонной и многолетней изменчивости поля атмосферного давления в Арктическом регионе России. В качестве основного метода исследования использованы схемы частотных характеристик вероятностей переходов при построении диффузионных процессов, описывающих изменчивость полей давления. На основе заданных рядов длиной в 60 лет с 1948 по 2008 годы вычислялись такие параметры диффузионных процессов, как среднее (снос процесса) и дисперсия (диффузия процесса), и строились их карты и временные кривые. Изучена сезонная и многолетняя изменчивость полученных полей, а также их зависимость от интервалов и величины разбиения. Эти характеристики проанализированы, и проведена их геофизическая интерпретация. В частности, выявлены известные циклы солнечной активности в 11 и 22 года, а также известный из литературы квазидвухлетний период. Численное моделирование выполнено на суперкомпьютере Ломоносов‑2 Московского государственного университета имени М.В. Ломоносова.

Ключевые слова: анализ временных рядов, диффузионные случайные процессы, сезонная и многолетняя изменчивость атмосферного давления .

Применение синтетических данных в задаче обнаружения аномалий в сфере информационной безопасности

Артем Игоревич Гурьянов
187-200
Аннотация:

В настоящее время в машинном обучении высокую актуальность имеют синтетические данные. Современные алгоритмы генерации синтетических данных дают возможность генерации данных, очень близких по статистическим свойствам к исходным данным. Синтетические данные используются на практике в широком спектре задач, в том числе связанных с аугментацией данных.


Предложен метод аугментации данных, совмещающий подходы увеличения объема выборки с помощью синтетических данных и генерации синтетических аномалий. Метод использован для решения задачи в сфере информационной безопасности, заключающейся в поиске аномалий в журналах сервера с целью обнаружения атак.


Модель, обученная в рамках решения названной задачи, показала высокие результаты. Это демонстрирует эффективность использования синтетических данных для увеличения объема выборки и генерации аномалий, а также возможность с высокой результативностью использовать эти подходы совместно.

Ключевые слова: синтетические данные, обнаружение аномалий, информационная безопасность, генерация аномалий, аугментация данных, машинное обучение.

Общедоступные архивы данных наземного радиозондирования ионосферы коротковолновыми сигналами

Андрей Олегович Щирый, Алина Александровна Писаренко
992-1005
Аннотация:

По данным радиозондирования ионосферы коротковолновыми сигналами можно получить информацию о процессах в ионосферной плазме, ее структуре и состоянии; эти данные также крайне важны для радиотехнических систем, работающих в коротковолновом диапазоне. К настоящему моменту накоплен большой объем экспериментальных данных для различных гео- и гелиофизических, пространственных и временных условий. Интерес к большим массивам данных радиозондирования ионосферы мотивирован также возможностью построения статистических моделей методами машинного обучения. В работе представлены некоторые интернет-ресурсы с данными радиозондирования ионосферы, показаны перспективы их применения, а также обозначены некоторые проблемы, такие как недостаточная документированность части форматов данных и представление ионограмм только в виде растровых изображений, существенная часть из которых к тому же отсканирована с фотопленок.

Ключевые слова: ионосфера, распространение радиоволн, радиозондирование, вертикальное зондирование ионосферы, ионограмма, обработка ионограмм.

Статистический анализ данных наблюдений потоков взаимодействия океана и атмосферы в северной Атлантике

Наталия Павловна Тучкова, Константин Павлович Беляев, Гурий Михайлович Михайлов
122-133
Аннотация:

Проанализированы данные наблюдений 1979–2018 гг. в районе Северной Атлантики, полученные в результате реализации проекта Российской академии наук по исследованию атмосферы в Северной Атлантике (РАН-НААД). Набор данных предоставляет множество параметров поверхности и свободной атмосферы на основе сигма-модели и отвечает многим требованиям метеорологов, климатологов и океанографов, работающих как в исследовательской, так и в оперативной областях. Проведен анализ сезонной и многолетней изменчивости тепловых потоков и температуры поверхности воды в Северной Атлантике. В качестве основного метода исследования использованы схемы анализа диффузионных процессов. На основе заданных рядов длиной в 40 лет с 1979 по 2018 годы вычислены такие параметры диффузионных процессов, как среднее (снос процесса) и дисперсия (диффузия процесса) и построены их карты и временные кривые. Численные расчеты выполнены на суперкомпьютере Ломоносов-2 Московского государственного университета имени М.В. Ломоносова.

Ключевые слова: УДК 519.6, УДК 519.2.

Рейтинг журнала в библиографической базе

Михаил Михайлович Горбунов-Посадов, Татьяна Алексеевна Полилова
1060-1089
Аннотация:

Инструмент построения рейтингов научных журналов является одним из востребованных сервисов библиографических баз. Задача построения рейтинга обычно делится на две основные подзадачи: определение референтной группы журналов и вычисление показателя рейтинга для журналов этой группы. Практика показывает, что для корректного сопоставления журналов необходимым условием является ограничение референтной группы исключительно журналами определенной тематики. В случае методических ошибок, допущенных на этапе выделения референтной группы, значения показателя журналов в рейтинге могут сильно отличаться от ожидаемых.


Например, в рейтинге журналов в Российском индексе научного цитирования (РИНЦ) по двухлетнему импакт-фактору в тематическом направлении «Математика» классические фундаментальные математические журналы вопреки ожиданиям не выходят на первые позиции рейтинга. Первые позиции заняли журналы, для которых математика не является доминирующей профильной дисциплиной. Анализ статистических данных о тематике публикуемых статей и цитирований в журналах, занимающих лидирующие позиции рейтинга РИНЦ, показывает, что на показатели рейтинга существенно повлияла мультидисциплинарность этих журналов.


Отмеченное недоразумение подводит к мысли о том, что в подсчет рейтинга в данном случае следовало вовлекать не все статьи журнала, а только относящиеся к данному тематическому направлению. Вместе с тем вопросы вызывает и сложившаяся схема тематической классификации направлений. Более перспективной представляется набирающая популярность классификация «снизу вверх», работающая на представительном массиве статей. Здесь тематические кластеры вычленяются на основе понятия близости статей, трактуемого как близость их библиографических связей. И далее тематическая принадлежность статьи не назначается волевым решением автора или редакции, а строго формально вычисляется на основе ее библиографического списка.

Ключевые слова: научная публикация, цитирование, рейтинг журналов, тематическая классификация, импакт-фактор, мультидисциплинарность, библиографическая ссылка, со-цитирование, классификация снизу вверх, тематическая кластеризация, Citation Topics.
1 - 9 из 9 результатов
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2025 Казанский (Приволжский) федеральный университет; Институт развития информационного общества