Найти

Поиск статей

Расширенные фильтры

Опубликовано после

Опубликовано до

По автору

Результаты поиска

Как в библиографической ссылке «На лету» формируется дата размещения последней версии публикации

Михаил Михайлович Горбунов-Посадов

554-565

Аннотация:

Размещенную в интернете научную работу, которую ее автор постоянно поддерживает в актуальном состоянии, будем называть живой публикацией. У жанра живой публикации есть множество привлекательных черт. Однако он требует определенного расширения состава метаатрибутов публикации: наряду с традиционными атрибутами здесь на первый план выдвигается дата появления очередной, свежей редакции. Такая дата размещается на видном месте в тексте публикации. Наряду с этим весьма желательной становится включения такой динамически («на лету») формируемой даты в библиографическую ссылку на живую публикацию.

В статье рассмотрены применяющиеся сейчас способы динамического извлечения искомой даты для простой онлайновой публикации, для публикации, получившей DOI посредством Crossref, и для публикаций, размещенных в arXiv.org и preprints.org.

Ключевые слова: живая публикация, динамический компонент библиографической ссылки, свежая дата редакции, Crossref, arXiv.org, Preprints.org.

Научные публикации в России. Что нового

Михаил Михайлович Горбунов-Посадов

382-389

Аннотация: Представлены события, происходившие в последнее время в мире российских научных публикаций. Наблюдается медленное сползание в сторону платного доступа части академических журналов, размещенных в открытом доступе в 2018 году. В Европейском союзе объявлен план массового перехода научных журналов к открытому доступу. Внедряются новые модели существования научной публикации. Отчетность по публикациям, затребованная Минобрнауки в 2019 году, не учитывает масштабы читательской аудитории статьи. Ни Минобрнауки, ни ВАК никак не поощряют размещение публикации в открытом доступе. В РИНЦ началась борьба с широко распространенной жульнической торговлей цитированиями статьи, однако ВАК эта деятельность не заинтересовала. Получил распространение внутренне противоречивый термин «автоплагиат», которым широко клеймят авторов и издания за множественные публикации.

Ключевые слова: открытый доступ, «план S», административная оценка статьи, сериальные издания, онлайновый читатель, индекс Хирша, РИНЦ, Диссернет, автоплагиат.

Живые публикации завоевывают популярность

Михаил Михайлович Горбунов-Посадов

819-829

Аннотация:

Живая публикация – новый жанр представления результатов научных исследований, где научная работа размещается в интернете, а затем постоянно развивается и совершенствуется ее автором. Серьезные ошибки и опечатки больше не являются фатальными и не преследуют автора всю оставшуюся жизнь. Читатель живой публикации знает, что автор методично отслеживает и отражает в своем тексте изменения, происходящие в данной отрасли науки. В то же время российский автор, поддерживающий живую публикацию, сейчас безнадежно проигрывает по многим библиометрическим показателям, облюбованным консервативными чиновниками от науки. Живая публикация стимулирует развитие библиографического аппарата. Размещаемая в онлайне библиографическая ссылка вскоре обязана будет содержать такой важный для читателя, обновляемый «на лету» атрибут, как дата последней редакции живой публикации. Следует ожидать, что по мере распространения живой публикации в научном мире забота автора об эволюции своего онлайна станет сродни родительской заботе о развитии ребенка, а интернет на радость читателю обогатится научными трудами, не теряющими своей актуальности с течением времени.

Ключевые слова: научная публикация, динамический контент, версии статьи, дата последнего обновления.

Модель для интеграции публикации и cохранения журнальных статей

Хокинс Кевин С.

Аннотация: Описаны политика, технические и организационные проблемы в деятельности библиотек по сохранению материалов журналов, издаваемых онлайн. Поскольку библиотеки все чаще участвуют в процессах журнальных публикаций, качественный цифровой репозиторий HathiTrust может служить естественным местом для архивации и предоставления доступа к журнальным публикациям, а также их долгосрочного хранения и обеспечения режима видимости. Библиотека Мичиганского университета финансирует создание системы mPach полного публикационного цикла (с открытым исходным кодом), которая обеспечивает размещение документов в репозитории HathiTrust как побочный результат процесса публикации вместо того, чтобы осуществлять такое размещение после завершения этого процесса. В статье представлены архитектура системы mPach, описаны предусмотренные бизнес-процессы, а также планы по созданию общей инфраструктуры для публикации журналов открытого доступа.

Ключевые слова: журналы, издаваемые онлайн, цифровой репозитарий HathiTrust, журналы открытого доступа, система mPach полного публикационного цикла.

Идентификация авторов в рамках предметной области в семантической библиотеке

Ольга Муратовна Атаева, Владимир Алексеевич Серебряков, Наталия Павловна Тучкова

198-217

Аннотация:

Рассмотрены особенности задачи идентификации авторов и определения авторского вклада в публикации в цифровых библиографических коллекциях. Особенности проблемы недостаточной идентификации проявляются в повторах информации, двойниковании, наличии авторов с полностью совпадающими именами, самоцитировании, автоплагиате и собственно плагиате. Предлагается использовать информацию о публикациях, которая уже накоплена в цифровой библиотеке в виде связанных данных предметной области и множества данных тезауруса адресата, как автора и пользователя библиотеки. Эта информация содержит связи, благодаря которым для идентификации авторства можно использовать контексты ключевых слов, множества соавторов и ассоциативные связи терминов в словарях и тезаурусах. Важно, что рассматривается массив научных публикаций, поскольку они имеют сложившуюся традиционную структуру, что позволяет сравнивать фиксированные элементы текста (аннотации, ключевые слова, коды классификаторов и т. д.). Таким образом, даже при полном совпадении имен в публикациях можно ставить вопрос об авторстве, если в цифровой библиотеке публикации соответствуют различным предметным областям. Разрешение таких противоречий осуществляется путем оценки множества связей всех элементов вторичной информации о публикации. Результатом сравнения может быть добавление автора в некоторую предметную область, т. е. расширение тезауруса адресата и персонального тезауруса автора, или появление в библиотеке полных тезок, но из разных областей знаний. Показано, что современные средства анализа данных позволяют оценить вклад автора в публикацию, несмотря на то, что конечно, реальный вклад в научное исследование может оценить только научное сообщество.

Ключевые слова: сравнение научных текстов, семантический поиск, тезаурус для онтологии знаний, информационный запрос с помощью тезауруса, семантические библиотеки, способы идентификации авторов, тезаурус адресата, вторичная информация, частотный словарь индивидуума, LibMeta.

Инфраструктура научных информационных ресурсов для непрерывного доступа к спутниковым данным исследования Земли из космоса

Е.Б. Кудашев

Аннотация: В статье рассматриваются проблемы формирования e-Science Infrastructure для организации непрерывного доступа к спутниковым данным и обмена огромными потоками данных в связи с актуальной задачей интеграции информационных ресурсов. В России спутниковые данные рассредоточены в региональных спутниковых центрах данных. Их использование зачастую ограничено рамками конкретного проекта, в котором они были созданы. Чрезвычайно затруднены поиск ресурсов, доступ к данным и обмен данными. Многие ведомства и спутниковые центры пользуются собственными форматами представления данных, протоколами обмена, созданными достаточно давно и потому не полностью гармонизированными с современными международными правилами и стандартами. Одной из основных проблем, связанных с организацией хранения больших объемов данных Дистанионного Зондирования Земли (ДЗЗ) и непрерывного доступа к спутниковым ресурсам, является потребность интеграции различных поставщиков данных в единую информационную систему, позволяющую повысить эффективность научных исследований в области ДЗЗ. Предложены и обоснованы принципы и архитектура объединенной электронной e-Инфраструктуры непрерывного доступа к спутниковым данным. Описание геопространственных данных определено международными стандартами ISO 19115:2003 Geographic information – Metadata, ISO 19115-2:2005 Geographic information – Metadata. – Part 2: Extensions for imagery and gridded data. Существуют прототип FGDC-STD-001-1998 названных стандартов США и российский профиль стандарта ISO 19115 в виде документа ГОСТ Р 52573-2006 “Географическая информация. Метаданные.” Метаданные на текстовые материалы в сетях формируются с использованием стандарта Dublin Core. Единая политика администрирования е-Инфраструктуры обеспечивает согласованные между участниками правила доступа и использования ресурсов, унифицированные подходы к обеспечению информационной безопасности. Гарантией доступности и безопасности данных является проведение единой политики управления данными. Требование свободного информационного обмена реализуется путем задействования стандартизированных сетевых протоколов обмена данными и языков описания данных и построения запросов (прежде всего, SQL и XML). Интероперабельность обеспечивается глобальной унификацией технических регламентов, протоколов передачи и форматов данных, а также метаданных и поддерживается целой группой специально разрабатываемых стандартов (ISO/IEC 11179 Information technology — Specification and standardization of data elements; ISO 19113:2002 Geographic information — Quality principles; ISO 19114 Geographic information — Quality evaluation procedures и др.). Разработана архитектура e-Инфраструктуры непрерывного доступа к спутниковым данным, состоящая из компонент: 1) ГИС-сервер управляет геоинформационными ресурсами (карты, изображения, цифровые модели местности, текстуальная информация и т. д.) и транслирует их веб-приложениям в виде отдельных геосервисов; 2) Веб-сервер предназначен для хранения и управления геопорталом. Структурно и функционально Веб- и ГИС-сервера могут быть развернуты на отдельных компьютерах; 3) Геопортал - платформа для создания распределенной среды интеграции геоинформационных данных. Геопортал как единая точка входа в распределенную среду данных представляет из себя совокупность отдельных приложений и сервисов. Используется для публикации, администрирования и поиска стандартизированных геоинформационных ресурсов. Геопортал расположен на веб-сервере и является клиентским приложением ГИС-сервера. Пользователи, взаимодействуя с ним, вызывают сервисы, которые являются посредниками между веб-сервером и ГИС-сервером и обращаются к ГИС-серверу через его компонент SOM за необходимым инструментарием (геосервисами); 4) Сервисы каталогов - предназначены для доступа, поиска, накопления, обработки метаданных геопространственных ресурсов; сервисы обеспечивает общий механизм для классификации, регистрирования, публикации, поиска, хранения и доступа к метаинформации об имеющихся в сети геоинформационных ресурсах. Сервисы каталога предоставляют метаданные о зарегистрированных геоинформационных ресурсах, поддерживают формирование запросов на информацию по типам ресурсов. Они позволяют публиковать, создавать и редактировать наборы метаданных для геопространственных данных, геопространственных сервисов и геоссылок; 5) Сервис данных - обеспечивает доступ к содержанию ресурсных информационных материалов, которые находятся в базах и банках геоданных. Каждой единице ресурсов, с которыми работает этот сервис, присваивается уникальное имя. Для повышения скорости поиска осуществляется индексация ресурсов; 6) База моделей тематических задач ДЗЗ - предназначена для хранения моделей тематических задач ДЗЗ и позволяет с помощью интерфейса программы-планировщика выбрать наиболее адекватную (релевантную) модель в соответствии с поставленной задачей; 7) Программное обеспечение как сервис (Software as a Service (SaaS)). SaaS подразумевает предоставление приложений для конечного пользователя в виде сервиса «по требованию» вместо его установки на конкретном рабочем месте или на собственном сервере. В рамках “облачных” вычислений существуют и другие направления: платформа как сервис и инфраструктура как сервис. 8) Инфраструктура как сервис (Infrastructure as a Service (IaaS)) – охватывает аппаратные средства и технологию для компьютерных вычислений и хранения данных, операционные системы и другую инфраструктуру, которые предоставляются не как локальные ресурсы, а опосредованно – через обращение к сервисам, размещенным на стороне провайдера. 9) Клиентские ГИС-приложения - устанавливаются на конечных устройствах локальных и удаленных пользователей и подключаются по протоколу HTTP к геопорталу по сетям LAN или WLAN для поиска, публикации и сохранения стандартизированных геоинформационных данных.

Ключевые слова: инфраструктура научных данных, электронная наука, данные наблюдения Земли из космоса, научная электронная инфраструктура, открытая инфраструктура данных, управление данными.

Исследование контекстов экосистемы «Цифрового туризма»

Ольга Витальевна Кононова, Дмитрий Евгеньевич Прокудин, Елена Николаевна Тупикина

339-370

Аннотация:

Современные информационно-коммуникационные технологии, элементы цифровизации постоянно и стремительно развиваются, что, в свою очередь, оказывает непосредственное влияние на все сферы человеческой деятельности. В свете последних событий, связанных с коллапсом туристического бизнеса из-за COVID-19, большой научный интерес проявляется к сфере услуг, а именно, к сфере «цифрового туризма». Цифровой туризм опирается на широкое внедрение новых технологий, таких как социальные сети и мобильные технологии, умные устройства и датчики для сбора и использования огромного количества данных для создания новых ценностных предложений. В связи с этим авторами поставлена цель – представить обзор литературы по «цифровому туризму» с позиций научного и медиа дискурса. Авторами представлен комплексный науковедческий подход, включающий последовательное выполнение всех этапов обзора от определения терминологического ядра междисциплинарного направления, формирования поисковых запросов, каскадного поиска, подбора и контент-анализа материалов до выявления и экспликация контекстов. Источниками информации для подготовки обзора выступили публикации из академических баз данных: Web of Science, Science-Direct, Scopus, GoogleScholar, eLibrary, Киберленинка, а также материалы и публикации в русскоязычных СМИ – Интегрум.

Полученные результаты будут полезны ученым при определении перспективных направлений исследований в области «цифрового туризма», а также позволят углубить знания о механизмах поиска, сбора и анализа данных и интегрированных и аналитических средах.

Ключевые слова: информационно-коммуникационные технологии, цифровые трансформации, цифровой туризм, электронный туризм, eTourism, smart tourism.

Публикация данных об Особо Охраняемых Природных Территориях в пространстве Linked Open Data

К.А. Кузнецов, В.А. Серебряков, К.Б. Теймуразов

Аннотация: В этой статье предлагается проект системы публикации данных об Особо Охраняемых Природных Территориях (ООПТ) в пространстве Linked Open Data. Описана общая архитектура системы, принципы работы модулей связывания, публикации и интеграции данных. Также предлагается онтология ООПТ, основанная на европейских стандартах INSPIRE.

Ключевые слова: система интеграции пространственных данные, Linked Open Data, наборы RDF-связей, подсистема публикации данных, связывание данных.

Cистема поддержки принятия решений при выборе источников информации в сетях цитирования

Инна Геннадьевна Ольгина

76-96

Аннотация:

С появлением науки о сетях стало возможным исследовать сложные сетевые системы, в том числе социальные и информационные, посредством представления их в виде графовых моделей. Рост в геометрической прогрессии общего объема научных публикаций обуславливает актуальность задач анализа их взаимосвязей. В науке о сетях для решения данных задач разрабатываются модели и методы, относящиеся к сфере так называемых сетей цитирования. Однако сетевые метрики не используются при анализе публикаций в базах цитирования.

В работе рассмотрены вопросы создания системы поддержки принятия решений при выборе источников информации на основе данных о цитировании научных публикаций. Разработан программный комплекс для принятия решений по определению важности публикации в определенной тематической области. В основу работы этого программного комплекса заложен метод ранжирования публикаций по важности на основе анализа сетей цитирования, позволяющий выявить публикации, которые явно не выделяются в чистом виде при ранжировании на основе известных библиометрических показателей или известных мер центральности узлов. Проведены исследование и сравнительный анализ программного обеспечения для визуализации и исследования всех видов графов и социальных сетей. Выполнены исследования, подтверждающие эффективность предлагаемой системы поддержки принятия решений при выборе источников информации.

Ключевые слова: сеть цитирования, публикация, наукометрия, система поддержки принятия решений, архитектура программного комплекса, сетевой анализ, граф.

Семантический анализ документов в системе управления цифровыми научными коллекциями

Шамиль Махмутович Хайдаров

61-85

Аннотация: Предложены методы семантического анализа документов в системе управления цифровыми научными коллекциями, в том числе электронными научными журналами. Рассмотрены методы обработки документов, содержащих математические формулы, а также способы конвертации этих документов из формата OpenXML в формат TeX. Разработан алгоритм поиска по формулам в коллекциях математических документов, хранящихся в формате OpenXML. Алгоритм реализован в виде онлайн-сервиса на платформе science.tatarstan.

Ключевые слова: семантический анализ, издательские системы.

Прогнозы системы мультитрейдинга

Феликс Освальдович Каспаринский

897-1000

Аннотация:

Статья посвящена прогнозированию тенденций изменения цен финансовых инструментов рынка форекс. Рассмотрены способы формирования прогнозов на основании моделей бизнес-циклов и фрактальной самоорганизации ценообразования. На основании исторических прецедентов кризисов после 1812 и 1917 гг. определяются сроки кризиса 2015–2027 гг., завершение которого совпадает с одновременным окончанием 200-летней и 40-летних тенденций. Прогнозируется достижение точки технологической сингулярности в 2039 году. Разработаны способы интеграции инструментария фундаментального и технического анализа для прогноза глобальных событий, отсутствующих в экономическом календаре. Предложено увеличить эффективность прогнозирования изменения цен финансовых инструментов при помощи аналитической системы мультитрейдинга, спроектированной для работы с шестью стратегиями: долгосрочной (8 месяцев), среднесрочной (2 месяца), краткосрочными (1,5 недели и 1,5 дня) и внутридневными (8 часов, 2 часа). Выбор стратегии зависит от времени, которое трейдер готов использовать для аналитической деятельности и контролирования открытых сделок, допустимых рисков и ожидаемой доходности. Для всех стратегий установлен набор предпочтительных валютных пар брокеров Forex Club и FxPro, даны рекомендации для трейдеров. Определена необходимая и достаточная совокупность индикаторов технического анализа, участвующих в образовании тройного сигнала позиционирования стартовой точки Канала Регрессии, позволяющего автоматически спрогнозировать тактические уровни разворота тренда изменений цены на интервале формирования групп из восьми осцилляций. Разработан регламент создания, публикации и верификации тактических прогнозов длительности и амплитуды осцилляций цены для всех стратегий и множества финансовых инструментов. Прогнозы публикуются в каналах и группах «Мультитрейдинг» сетевых сервисов Телеграм, Дзен и ВКонтакте. Прогностический инструментарий предполагается использовать при формировании тактик системы мультитрейдинга.

Ключевые слова: мультитрейдинг, трейдинг, форекс, инвестиции, технический анализ, фундаментальный анализ, индикатор, торговый сигнал, ценовой канал, уровни курсов, прогноз.

Методы и средства визуализации сетей соавторства и сетей цитирования больших научных порталов

З.В. Апанович, П.С. Винокуров

Аннотация: Благодаря быстрому развитию направления Semantic Web и его новой ветви Linked Open Data, в Интернете становятся доступными большие объемы структурированной информации, размещенной на научных порталах, посвященных различным научным направлениям. Наиболее достоверным источником информации, посвященной любому научному направлению, являются собственно научные публикации, составляющие основное наполнение таких порталов. Эти данные нуждаются в средствах анализа, которые могли бы способствовать упрощению их понимания и оптимизации научного менеджмента. В данной работе описываются новые алгоритмы визуализации графов, реализованные в ИСИ СО РАН, и демонстрируется применение этих алгоритмов для визуализации сетей соавторства и сетей цитирования, извлеченных из научных порталов, входящих в облако Linked Open Data.

Ключевые слова: онтология, информационное наполнение, методы визуализации информации, силовой алгоритм, радиальный алгоритм, иерархические жгуты ребер, поуровневое изображение ориентированного графа, сети цитирования, Open Linked Data.

Препринт как материал для оверлейного журнала

Татьяна Алексеевна Полилова

387-407

Аннотация:

Движение Открытого доступа имеет давнюю историю. В 2002 г. впервые была озвучена Будапештская инициатива Открытого доступа. Однако до сих пор проблема Открытого доступа к научным публикациям не получила своего полного и окончательного решения. В 2018 г. в Европейском союзе был принят План S, который предписывает к 2020 г. сделать открытый доступ реальностью. План S подчеркивает важность самоархивирования статей и роль архивов (серверов) препринтов для размещения научных результатов. Отмечается, что архивы препринтов обладают большим потенциалом для редакционно-издательских инноваций. Научные журналы ограниченного для читателя доступа, функционирующие на коммерческой основе, не сдают своих позиций. Но и здесь мы видим определенные подвижки. Журналы стали менее жестко формулировать свою политику по отношению к препринтам и постпринтам статей.

Все больше зарубежных ученых становятся приверженцами движения «Справедливый открытый доступ», которое предлагает новое организационное решение. Журнал должен иметь учредителя в лице научной организации или некоммерческого фонда, которые нанимают группу исполнителей на оказание редакционно-издательских услуг. Редакторы и издатели не должны иметь своих коммерческих интересов. Финансирование научного журнала должно осуществляться за счет общего вклада организаций.

В статье рассматривается современный тип онлайнового научного журнала – оверлейный журнал. Себестоимость выпуска оверлейного журнала настолько низкая, что журнал легко может реализовать схему «бесплатно для автора, бесплатно для читателя». Оверлейный журнал опирается на общедоступные архивы (серверы) препринтов. Оверлейный онлайновый журнал проводит рецензирование статьи, поступившей из архива, в случае принятия статьи к публикации размещает на своем сайте ее метаданные, а сама скорректированная статья (ее полный текст) вновь размещается в архиве. Такая схема работы не перегружает функциональность архива, но при этом позволяет снизить финансовую нагрузку на оверлейный журнал.

Ключевые слова: научный журнал, Справедливый Открытый доступ, Открытый архив, сервер препринтов, оверлейный журнал.

Разработка веб-приложений на основе технологий, ресурсов и сервисов геопортала ИВМ СО РАН

О.Э. Якубайлик, А.А. Кадочников, А.В. Токарев

Аннотация: Геопортал – это картографический веб-сайт; специализированное программно-технологическое обеспечение для работы с пространственными данными. Его основная задача – обеспечение пользователя средствами и сервисами хранения и каталогизации, публикации и загрузки пространственных (географических) данных, поиска и фильтрации по метаданным, интерактивной веб-визуализации, прямого доступа к геоданным на основе картографических веб-сервисов. Геопортал ИВМ СО РАН, набор его компонентов и сервисов, стал геоинформационной платформой для создания семейства прикладных геоинформационных веб-приложений. В статье рассматриваются опыт проектирования и разработки этих систем.

Ключевые слова: геопортал, пространственные данные, интерактивная веб-визуализация.

Определение тематической близости научных журналов и конференций с использованием анализа графа соавторства

Александр Сергеевич Козицын, Сергей Александрович Афонин, Дмитрий Алексеевич Шачнев

514-525

Аннотация: Количество публикуемых в мире журналов очень велико. В этой связи, необходим программный инструментарий, который позволит анализировать тематические связи журналов. Разработанный авторами и представленный в этой работе алгоритм использует для анализа тематической близости журналов граф соавторства. Алгоритм нечувствителен к языку журнала и подбирает похожие журналы на разных языках, что сложно реализуемо для алгоритмов, основанных на анализе полнотекстовой информации. Апробация алгоритма проводилась в наукометрической системе ИАС ИСТИНА. В разработанном для этих целей интерфейсе пользователь может выбрать один близкий ему по тематике журнал, и система автоматически сформирует подборку журналов, которые могут представлять интерес для пользователя как с точки зрения изучения имеющихся в них материалов, так и с точки зрения публикации собственных статей. В перспективе разработанный алгоритм можно адаптировать для поиска похожих по тематике конференций, сборников публикаций и научных проектов. Наличие такого инструмента увеличит публикационную активность молодых сотрудников, повысит цитируемость статей и цитируемость между журналами. Результаты работы алгоритма определения тематической близости между журналами, сборниками, конференциями и научными проектами также могут использоваться для построения правил в моделях разграничения доступа к данным на основе онтологий предметной области.

Ключевые слова: тематическая классификация, библиографические данные, граф соавторства, информационные системы.

Электронные документы локального и сетевого доступа: публикация и виды использования

Е.В. Стрелкова

Аннотация: Электронный документ в национальной системе обязательного экземпляра. Подготовка произведения к электронной публикации и право на использование. Специальные права библиотек в условиях формирования сетевых узлов знаний.

Ключевые слова: электронная публикация, электронные библиотеки, авторское право в сетевой среде.

Индексы цитирования и оценка публикационной активности авторов

Александр Сергеевич Козицын, Сергей Александрович Афонин, Дмитрий Алексеевич Шачнев

629-645

Аннотация:

В современном научном мире одним из способов оценки успешности научной деятельности ученого является вычисление различных показателей, основанных на количестве его публикаций и их цитируемости. При этом каждый соавтор публикации получает за нее одинаковое количество баллов. Подобный способ оценки приводит к искусственному увеличению количества соавторов, что, в свою очередь, влечет за собой искажение рейтинговых оценок научной деятельности в организации, а также значительно снижает качество тематического поиска по библиографическим данным экспертов, конференций и журналов. Представленный в работе метод позволяет оценить степень влияния указанного фактора на показатели, основанные на учете количества и цитируемости научных публикаций. Апробация метода проводилась на данных наукометрической системы ИАС «ИСТИНА».

Ключевые слова: ранжирование, наукометрия, наукометрические системы, соавторство, системы цитирования, научный рейтинг.

Алгоритм определения переводов статей с использованием статистических данных

Александр Сергеевич Козицын, Сергей Александрович Афонин, Андрей Александрович Зензинов

494-505

Аннотация: В настоящее время происходит активное внедрение наукометрических систем для автоматизации процесса анализа эффективности деятельности научных организаций с целью применения различных методов стимулирования научной деятельности. Одними из наиболее важных индикаторов являются количество публикаций и их цитируемость. Для оценки этих показателей необходимы средства автоматизированного построения связей между оригинальными статьями и их переводами. В настоящей работе проанализированы существующие методы оценки близости оригинального текста и его возможного перевода, показана их недостаточная эффективность для построения связей между статьями и описаня разработанный авторами метод автоматического поиска переводов статей в больших коллекциях библиографических данных. Особенностью разработанного алгоритма является использование статистических данных о публикации статей в различных журналах и информации о соавторах анализируемых статей. Представленный в настоящей работе алгоритм позволяет осуществлять поиск переводов статей без предварительной настройки на заданные пары языков оригинала и перевода статьи, а также не требует использования больших коллекций обучающих выборок. Апробация программной реализации алгоритма проводилась в наукометрической системе Московского государственного университета (МГУ) им. М.В. Ломоносова. Результаты тестирования показали ее достаточную эффективность и возможность использования разработанного алгоритма для автоматического построения рекомендаций пользователям для отметки в системе переводных версий статей.

Ключевые слова: библиографические данные, анализ графов, перевод, статья, статистика, наукометрия, цитирование, автоматизированные системы.

Методика построения информационно-справочной системы по истории математической науки

В.Б. Барахнин, А.М. Федотов

Аннотация: В работе изложена методика построения информационно-справочной системы по истории науки. В качестве одного из возможных подходов предлагаются следующие основные принципы построения таких систем. Информация группируется вокруг персон, при этом подробно структурируются биографические данные в плане хронологии, географии и т.п. Библиографический список в описании персоны включает в себя, наряду с публикациями данного ученого, и публикации о нем самом. Четко отражена связь научной деятельности исследователя со структурированным описанием предметной области, в которой этот исследователь работал. Приведенное описание включает в себя информационную модель справочника, особенности реализации подсистем создаваемой информационной системы, а также основные виды информационных запросов пользователя, необходимых для полноценной работы с системой.

Использование методов тематического анализа в наукометрических системах

Александр Сергеевич Козицын, Сергей Александрович Афонин, Дмитрий Алексеевич Шачнев

315-338

Аннотация:

Во многих современных наукометрических системах и системах цитирования представлены различные механизмы тематического поиска и тематической фильтрации информации. В большинстве случаев для тематического анализа статей и журналов используется полнотекстовый подход, который имеет ряд ограничений. Использование алгоритмов, основанных на анализе графов как автономно, так и совместно с полнотекстовыми алгоритмами, позволяет устранить эти ограничения и улучшить полноту и точность тематического поиска. Алгоритм, разработанный авторами и представленный в этой работе, использует для анализа тематической близости журналов граф соавторства. Алгоритм нечувствителен к языку журнала и подбирает похожие журналы на разных языках, что сложно реализуемо для алгоритмов, основанных на анализе полнотекстовой информации. Апробация алгоритма проводилась в наукометрической системе ИАС ИСТИНА. В интерфейсе, разработанном для этих целей, пользователь может выбрать один близкий ему по тематике журнал, и система автоматически сформирует подборку журналов, которые могут представлять интерес для пользователя как с точки зрения изучения имеющихся в них материалов, так и с точки зрения публикации собственных статей. В перспективе разработанный алгоритм можно адаптировать для поиска похожих по тематике конференций, сборников публикаций и научных проектов. Наличие такого инструмента увеличит публикационную активность молодых сотрудников, повысит цитируемость статей и цитируемость между журналами. Результаты работы алгоритма определения тематической близости между журналами, сборниками, конференциями и научными проектами также могут использоваться для построения правил в моделях разграничения доступа к данным на основе онтологий предметной области.

Использование графа соавторства для тематического поиска конференций по наукометрическим данным

Александр Сергеевич Козицын, Сергей Александрович Афонин, Дмитрий Алексеевич Шачнев

600-615

Аннотация:

Применение современных методов тематического анализа для аналитической обработки больших объемов информации используется в настоящие время практически во всех сферах человеческой деятельности, в том числе, в наукометрии. Многие наукометрические системы и системы цитирования, включая всемирно известные WoS, Scopus, Google Shcolar, разрабатывают тематические рубрикаторы для поиска и обработки информации. Важными практическими задачами, которые могут решаться с применением методов тематической классификации, являются: оценка динамики развития тематических направлений в организации, в отдельной стране и мировой науке в целом; поиск статей по заданной тематике; поиск и оценка авторитетности экспертов; поиск журналов для публикации и другие актуальные задачи. Авторами созданы программные реализации алгоритмов для решения некоторых из перечисленных задач и ведутся научные исследования с целью создания новых эффективных математических моделей и алгоритмов в этой области.

Ключевые слова: тематический поиск, библиографические данные, поиск конференций, граф соавторства, информационные системы, наукометрия.

Результаты исследований по обнаружению заимствований с использованием анализа цитирований

Вадим Николаевич Гуреев, Николай Алексеевич Мазов

322-331

Аннотация:

Переводной плагиат как одна из наиболее распространенных в научном информационном пространстве разновидностей плагиата представляет собой трудноразрешимую проблему, поскольку практически не поддается автоматизированному выявлению. Между тем за последние пять лет в этом направлении наблюдается прогресс. Авторами настоящей работы, а также группой зарубежных исследователей из нескольких университетов независимо друг от друга был предложен подход к выявлению плагиата на основе анализа цитирований, при котором для анализируемой подозрительной публикации находится возможный первоисточник с идентичным или схожим списком цитируемой литературы, что в итоге позволяет сличать текст на разных языках. Разработанная методика обнаружения неправомерных заимствований в научных текстах успешно прошла тестовые исследования. В статье приведены результаты четырехлетних исследований.

Ключевые слова: обнаружение заимствований, переводной плагиат, выявление плагиата, анализ цитирования, база данных цитирований.

Абстрактивная суммаризация новостей внешней торговли на основе нового специализированного корпуса данных

Дарья Андреевна Лютова, Валентин Андреевич Малых

1120-1137

Аннотация:

Представлен TradeNewsSum — корпус для абстрактивной генерации аннотаций к новостям внешней торговли, охватывающий русско- и англоязычные публикации из профильных источников. Все рефераты подготовлены вручную по унифицированным правилам. Проведены эксперименты с дообучением трансформерных и seq2seq-моделей и автоматическую оценку по схеме LLM-as-a-judge. Наилучшие результаты показала LLaMA 3.1 в режиме инструкционного промптинга, продемонстрировав высокие значения по метрикам, включая фактологическую полноту.

Ключевые слова: абстрактивное реферирование, многоязычный корпус, новости внешней торговли, санкции, торговые режимы, TradeNewsSum, трансформеры, большие языковые модели, LLM-as-a-judge, NER-оценка сущностей.

Архитектура и технологии RDFS-среды разработки цифровых библиотек и Web-порталов

А.А. Бездушный, А.К. Нестеренко, Т.М. Сысоев, А.Н. Бездушный, В.А. Серебряков

Аннотация: В работе рассматривается общая архитектура новой версии системы ИСИР, опирающейся на открытые стандарты W3C: Semantic Web [SW], XML[XML] технологии, и на применение opensource решений. Архитектура позволяет разрабатывать распределённые объектно-ориентированные информационные системы - цифровые библиотеки, информационные и корпоративные порталы, сайты на базе различных типов хранилищ информации, таких как объектные и реляционные базы данных, LDAP-каталоги. Система параметризуется описанием объектной схемы данных конкретной предметной области и легко адаптируется к её изменениям. Для описания схемы используется W3C стандарт на описание схем Интернет ресурсов - RDFS. Архитектура имеет многоуровневую модульную организацию, каждый уровень имеет собственные цели и абстракции. Фундамент решения - ядро ИСИР - унифицирует механизмы работы с хранимыми объектными данными, предоставляет ряд услуг по управлению этими данными, например, разграничение прав доступа, журнализация изменений. На базе ядра строятся более высокоуровневые сервисы такие, как RDF/XML-обмен данными, репликация информации между репозиториями, атрибутно - полнотекстовая индексация данных и др. Имеются средства для простой и эффективной разработки пользовательских Web-интерфейсов. Средства публикации информации и построения отчётов применяют механизмы XSLT и поддерживают широкий спектр целевых форматов. Служба управления потоками работ по редактированию ресурсов репозиториев следует стандартам WfMC - канонической модели и языку спецификации потоков работ XPDL. Служба управления содержанием Web-сайта обеспечивает мульти - иерархическую каталогизацию слабоструктурированной информации, отличающейся нерегулярностью взаимосвязи ее элементов.

Система для создания, поддержания и публикации электронных архивов

А.Г. Марчук

Аннотация: В работе представлен подход к формированию цифровых архивов документов. Он отличается тем, что кроме основных единиц хранения электронных образов документов, создается база данных неспецифических сущностей, к которой «привязываются» документы. Такой способ позволяет улучшить описание документов и привнести естественные формы поиска и изучения материала. В работах [1, 3] определены принципы электронной фиксации фактов, а также общие положения реализации распределенных архивных фактографических систем. Усилиями последних лет было создано платформенное решение Фактограф, позволяющее создавать, сопровождать и публиковать электронные архивы. Систему также можно использовать и в других прикладных областях: цифровые библиотеки, музеи, простые системы научного делопроизводства.

Ключевые слова: цифровые архивы документов, фактограф, онтология BONE, хранение документов.

1 - 25 из 34 результатов 1 2 > >>