Русско-английский набор данных и выравнивание сущностей в графах знаний с несопоставимыми сущностями

Main Article Content

Зинаида Владимировна Апанович
Даниил Георгиевич Керного

Аннотация

В последние годы кратно возрос интерес к графам знаний (ГЗ) как в научном, так и в промышленном сообществах. Интеграция различных графов знаний является одной из актуальнейших задач и используется, например, для разработки сложных цифровых двойников промышленных систем. Интеграция графов знаний также необходима при объединении графов знаний, извлеченных из текстов на естественном языке при помощи больших языковых моделей. Одной из компонент решения задачи интеграции ГЗ является задача выравнивания сущностей, пытающаяся идентифицировать в разных ГЗ сущности, описывающие один и тот же объект реального мира. К сожалению, в реальных графах знаний многие сущности не имеют эквивалентов в других графах знаний. В частности, каждый фрагмент графа знаний, извлеченный из отдельной публикации, может иметь свою собственную структуру имен сущностей и идентификаторов, что существенно усложняет задачу идентификации сущностей. В работе описаны эксперименты по выравниванию сущностей при наличии несопоставимых сущностей на примере русско-английского набора данных

Article Details

Как цитировать
Апанович, З. В., и Д. Г. Керного. «Русско-английский набор данных и выравнивание сущностей в графах знаний с несопоставимыми сущностями». Электронные библиотеки, т. 29, вып. 2, апрель 2026 г., сс. 332-5, doi:10.26907/1562-5419-2026-29-2-332-352.

Библиографические ссылки

1. Gnezdilova V.A., Apanovich Z.V., Russian-English dataset and comparative analysis of algorithms for cross-language embedding-based entity alignment // Journal of Physics: Conference Series. 2021. Vol. 2099. https://doi.org/10.1088/1742-6596/2099/1/012023
2. Gusev D., Apanovich Z. Methods of processing textual information in entity alignment algorithms // Bulletin of the Novosibirsk Computing Center. Series: Computer Science. 2021. No. 45. P. 49–58. https://doi.org/10.31144/bncc.cs.2542-1972.2021.n45.p49-58
3. Lample G., Conneau A., Ranzato M., Denoyer L., Jégou H. Word translation without parallel data // ICLR. OpenReview.net. 2018. https://doi.org/10.48550/arXiv.1710.04087
4. W. Zeng, X. Zhao, X. Li, J. Tang, W. Wang. On entity alignment at scale // The VLDB Journal. 2022. Vol. 31. Issue 5. P. 1009–1033. https://doi.org/10.1007/s00778-021-00703-3
5. Kuhn H.W. The hungarian method for the assignment problem. URL: https://web.eecs.umich.edu/~pettie/matching/Kuhn-hungarian-assignment.pdf. https://doi.org/10.1002/nav.3800020109
6. W. Zeng, X. Zhao, J. Tang, X. Lin. Collective entity alignment via adaptive features // ICDE. 2020. P. 1870–1873. https://doi.org/10.48550/arXiv.1912.08404
7. R. Zhu, M. Ma, P. Wang. RAGA: relation-aware graph attention networks for global entity alignment // PAKDD. 2021. Vol. 12712. P. 501–513. https://doi.org/10.48550/arXiv.2103.00791
8. Xin M., Wenting W., Huimin X. et al. Relational Reflection Entity Alignment. // arXiv.org. 2020. https://doi.org/10.48550/arXiv.2008.07962
9. Zhao X., Zeng W., Tang J., Recent Advance of Alignment Inference Stage // Entity Alignment. Springer Nature, Singapore, 2023. P. 207–227. https://doi.org/10.1007/978-981-99-4250-3
10. Zhao X., Zeng W., Tang J. et al. Toward Entity Alignment in the Open World: An Unsupervised Approach with Confidence Modeling // Data Sci. Eng. 2022. No. 7. P. 16–29. https://doi.org/10.1007/s41019-022-00178-4
11. Feng F., Yang Y., Cer D., Arivazhagan N., Wang W. Language-agnostic BERT Sentence Embedding // ArXiv. 2020. https://doi.org/10.48550/arXiv.2007.01852


Наиболее читаемые статьи этого автора (авторов)