Vol. 2 No. 2 (2023): “O‘ZBEK TILI MILLIY VA TA’LIMIY KORPUSINING NAZARIY VA AMALIY MASALALARI”
Статьи

OʻZBEK TILIDAGI TURLI TUZILISHLI SOʻZLARNI LEMMALASH USULLARI

Published 2023-05-30

Keywords

  • Lemmatizatsiya, stemming, qidiruv tizimlari, morfologik tahlil, turli tuzilishli soʻzlar, qoʻshma soʻz, juft soʻz, takror soʻz.

Abstract

Lemmatizatsiya - soʻzning asosiy morfologik shaklini (lemmasini) topish jarayoni. Bu koʻplab tabiiy tillarni qayta ishlash (Natural Language Processing, NLP) va ma’lumot olish (Information Retrieval, IR) vazifalarini hal qilishdagi muhim dastlabki qadamdir. Oʻzbek tilining morfologiyasi, aglutinativ jihatlari boyligi sababli leksik maʼnoliligi tufayli lemmatizatsiya murakkab vazifa hisoblanadi. Ushbu maqolada oʻzbek tilidagi turli tuzilishli soʻzlarni lemmalash usullari taqdim etiladi.