Том 2 № 2 (2023): “O‘ZBEK TILI MILLIY VA TA’LIMIY KORPUSINING NAZARIY VA AMALIY MASALALARI”
Статьи

OʻZBEK TILIDAGI TURLI TUZILISHLI SOʻZLARNI LEMMALASH USULLARI

Опубликован 2023-05-30

Ключевые слова

  • Lemmatizatsiya, stemming, qidiruv tizimlari, morfologik tahlil, turli tuzilishli soʻzlar, qoʻshma soʻz, juft soʻz, takror soʻz.

Аннотация

Lemmatizatsiya - soʻzning asosiy morfologik shaklini (lemmasini) topish jarayoni. Bu koʻplab tabiiy tillarni qayta ishlash (Natural Language Processing, NLP) va ma’lumot olish (Information Retrieval, IR) vazifalarini hal qilishdagi muhim dastlabki qadamdir. Oʻzbek tilining morfologiyasi, aglutinativ jihatlari boyligi sababli leksik maʼnoliligi tufayli lemmatizatsiya murakkab vazifa hisoblanadi. Ushbu maqolada oʻzbek tilidagi turli tuzilishli soʻzlarni lemmalash usullari taqdim etiladi.