Исмуканова Айгерим Наурызбаевна (Аспирант, Омский государственный университет им. Ф.М. Достоевского, г. Омск)
|
Классификация научных текстов на русском и казахском языках, посредством присвоения им универсального десятичного кода (УДК) является актуальной задачей. Задача классификации научных текстов прекрасно решается для английского языка в силу простоты морфологии и синтаксиса этого языка. На данном пути имеется ряд нерешенных задач для русского языка и практически не исследовано использование аналогичных приемов для казахского языка. Для русского языка проводились несколько исследований применимости разных подходов.
Новые технологии, для модели LSA (латентного-семантического анализа) могли представлять важное усовершенствование в исследовании оценки научных текстов.
Ключевые слова:латентный семантический анализ (ЛСА), машинное обучение (МА), классификация, матрица.
|
|
|
Читать полный текст статьи …
|
Ссылка для цитирования: Исмуканова А. Н. Прикладные аспекты математического применения латентно-семантического анализа к классификации научных текстов // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2019. -№1. -С. 56-59 |
|
|