Нэй Лин (Аспирант, Курский государственный университет)
|
В статье анализируется один из способов кластеризации документов. Определяются подходы к реализации этого способа. Кластеризация текста традиционными методами осуществляется на основе синтаксический ин-формации, а не семантической информации. Поэтому система кластериза-ции не понимает значение слов, и при этом в документах имеются синони-мы и полисемии. Но здесь существуют и другие проблемы, которые при-водят к потере данных и ошибкам в информации. Когда осуществляется замена онтологией одинаковых семантически слов, возникает вероятность потери данных
Ключевые слова:кластеризация, онтология, поиск, семантический вес.
|
|
|
Читать полный текст статьи …
|
Ссылка для цитирования: Нэй Л. Кластеризация документов на основе онтологии // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2017. -№09. -С. 38-42 |
|
|