Чжэн Цзини (МГТУ им. Н.Э. Баумана)
Вэй Сяоюй (МГТУ им. Н.Э. Баумана)
|
В статье дается обзор основных подходов к анализу текстовой информации. Особое внимание уделяется технологиям TextMining и мешка (или облака) слов. Рассмотрен алгоритм комплексной классификации текстов. Описывается программное решения построения семантического ядра текста на языке Python на базе библиотеки collections.
Ключевые слова:классификация текстов, семантическое ядро, признаки документов, ключевые фразы, дистрибутивная семантика, text mining, мешок (или облако) слов.
|
|
|
Читать полный текст статьи …
|
Ссылка для цитирования: Чжэн Ц. , Вэй С. Анализ технологии классификации текста // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2022. -№03/2. -С. 58-61 DOI 10.37882/2223-2966.2022.03-2.18 |
|
|