Барзолевская Анна Федоровна (ФГБОУ ВО «Московский Государственный Лингвистический Университет», Москва)
Кондрашкин Дмитрий Александрович (ФГБОУ ВО «Московский Государственный Лингвистический Университет», Москва)
Самойлов Вячеслав Евгеньевич (к.т.н., ФГБОУ ВО «Московский Государственный Лингвистический Университет», Москва)
Царегородцев Анатолий Валерьевич (д.т.н, профессор, ФГБОУ ВО «Московский Государственный Лингвистический Университет», Москва)
|
Интернет представляет собой один из крупнейших источников информации в мире. Можно сказать, что любая тема, на которую мы размышляем, может быть найдена в сети. Информация в Интернете представлена в разных формах и типах, например, в текстовых документах, картинках и видео. Однако, сбор полезной информации без помощи некоторых веб-утилит является очень непростой задачей. В этом деле помогает веб-майнинг: данный метод предоставляет инструменты, облегчающие извлечение необходимых данных из интернет-ресурсов. Многие исследования сфокусированы на проблеме высокоточной классификации веб-страниц. В данном исследовании проводится оценка некоторых алгоритмов контролируемого обучения для выявления категорий среди публикаций в социальных сетях. В процессе исследования, для сравнения эффективности решения задач классификации публикаций пользователей социальных сетей, использованы следующие алгоритмы машинного обучения: случайный лес, нейронная сеть, снижение размерности, AdaBoost.
Ключевые слова:классификация публикаций пользователей сети Интернет; социальные сети; классификация веб-страниц; анализ данных; случайный лес; нейронные сети; снижение размерности; AdaBoost.
|
|
|
Читать полный текст статьи …
|
Ссылка для цитирования: Барзолевская А. Ф., Кондрашкин Д. А., Самойлов В. Е., Царегородцев А. В. Сравнение алгоритмов машинного обучения классификации интернет-публикаций // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2021. -№01. -С. 58-63 DOI 10.37882/2223-2966.2021.01.05 |
|
|