Касымов Алексей Алексеевич (аспирант, Воронежский государственный технический университет, Воронеж, Россия)
Максимов Юрий Максимович (аспирант, Воронежский государственный технический университет, Воронеж, Россия)
|
В данной статье представлен краткий обзор последних моделей классификации текста с акцентом на поток данных, от необработанного текста до выходных меток. Подчеркиваются различия между более ранними методами и более поздними методами, основанными на глубоком обучении, как в их функционировании, так и в том, как они преобразуют входные данные. Чтобы дать лучшее представление о классификации текстов, предоставляется обзор наборов данных для языка, а также инструкции по синтезу двух новых наборов данных с несколькими метками. В конце описан обзор новых экспериментальных результатов и обсуждаем проблемы открытых исследований, связанные с языковыми моделями, основанными на глубоком обучении.
Ключевые слова:классификация текстов; токенизация; маркировка темы; классификация новостей; трансформатор; поверхностное обучение; глубокое обучение; многокомпонентные корпуса
|
|
|
Читать полный текст статьи …
|
Ссылка для цитирования: Касымов А. А., Максимов Ю. М. ИСПОЛЬЗОВАНИЕ ГЕНЕРАТИВНЫХ АЛГОРИТМОВ ДЛЯ ФОРМИРОВАНИЯ ДОКУМЕНТОВ // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2023. -№09. -С. 70-76 DOI 10.37882/2223-2966.2023.09.09 |
|
|