Пуртов Даниил Владимирович (МИРЭА - Российский технологический университет)
Пуртов Владимир Сергеевич (арт-директор
ООО “Элотра”
)
Шмитько Кирилл Андреевич (МИРЭА - Российский технологический университет)
Русаков Алексей Михайлович (старший преподаватель,
МИРЭА - Российский технологический университет
)
Мельников Алексей Олегович (доцент,
МИРЭА - Российский технологический университет)
Филатов Вячеслав Валерьевич (доцент,
МИРЭА - Российский технологический университет
)
|
В данной статье представлено исследование по разработке программного инструмента Web-PD-Scanner, предназначенного для анализа веб-страниц в формате HTML с целью обнаружения потенциальной утечки персональных данных. В статье представлен обзор современных программных средств для парсинга веб-ресурсов, а также обзор технологий парсинга HTML-страниц и их ограничений. Обосновывается актуальность предлагаемого исследования, определяются объект, предмет исследования, область применения и ограничения программного обеспечения. Сформулированы основные задачи, решаемые программным обеспечением, и определены различные математические методы, алгоритмы и программные средства, которые могут быть использованы для разработки программного обеспечения Web-PD-Scanner. В статье делается вывод о том, что гибридный подход, сочетающий алгоритмы на основе правил и машинное обучение, является наиболее эффективным решением для обнаружения утечек персональных данных на веб-сайтах. Следующий этап исследования предполагает определение модели хранения агрегированных персональных данных и выбор конкретных методов и алгоритмов разработки программного обеспечения Web-PD-Scanner. Это исследование предоставляет ценную информацию для исследователей и практиков, заинтересованных в разработке программных инструментов для анализа веб-страниц на предмет утечки личных данных.
Ключевые слова:скраппинг веб-страниц, интеллектуальный анализ данных, синтаксический анализ HTML, защита персональных данных, разработка программного обеспечения
|
|
|
Читать полный текст статьи …
|
Ссылка для цитирования: Пуртов Д. В., Пуртов В. С., Шмитько К. А., Русаков А. М., Мельников А. О., Филатов В. В. РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ АНАЛИЗА САЙТОВ НА ПРЕДМЕТ УТЕЧКИ ПЕРСОНАЛЬНЫХ ДАННЫХ // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2023. -№05. -С. 97-104 DOI 10.37882/2223-2966.2023.05.29 |
|
|