Багатокритеріальне розпізнавання відповідності текстів темі на основі алгоритму TF-IDF

DOI: 10.31673/2412-9070.2025.027728

Автор(и)

  • В. М. Данильченко, (Danylchenko V. M.) Державний університет інформаційно – комунікаційних технологій, Київ
  • С. І. Отрох, (Otrokh S. I.) Національний технічний університет України “Київський політехнічний інститут імені Ігоря Сікорського”, Україна
  • М. О. Шалигін, (Shaligin M. O.) Національний технічний університет України “Київський політехнічний інститут імені Ігоря Сікорського”, Україна
  • А. Г. Донець, (Donets A. G.) Національний технічний університет України “Київський політехнічний інститут імені Ігоря Сікорського”, Україна

DOI:

https://doi.org/10.31673/2412-9070.2025.027728

Анотація

Досліджено актуальність застосування статистичних методів для оцінки приналежності документів до тематики, обраної користувачем. Проаналізовано можливості та імплементовано використання модифікованого алгоритму на основі метрики TF-IDF для ефективного аналізу та класифікації текстових документів. Описано процес розроблення програми з використанням багатокритеріального підходу до розпізнавання відповідності тексту темі, а також розглянуто методи нормалізації та фільтрації текстових даних для вдосконалення точності класифікації. Запропоновано високоефективне вирішення для виявлення релевантних документів, яке може бути застосовано у різних сферах: від пошукових систем та інформаційних фільтрів до рекомендаційних платформ і аналітичних інструментів. Відображено важливість використання інноваційних методів для автоматизованої фільтрації даних.

Ключові слова: обробка; дані; метод TF-IDF; класифікація документів; багатокритеріальне розпізнавання; стоп-слова; нормалізація тексту; масив даних; глибоке навчання; технологія.

##submission.downloads##

Опубліковано

2025-07-20

Номер

Розділ

Статті