Використання мiр подiбностi в методах класифiкацiї

Дане дослідження є розвитком напрямку застосування різних видів мір подібності в задачах інтелектуального аналізу даних. Майнінг даних - це процес видобутку неявної інформації з бази даних, якa характеризує приховані зв’язки та структури. Прогнозується, що цей вид аналізу стане надзвичайно затребува...

Full description

Bibliographic Details
Main Author: Н. Е. Кондрук
Format: Article
Language:English
Published: State University “Uzhhorod National University” 2021-05-01
Series:Науковий вісник Ужгородського університету. Серія: Математика і інформатика
Subjects:
knn
Online Access:http://visnyk-math.uzhnu.edu.ua/article/view/231626
Description
Summary:Дане дослідження є розвитком напрямку застосування різних видів мір подібності в задачах інтелектуального аналізу даних. Майнінг даних - це процес видобутку неявної інформації з бази даних, якa характеризує приховані зв’язки та структури. Прогнозується, що цей вид аналізу стане надзвичайно затребуваним протягом наступного десятиліття. В роботі наведено огляд сучасних напрямків контрольованої класифікації. Найпопулярнішим прийомом класифікації об’єктів із числовими атрибутами вважається метод K-найближчих сусідів (KNN). Встановлено, що прогнозне значення мітки класу можна покращити, якщо використовувати зважений вплив кожного сусіда на результат.  Таким чином, доцільно модифікувати метод KNN. При цьому, запропоновано ввести  функцію, що характеризує схожість неміченого об’єкта із його найближчими сусідами у вигляді міри подібності. На її основі введено індикатори зваженого підрахунку голосів «сусідів» за певну мітку класу. Розроблено програмне забезпечення, що реалізує описаний підхід. Проведення практичних експериментів показало його ефективність при розв’язанні певних класів прикладних задач.
ISSN:2616-7700