Використання мiр подiбностi в методах класифiкацiї

Дане дослідження є розвитком напрямку застосування різних видів мір подібності в задачах інтелектуального аналізу даних. Майнінг даних - це процес видобутку неявної інформації з бази даних, якa характеризує приховані зв’язки та структури. Прогнозується, що цей вид аналізу стане надзвичайно затребува...

Full description

Bibliographic Details
Main Author: Н. Е. Кондрук
Format: Article
Language:English
Published: State University “Uzhhorod National University” 2021-05-01
Series:Науковий вісник Ужгородського університету. Серія: Математика і інформатика
Subjects:
knn
Online Access:http://visnyk-math.uzhnu.edu.ua/article/view/231626
id doaj-3d39dcd8781c4c2cb08b332f3776e0ee
record_format Article
spelling doaj-3d39dcd8781c4c2cb08b332f3776e0ee2021-09-02T21:06:28ZengState University “Uzhhorod National University”Науковий вісник Ужгородського університету. Серія: Математика і інформатика2616-77002021-05-0138114314810.24144/2616-7700.2021.38(1).143-148269249Використання мiр подiбностi в методах класифiкацiїН. Е. Кондрук0https://orcid.org/0000-0002-9277-5131ДВНЗ «Ужгородський національний університет»Дане дослідження є розвитком напрямку застосування різних видів мір подібності в задачах інтелектуального аналізу даних. Майнінг даних - це процес видобутку неявної інформації з бази даних, якa характеризує приховані зв’язки та структури. Прогнозується, що цей вид аналізу стане надзвичайно затребуваним протягом наступного десятиліття. В роботі наведено огляд сучасних напрямків контрольованої класифікації. Найпопулярнішим прийомом класифікації об’єктів із числовими атрибутами вважається метод K-найближчих сусідів (KNN). Встановлено, що прогнозне значення мітки класу можна покращити, якщо використовувати зважений вплив кожного сусіда на результат.  Таким чином, доцільно модифікувати метод KNN. При цьому, запропоновано ввести  функцію, що характеризує схожість неміченого об’єкта із його найближчими сусідами у вигляді міри подібності. На її основі введено індикатори зваженого підрахунку голосів «сусідів» за певну мітку класу. Розроблено програмне забезпечення, що реалізує описаний підхід. Проведення практичних експериментів показало його ефективність при розв’язанні певних класів прикладних задач.http://visnyk-math.uzhnu.edu.ua/article/view/231626класифікаціяалгоритм k найближчих сусідівknnміра подібностіконтрольоване машинне навчання
collection DOAJ
language English
format Article
sources DOAJ
author Н. Е. Кондрук
spellingShingle Н. Е. Кондрук
Використання мiр подiбностi в методах класифiкацiї
Науковий вісник Ужгородського університету. Серія: Математика і інформатика
класифікація
алгоритм k найближчих сусідів
knn
міра подібності
контрольоване машинне навчання
author_facet Н. Е. Кондрук
author_sort Н. Е. Кондрук
title Використання мiр подiбностi в методах класифiкацiї
title_short Використання мiр подiбностi в методах класифiкацiї
title_full Використання мiр подiбностi в методах класифiкацiї
title_fullStr Використання мiр подiбностi в методах класифiкацiї
title_full_unstemmed Використання мiр подiбностi в методах класифiкацiї
title_sort використання мiр подiбностi в методах класифiкацiї
publisher State University “Uzhhorod National University”
series Науковий вісник Ужгородського університету. Серія: Математика і інформатика
issn 2616-7700
publishDate 2021-05-01
description Дане дослідження є розвитком напрямку застосування різних видів мір подібності в задачах інтелектуального аналізу даних. Майнінг даних - це процес видобутку неявної інформації з бази даних, якa характеризує приховані зв’язки та структури. Прогнозується, що цей вид аналізу стане надзвичайно затребуваним протягом наступного десятиліття. В роботі наведено огляд сучасних напрямків контрольованої класифікації. Найпопулярнішим прийомом класифікації об’єктів із числовими атрибутами вважається метод K-найближчих сусідів (KNN). Встановлено, що прогнозне значення мітки класу можна покращити, якщо використовувати зважений вплив кожного сусіда на результат.  Таким чином, доцільно модифікувати метод KNN. При цьому, запропоновано ввести  функцію, що характеризує схожість неміченого об’єкта із його найближчими сусідами у вигляді міри подібності. На її основі введено індикатори зваженого підрахунку голосів «сусідів» за певну мітку класу. Розроблено програмне забезпечення, що реалізує описаний підхід. Проведення практичних експериментів показало його ефективність при розв’язанні певних класів прикладних задач.
topic класифікація
алгоритм k найближчих сусідів
knn
міра подібності
контрольоване машинне навчання
url http://visnyk-math.uzhnu.edu.ua/article/view/231626
work_keys_str_mv AT nekondruk vikoristannâmirpodibnostivmetodahklasifikacií
_version_ 1721169733307334656