Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması

Bu çalışmada veri madenciliği ve makine öğrenme yaklaşımının eğitim alanında kullanılması ve bu algoritmalara dayalı olarak elde edilen sonuçların güvenirlik ve geçerlik değerlerinin ne düzeyde olduğu belirlenmeye çalışılmıştır. PISA 2015 Türkiye ortalamasına göre öğrencilerin başarılı ve başarısız...

Full description

Bibliographic Details
Main Authors: Gökhan Aksu, Nuri Doğan
Format: Article
Language:Turkish
Published: Ankara University 2018-12-01
Series:Ankara Üniversitesi Eğitim Bilimleri Fakültesi Dergisi
Subjects:
Online Access:http://dergipark.gov.tr/auebfd/issue/40693/464262?publisher=ankara
id doaj-5e119a2cb48f4516be9695f656701d31
record_format Article
spelling doaj-5e119a2cb48f4516be9695f656701d312020-11-24T21:03:01ZturAnkara UniversityAnkara Üniversitesi Eğitim Bilimleri Fakültesi Dergisi1301-37182458-83422018-12-015137110010.30964/auebfd.46426245Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında KarşılaştırılmasıGökhan Aksu0Nuri Doğan1ADNAN MENDERES ÜNİVERSİTESİHacettepe UniversityBu çalışmada veri madenciliği ve makine öğrenme yaklaşımının eğitim alanında kullanılması ve bu algoritmalara dayalı olarak elde edilen sonuçların güvenirlik ve geçerlik değerlerinin ne düzeyde olduğu belirlenmeye çalışılmıştır. PISA 2015 Türkiye ortalamasına göre öğrencilerin başarılı ve başarısız olarak sınıflandığı çalışmada farklı öğrenme yöntemleri kullanılarak fen okuryazarlığı bakımından öğrencilerin hangi sınıfta yer alacağı tahmin edilmiş ve bu aşamada elde edilen sonuçların güvenirlik ve geçerlik ölçütleri incelenmiştir. Çalışma kapsamında ele alınan 8 farklı öğrenme yönteminden doğru sınıflama sayısı, doğru sınıflama oranı, kappa istatistiği, karekök hata ve göreceli karekök hata değerleri bakımından en iyi sonuçların Random Forest yöntemiyle elde edilirken Ridge lojistik regresyon, Lojistik model ve Hoefding tree yöntemlerinin en başarılı diğer yöntemler olduğu belirlenmiştir. Çapraz geçerleme yöntemi kullanılmadan tüm veri setinin eğitim ve test veri seti olarak ayrılması durumunda Lojistik model, Random Forest ve Ridge Regresyon yöntemlerinin farklı büyüklükteki test verilerinde en düşük hata değerlerini verirken Random Tree ve J.48 yönteminlerinin en yüksek hata değerlerine sahip olduğu belirlenmiştir. Ridge regresyon, Random forest ve Lojistik model tarafından elde edilen hata değerlerinin de farklı yüzdelikteki test verilerinde oldukça tutarlı olduğu sonucuna ulaşılmıştır. Farklı yöntemler yardımıyla elde edilen ölçme sonuçlarının veri setini test ve eğitim verisi olarak ayırmayıp aynı veri seti üzerinden hem öğrenme yöntemini eğitip hem de test ettiğimiz taktirde özellikle Random tree ve J.48 öğrenme yöntemlerinin gerçek performanslarından daha yüksek doğru sınıflama oranına sahip oldukları belirlenmiştir.http://dergipark.gov.tr/auebfd/issue/40693/464262?publisher=ankaraVeri madenciliğiWEKAÖğrenme yöntemiSınıflama
collection DOAJ
language Turkish
format Article
sources DOAJ
author Gökhan Aksu
Nuri Doğan
spellingShingle Gökhan Aksu
Nuri Doğan
Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması
Ankara Üniversitesi Eğitim Bilimleri Fakültesi Dergisi
Veri madenciliği
WEKA
Öğrenme yöntemi
Sınıflama
author_facet Gökhan Aksu
Nuri Doğan
author_sort Gökhan Aksu
title Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması
title_short Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması
title_full Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması
title_fullStr Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması
title_full_unstemmed Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması
title_sort veri madenciliğinde kullanılan öğrenme yöntemlerinin farklı koşullar altında karşılaştırılması
publisher Ankara University
series Ankara Üniversitesi Eğitim Bilimleri Fakültesi Dergisi
issn 1301-3718
2458-8342
publishDate 2018-12-01
description Bu çalışmada veri madenciliği ve makine öğrenme yaklaşımının eğitim alanında kullanılması ve bu algoritmalara dayalı olarak elde edilen sonuçların güvenirlik ve geçerlik değerlerinin ne düzeyde olduğu belirlenmeye çalışılmıştır. PISA 2015 Türkiye ortalamasına göre öğrencilerin başarılı ve başarısız olarak sınıflandığı çalışmada farklı öğrenme yöntemleri kullanılarak fen okuryazarlığı bakımından öğrencilerin hangi sınıfta yer alacağı tahmin edilmiş ve bu aşamada elde edilen sonuçların güvenirlik ve geçerlik ölçütleri incelenmiştir. Çalışma kapsamında ele alınan 8 farklı öğrenme yönteminden doğru sınıflama sayısı, doğru sınıflama oranı, kappa istatistiği, karekök hata ve göreceli karekök hata değerleri bakımından en iyi sonuçların Random Forest yöntemiyle elde edilirken Ridge lojistik regresyon, Lojistik model ve Hoefding tree yöntemlerinin en başarılı diğer yöntemler olduğu belirlenmiştir. Çapraz geçerleme yöntemi kullanılmadan tüm veri setinin eğitim ve test veri seti olarak ayrılması durumunda Lojistik model, Random Forest ve Ridge Regresyon yöntemlerinin farklı büyüklükteki test verilerinde en düşük hata değerlerini verirken Random Tree ve J.48 yönteminlerinin en yüksek hata değerlerine sahip olduğu belirlenmiştir. Ridge regresyon, Random forest ve Lojistik model tarafından elde edilen hata değerlerinin de farklı yüzdelikteki test verilerinde oldukça tutarlı olduğu sonucuna ulaşılmıştır. Farklı yöntemler yardımıyla elde edilen ölçme sonuçlarının veri setini test ve eğitim verisi olarak ayırmayıp aynı veri seti üzerinden hem öğrenme yöntemini eğitip hem de test ettiğimiz taktirde özellikle Random tree ve J.48 öğrenme yöntemlerinin gerçek performanslarından daha yüksek doğru sınıflama oranına sahip oldukları belirlenmiştir.
topic Veri madenciliği
WEKA
Öğrenme yöntemi
Sınıflama
url http://dergipark.gov.tr/auebfd/issue/40693/464262?publisher=ankara
work_keys_str_mv AT gokhanaksu verimadenciligindekullanılanogrenmeyontemlerininfarklıkosullaraltındakarsılastırılması
AT nuridogan verimadenciligindekullanılanogrenmeyontemlerininfarklıkosullaraltındakarsılastırılması
_version_ 1716774471368441856