Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması
Bu çalışmada veri madenciliği ve makine öğrenme yaklaşımının eğitim alanında kullanılması ve bu algoritmalara dayalı olarak elde edilen sonuçların güvenirlik ve geçerlik değerlerinin ne düzeyde olduğu belirlenmeye çalışılmıştır. PISA 2015 Türkiye ortalamasına göre öğrencilerin başarılı ve başarısız...
Main Authors: | , |
---|---|
Format: | Article |
Language: | Turkish |
Published: |
Ankara University
2018-12-01
|
Series: | Ankara Üniversitesi Eğitim Bilimleri Fakültesi Dergisi |
Subjects: | |
Online Access: | http://dergipark.gov.tr/auebfd/issue/40693/464262?publisher=ankara |
id |
doaj-5e119a2cb48f4516be9695f656701d31 |
---|---|
record_format |
Article |
spelling |
doaj-5e119a2cb48f4516be9695f656701d312020-11-24T21:03:01ZturAnkara UniversityAnkara Üniversitesi Eğitim Bilimleri Fakültesi Dergisi1301-37182458-83422018-12-015137110010.30964/auebfd.46426245Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında KarşılaştırılmasıGökhan Aksu0Nuri Doğan1ADNAN MENDERES ÜNİVERSİTESİHacettepe UniversityBu çalışmada veri madenciliği ve makine öğrenme yaklaşımının eğitim alanında kullanılması ve bu algoritmalara dayalı olarak elde edilen sonuçların güvenirlik ve geçerlik değerlerinin ne düzeyde olduğu belirlenmeye çalışılmıştır. PISA 2015 Türkiye ortalamasına göre öğrencilerin başarılı ve başarısız olarak sınıflandığı çalışmada farklı öğrenme yöntemleri kullanılarak fen okuryazarlığı bakımından öğrencilerin hangi sınıfta yer alacağı tahmin edilmiş ve bu aşamada elde edilen sonuçların güvenirlik ve geçerlik ölçütleri incelenmiştir. Çalışma kapsamında ele alınan 8 farklı öğrenme yönteminden doğru sınıflama sayısı, doğru sınıflama oranı, kappa istatistiği, karekök hata ve göreceli karekök hata değerleri bakımından en iyi sonuçların Random Forest yöntemiyle elde edilirken Ridge lojistik regresyon, Lojistik model ve Hoefding tree yöntemlerinin en başarılı diğer yöntemler olduğu belirlenmiştir. Çapraz geçerleme yöntemi kullanılmadan tüm veri setinin eğitim ve test veri seti olarak ayrılması durumunda Lojistik model, Random Forest ve Ridge Regresyon yöntemlerinin farklı büyüklükteki test verilerinde en düşük hata değerlerini verirken Random Tree ve J.48 yönteminlerinin en yüksek hata değerlerine sahip olduğu belirlenmiştir. Ridge regresyon, Random forest ve Lojistik model tarafından elde edilen hata değerlerinin de farklı yüzdelikteki test verilerinde oldukça tutarlı olduğu sonucuna ulaşılmıştır. Farklı yöntemler yardımıyla elde edilen ölçme sonuçlarının veri setini test ve eğitim verisi olarak ayırmayıp aynı veri seti üzerinden hem öğrenme yöntemini eğitip hem de test ettiğimiz taktirde özellikle Random tree ve J.48 öğrenme yöntemlerinin gerçek performanslarından daha yüksek doğru sınıflama oranına sahip oldukları belirlenmiştir.http://dergipark.gov.tr/auebfd/issue/40693/464262?publisher=ankaraVeri madenciliğiWEKAÖğrenme yöntemiSınıflama |
collection |
DOAJ |
language |
Turkish |
format |
Article |
sources |
DOAJ |
author |
Gökhan Aksu Nuri Doğan |
spellingShingle |
Gökhan Aksu Nuri Doğan Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması Ankara Üniversitesi Eğitim Bilimleri Fakültesi Dergisi Veri madenciliği WEKA Öğrenme yöntemi Sınıflama |
author_facet |
Gökhan Aksu Nuri Doğan |
author_sort |
Gökhan Aksu |
title |
Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması |
title_short |
Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması |
title_full |
Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması |
title_fullStr |
Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması |
title_full_unstemmed |
Veri Madenciliğinde Kullanılan Öğrenme Yöntemlerinin Farklı Koşullar Altında Karşılaştırılması |
title_sort |
veri madenciliğinde kullanılan öğrenme yöntemlerinin farklı koşullar altında karşılaştırılması |
publisher |
Ankara University |
series |
Ankara Üniversitesi Eğitim Bilimleri Fakültesi Dergisi |
issn |
1301-3718 2458-8342 |
publishDate |
2018-12-01 |
description |
Bu çalışmada veri madenciliği ve makine öğrenme yaklaşımının eğitim
alanında kullanılması ve bu algoritmalara dayalı olarak elde edilen sonuçların
güvenirlik ve geçerlik değerlerinin ne düzeyde olduğu belirlenmeye
çalışılmıştır. PISA 2015 Türkiye ortalamasına göre öğrencilerin başarılı ve
başarısız olarak sınıflandığı çalışmada farklı öğrenme yöntemleri kullanılarak
fen okuryazarlığı bakımından öğrencilerin hangi sınıfta yer alacağı tahmin
edilmiş ve bu aşamada elde edilen sonuçların güvenirlik ve geçerlik ölçütleri
incelenmiştir. Çalışma kapsamında ele alınan 8 farklı öğrenme yönteminden doğru
sınıflama sayısı, doğru sınıflama oranı, kappa istatistiği, karekök hata ve
göreceli karekök hata değerleri bakımından en iyi sonuçların Random Forest
yöntemiyle elde edilirken Ridge lojistik regresyon, Lojistik model ve Hoefding
tree yöntemlerinin en başarılı diğer yöntemler olduğu belirlenmiştir. Çapraz
geçerleme yöntemi kullanılmadan tüm veri setinin eğitim ve test veri seti
olarak ayrılması durumunda Lojistik model, Random Forest ve Ridge Regresyon
yöntemlerinin farklı büyüklükteki test verilerinde en düşük hata değerlerini
verirken Random Tree ve J.48 yönteminlerinin en yüksek hata değerlerine sahip
olduğu belirlenmiştir. Ridge regresyon, Random forest ve Lojistik model
tarafından elde edilen hata değerlerinin de farklı yüzdelikteki test
verilerinde oldukça tutarlı olduğu sonucuna ulaşılmıştır. Farklı yöntemler
yardımıyla elde edilen ölçme sonuçlarının veri setini test ve eğitim verisi
olarak ayırmayıp aynı veri seti üzerinden hem öğrenme yöntemini eğitip hem de
test ettiğimiz taktirde özellikle Random tree ve J.48 öğrenme yöntemlerinin
gerçek performanslarından daha yüksek doğru sınıflama oranına sahip oldukları
belirlenmiştir. |
topic |
Veri madenciliği WEKA Öğrenme yöntemi Sınıflama |
url |
http://dergipark.gov.tr/auebfd/issue/40693/464262?publisher=ankara |
work_keys_str_mv |
AT gokhanaksu verimadenciligindekullanılanogrenmeyontemlerininfarklıkosullaraltındakarsılastırılması AT nuridogan verimadenciligindekullanılanogrenmeyontemlerininfarklıkosullaraltındakarsılastırılması |
_version_ |
1716774471368441856 |