Türkçe şarkılar için şarkı sözleri üzerinden müzik duygu sınıflandırması

Müzik insanlık tarihinde önemli bir yere sahiptir. Özellikle dijital çağda kişiler tarafından her gün yaratılan ve ulaşılan müzik koleksiyonlarının büyüklüğü ile müziğin önemi daha da artmış ve insanlar müzik içeren aktivitelere daha fazla zaman ayırmaya başlamışlardır. Bununla birlikte, müziğe bilg...

Full description

Bibliographic Details
Main Authors: Ahmet Onur Durahim, Abide Coşkun Setirek, Birgül Başarır Özel, Hanife Kebapçı
Format: Article
Language:English
Published: Pamukkale University 2018-04-01
Series:Pamukkale University Journal of Engineering Sciences
Subjects:
Online Access:http://dergipark.org.tr/pajes/issue/36922/419724?publisher=pamukkale
Description
Summary:Müzik insanlık tarihinde önemli bir yere sahiptir. Özellikle dijital çağda kişiler tarafından her gün yaratılan ve ulaşılan müzik koleksiyonlarının büyüklüğü ile müziğin önemi daha da artmış ve insanlar müzik içeren aktivitelere daha fazla zaman ayırmaya başlamışlardır. Bununla birlikte, müziğe bilgi geri getirim sürecini kolay ve etkin hale getirmek için yapılan katalog bazlı aramalar duygu tabanlı etiketlere göre aramalara dönüşmüştür. Bu araştırmada amacımız şarkı sözlerine göre bir şarkıdan algılanan duygunun otomatik olarak çıkarıldığı bir model geliştirmektir. Model metin bazlı sınıflandırma için kullanılan makina öğrenmesi algoritmaları ile oluşturulmuştur. Bu amaçla araştırmada 300 şarkı seçilmiş ve bu şarkılar kişiler tarafından hissedilen duygularına göre etiketlenmiştir. Devamında metin ön analizi ile şarkı sözleri Türkçe köklerine ayrıştırılarak Unigram, Bigram ve Trigram kelime özellikleri çıkartılmıştır. Ardından endeksleri terim sıklığı ve tf-idf değerleri olan doküman bazında terim matrisleri yaratılmıştır. Bu matris değerleri 5 farklı sınıflandırma algoritmasına girdi olarak verilerek en yüksek doğruluk sonuçları, hatırlama ve kesinlik metrikleri üzerinden araştırılmıştır. Araştırmanın sonucunda en yüksek kesinlik değeri Zemberek Uzun Kök Ayıştırma Metodu ile Unigram kelime özelliklerine göre ayrıştırılmış ve endeksi terim sıklığına göre belirlenmiş terim bazlı doküman matrisinin Katlıterim Naïve Bayes kümeleyicisinde verdiği görülmüştür. Bu kombinasyonda hatırlama metriği değeri 43.7 iken kesinlik metriği değeri 46.9’dur.
ISSN:1300-7009
2147-5881