Weka - Verileri Ön İşleme Rehberi

Sahadan toplanan veriler, yanlış analize neden olan birçok istenmeyen şeyi içerir. Örneğin, veriler boş alanlar içerebilir, mevcut çözümlemeyle ilgisi olmayan sütunlar içerebilir, vb. Bu nedenle, aradığınız analiz türünün gereksinimlerini karşılamak için verilerin önceden işlenmesi gerekir. Bu, ön işleme modülünde yapılır.

Ön işlemedeki mevcut özellikleri göstermek için, kurulumda sağlanan Hava Durumu veritabanını kullanacağız.

Preprocess etiketi altındaki Dosyayı aç ... seçeneğini kullanarak, weather-nominal.arff dosyasını seçin.



Dosyayı açtığınızda, ekranınız burada gösterildiği gibi görünür -


Bu ekran bize yüklenen veriler hakkında, bu bölümde daha ayrıntılı olarak tartışılan birkaç şey anlatır.

Verileri Anlamak
Önce vurgulanan Akım ilişkisi alt penceresine bakalım. Şu anda yüklü olan veritabanının adını gösterir. Bu alt pencereden iki nokta çıkarabilirsin -

14 örnek vardır - tablodaki satır sayısı.

Tablo 5 öznitelik içerir - sonraki bölümlerde tartışılan alanlar.

Sol tarafta, veritabanındaki çeşitli alanları görüntüleyen Nitelikler alt penceresine dikkat edin.



Hava durumu veritabanı beş alan içerir - görünüm, sıcaklık, nem, rüzgarlı ve oyun. Bu listeden üzerine tıklayarak bir öznitelik seçtiğinizde, özniteliğin kendisiyle ilgili daha fazla ayrıntı sağ tarafta görüntülenir.

Önce sıcaklık özelliğini seçelim. Üzerine tıkladığınızda, aşağıdaki ekranı göreceksiniz -



Selected Attribute alt penceresinde, aşağıdakileri gözlemleyebilirsiniz -

  • Özniteliğin adı ve türü görüntülenir.
  • Sıcaklık özelliğinin türü Nominal'dir.
  • Eksik değerlerin sayısı sıfırdır.
  • Benzersiz bir değeri olmayan üç farklı değer vardır.
  • Bu bilginin altındaki tablo, bu alan için sıcak, ılık ve soğuk olarak nominal değerleri gösterir.
  • Ayrıca her bir nominal değer için bir yüzde cinsinden sayımı ve ağırlığı gösterir.
  • Pencerenin altında, sınıf değerlerinin görsel temsilini görürsünüz.

Tümünü Görselleştir düğmesini tıklarsanız, burada gösterildiği gibi tüm özellikleri tek bir pencerede görebileceksiniz -



Öznitelikleri Kaldırma

Çoğu zaman, model oluşturmak için kullanmak istediğiniz veriler birçok alakasız alanla birlikte gelir. Örneğin, müşteri veri tabanı, kredi notunun analiz edilmesiyle ilgili cep telefonu numarasını içerebilir.


Öznitelikleri kaldırmak için bunları seçin ve alttaki Kaldır düğmesine tıklayın.

Seçilen öznitelikler veritabanından kaldırılacaktır. Verileri tamamen ön işlemeden geçirdikten sonra, model oluşturma için kaydedebilirsiniz.

Ardından, bu verilere filtreler uygulayarak verileri önceden işlemeyi öğreneceksiniz.


Filtreleri Uygulama

İlişkilendirme kuralı madenciliği gibi makine öğrenimi tekniklerinden bazıları kategorik veriler gerektirir. Filtrelerin kullanımını göstermek için, sıcaklık ve nem olmak üzere iki sayısal özellik içeren weather-numeric.arff veritabanını kullanacağız.

Ham verilerimize bir filtre uygulayarak bunları nominal hale getireceğiz. Filtre alt penceresindeki Seç düğmesine tıklayın ve aşağıdaki filtreyi seçin -

weka→filters→supervised→attribute→AttributeSelecti on



Uygula düğmesine tıklayın ve sıcaklık ve / veya nem özelliğini inceleyin. Bunların sayısaldan nominal türlere değiştiğini fark edeceksiniz.


Şimdi başka bir filtreye bakalım. Oyuna karar vermek için en iyi özellikleri seçmek istediğinizi varsayalım. Aşağıdaki filtreyi seçin ve uygulayın -

weka→filters→supervised→attribute→AttributeSelecti on

Veritabanından sıcaklık ve nem özelliklerini kaldırdığını fark edeceksiniz.



Verilerinizin ön işlemesinden memnun olduğunuzda, verileri Kaydet ... düğmesine tıklayarak kaydedin. Kaydedilen bu dosyayı model oluşturmak için kullanacaksınız.

Bir sonraki bölümde, önceden tanımlanmış birkaç makine öğrenimi algoritması kullanarak model oluşturmayı keşfedeceğiz.