Veri Madenciliğinin Scratch’ı Orange

Veri Madenciliğinin Scratch’ı Orange

Ağustos 22, 2018 0 Yazar: emrebalasar

Veri Madenciliği Meyveli ve Eğlenceli
Acemiler ve uzmanlar için açık kaynak makinesi öğrenme ve veri görselleştirme. Büyük bir araç kutusu ile etkileşimli veri analizi iş akışla

En sevdiğim veri madenciliği yazılımı Orange!

Veri setlerinin kolayca aktarıldığı ve eklentileriyle mükemmel bir hale gelmesi şaşırtıcı olmasının yanına ÜCRETSİZ!

Aşağıdaki aktarılmış veri setini görüyorsunuz. HDI veri seti, 66 özellik ile tanımlanan 188 ülke hakkında bilgi içerir. Veri kümesi regresyon için kullanılabilir, ancak önerilen parametrelere benzer olan ülkeleri keşfetmek için kümelenme gerçekleştireceğiz.

Sonuçlarımızı dendrogramda aldık. İlginç bir şekilde, Amerika Birleşik Devletleri Küba’ya benziyor. Bu kümeyi seçip, bu kümelenmenin en önemli özelliklerinin neler olduğunu inceleyelim. Veri örneklerinin seçilip seçilmediğini belirten bir sütun ekleyen Hiyerarşik Kümeleme Veri çıktısını kullanacağız. Ardından Box Plot’u, grubunu Seçili olarak kullanacağız ve Alaka sırasına göre Sipariş’i kontrol edeceğiz. Bu ülkeler 59 yaşında en uzun yaşam beklentisine sahip gibi görünüyor. Devam edin ve diğer kümeleri kendiniz inceleyin!

Hiyerarşik Kümeleme içinde ilginç bir küme seçin.

Ve sonuçları bir kutu çiziminde inceleyin. Seçilen küme, diğer ülkelerden yüksek yaşam beklentisiyle ön plana çıkıyor gibi görünüyor.

Tabi ki, ülkeler hakkında konuşurken, doğal olarak onları bir harita üzerinde görmek ister! O kolay. Geo eklentisini kullanacağız. İlk olarak, tüm ülke isimlerini coğrafi koordinatlara dönüştürmeliyiz. Bunu, Coğrafi kodlama ile yapacağız. Burada, Ülke sütununu enlem ve boylam olarak kodlayacağız. Daha önce olduğu gibi aynı çıkışı kullanmayı unutmayın, Veriye Veri.

Enkoder / boylam çiftlerine bölge tanımlayıcıları olan bir sütun (bizim durumumuzda) olan bir sütunu dönüştürmek için Encode kullanın.

Şimdi, bu ülkeleri Choropleth widget’iyle bir harita üzerinde gösterelim. Güzel. Bir harita üzerinde gördüğünüzde ülke verilerini keşfetmek çok kolay. HDI veya başka bir özellik tarafından da renklendirmeyi deneyebilirsiniz.

Choropleth, hangi ülkelerin seçili kümede olduğunu gösterir (kırmızı). Öznitelik olarak Seçilen’i kullandık ve Mod ile renklendirdik.

Yapılan işlemlerin son hali:

Küçük yaştaki çocukların öğreneceği harika yazılım

Bir çocuk nasıl scratch kullanarak oyun yapıyorsa Orange kullanarak da veri madenciliği yapabilir.

Bunun dışında Orange haziran ayında Girls Go Data Mining Etkinliği ile kadınlarında veri madenciliği ile uğraşabildiklerini göstermek istedi ve başarıyor.

Etkinlikten fotoğraflar

Orange womens

Orange womens

Yazılar Orange Bloğundan Türkçeye çevrilmiştir.