Veri Madenciliği-Data Mining Nedir?

Gelişen ve sürekli bir değişime sahip olan çevre koşulları, sınırların kalkması ile küreselleşen dünya, farklı pazarlama ve ar-ge teknikleri ‘verinin’ değil ‘bilginin’ öncelikli olarak önemini her an daha da artacak biçimde ortaya çıkarmaktadır.
Teknolojinin çabucak gelişiyor olması, birçok prosedürün eletronik ortamda kayıt edilmesini, bu kayıtların saklanabilmesini ve istenildiğinde erişilebilmesini hem basitleştirdi hemde doğrusal olarak ucuza sahip olabilmemize neden oldu.

Firmalar elektronik ortamdaki verileri geleceğe dönük kararlar alırken, analiz ederken kullanmak isterler.
Peki bilgisayar ortamında yığınlar durumunda duran verileri nasıl anlamlı hale getireceğiz?
Bu problemin yanıtı karşımıza doğrudan veri madenciliğini çıkartmaktadır.

Veri Madenciliği (Data Mining) Nedir?

Veri madenciliği, yapılandırılmış veya yapılandırılmamış datayı anlayabilmek veya öngörülebilir sonuçlar elde edebilmek için geniş veri kümeleri üzerinde modeller, anomaliler ve korelasyonlar bulma prosedürüdür. Bilginin kimi teknikler ile analiz edilmesi ve çıkan sonuçların bir uzman gözüyle yorumlanmasıyla geçmiş verilerden gelecek tahminleri yapabilme prosedürüdür.

Basit bir tanım yapmak gerek görülürse veri madenciliği, geniş miktarda bilginin biriktirilerek içlerinden faydalı bilginin ayrıştırılıp,taranması sürecidir. Gelecek müşteri davranışlarının tahmin edilebilmesi ve müşteri bilgileri içerisinde modellerin tanımlanması olarak ifade edebiliriz.

Veri işlenmediği sürece değersizdir. Yığın durumundaki veriler işlenerek değerli hale getirilerek sonrasında bilgiye dönüştürülür. Temel olarak veriler niteliklerine göre daha önceden kaydedilmiş sınıflara ayrılır.
Veri madenciliği kayıt altına alınmış olan yığın durumundaki verileri anlam kazandırabilmek için gerekli prosedürlerden geçirir ve bilgiye çevirir.
Bilgiye dönüştürülen bu verileri satışa yönelik prosedürlerinizde kullanabilmeniz mümkün.

Örneğin; Süpermarketler veya büyük müşteri kitlesine hitap eden firmalar müşterilerinin bütün bilgilerini ve alışveriş prosedürlerini kayıt altında tutarlar. İşlenmediği sürece bir anlam ifade etmeyecek olan bu veriler veri madenciliği vasıtası ile, müşterilerinin satın alma eğilimlerini inceleyerek kategorize edilip, yapmak istedikleri promosyonlarla hangi müşterilerinin dikkatlerini çekebileceklerini belirleme edip, o müşterilerine daha çok satış gerçekleştirebilirler.

Veri Madenciliği İşlemleri Nelerdir?

Veri temizleme: Gürültülü ve tutarsız verileri çıkarmak.
Veri birleştirme: Birçok veri kaynağının birleştirilmesi.
Veri seçme: Yapılacak olan analiz hakkında olan verileri saptamak.
Veri Dönüşümü: Verinin veri madenciliği yöntemiyle kullanılabilecek hale dönüşümünü gerçekleştirmek.
Veri madenciliği: Veri örüntülerini yakalayabilmek için akıllı metotları uygulamak.
Örüntü değerlendirme: Bazı ölçümlere sonucu elde edilmiş bilgiyi temsil eden enteresan örüntüleri tanımlamak.
Bilgi sunumu: Madenciliği yapılarak elde edilmiş olan bilginin kullanıcıya sunumunu gerçekleştirmek.
Veri madenciliğini istatistiksel bir teknikler serisi olarak görmek mümkündür. Fakat veri madenciliği, geleneksel istatistikten birkaç biçimde farklılık göstermiştir.

Veri madenciliğinde amaç, basitçe mantıksal kurallara veya resim sunumlara çevrilebilecek nitel modellerin çıkarılmasıdır. Bu bakımdan veri madenciliği insan merkezlidir ve çoğunlukla insan-bilgisayar kullanıcı arayüzünü birleştirmektedir. Veri madenciliği sahası, istatistik, makine bilgisi, veritabanları ve yüksek performanslı prosedür gibi temelleri de içerir.

Sonuç olarak üretilen verinin hacmi gün geçtikçe daha da artmaktadır. Günümüzde dijital evrende %90 oranında yapılandırılmamış veri bulunmaktadır. Dikkat edilmesi gereken durum ise bunun daha çok veri daha çok bilgi anlamına gelmediğinin anlaşılmasıdır. Önemli olan onu işleyip yapılandırarak anlamlı bir forma dönüştürebilme prosedürünü gerçekleştirmektir.