Veri Bilimine Dair
Günümüzde veri sözcüğünü sürekli duyuyoruz. Konu hakkında yeterli bilgimiz olmasa da aslında veriyi üretende tüketende bizleriz. Veri biliminin ne kadar ciddi bir bilim olduğundan bahsetmeden önce küçük bir bilgi vermek istiyorum. 2019 yılı itibari ile internet kullanan kişiler her gün 2.5 kentilyon byte veri üretiyor. Bir yılda üretilen veriyi düşünebiliyor musunuz? O yüzden ‘Veri Her Şeydir’.
‘Verinin bir dili vardır, yeterince dikkatli dinlerseniz verinin yükselen sesini kesinlikle duyabilirsiniz.’
Kardelen
Pek çoğunuz bir sohbet ortamında bir ihtiyacınızdan bahsettikten kısa bir süre sonra sözünü ettiğimiz ürün reklamının ekranınıza düştüğünü görmüşsünüzdür ve bunun rastlantısal olabileceğini düşünmüşsünüzdür. Ya da belirli aralıklarla sosyal medyada çıkan challenge akımına katılmış olabilirsiniz. Katıldığınız bu akımlarda ve sohbet ettiğiniz ortamlarda kişisel verilerini kendi ellerinizle başka kişilere verdiğinizin farkında bile olmayabilirsiniz. Hatta kendi çevremden sıklıkla duyduğum bir cümle var ‘Amann benim fotoğraflarımla, ihtiyaçlarımla ne yapacaklar sanki?’ o zaman şöyle bir cevap veriyorum ‘Senin fotoğraflarınla makinalarını eğitiyorlar sen kendi yüz bilgilerini aslında kimliğini tanımadığın insanların kullanımına sunuyorsun, senin ihtiyaçlarından ilgi alanların hakkında fikir sahibi oluyorlar reklamlarını kişiselleştirip telefonda daha uzun süre vakit geçirmene sebep oluyorlar yani kısacası ‘Vaktini Çalıyorlar’.
Gördüğünüz gibi veri ile her şey mümkün yukarıdaki örnekler pek iç açıcı olmasa da verinin insan yararına kullanıldığı pek çok örnekte mümkün. Kısacası veriyi tanıma, veri bilimci olma yolu kısa bir yol değil ancak şunu kesinlikle söyleyebilirim çok eğlenceli bir yol.
Veri bilimci bir problem tanımından ya da yapılacak bir iş tanımı belirlendikten sonra büyük veri kümelerinde bulunan veriyi ön bir hazırlık sürecinden geçiren, veri üzerinde gerekli analizleri gerçekleştiren ve karmaşık veri sistemleri içerisinden problem tanımını anlamlandırarak bilimsel analizi gerçekleştirip herkesin anlayabileceği şekilde sunabilen kişidir.
Veri biliminin yapı taşında İstatistik ve Matematik bulunur. İyi bir veri bilimci olmak için sağlam bir istatistik bilgisine ihtiyaç vardır. Veri bilimi tanımı günümüzde yeni yeni popüler olsa da geçmişte bu işi üstlenen kişilerin yine istatistikçiler olduğunu fark edeceksiniz. Veri büyüklüğünün artması manuel ve klasik hesaplama yöntemlerini kullanılamaz kılmış ve kişileri bilgisayar programlarını kullanmaya yöneltmiştir. İstatistik, Matematik ve Bilgisayar programlarının birleşiminden oluşan yeni sisteme ise Veri Bilimi adı verilmiştir.
Veri bilimi makine öğrenmesi ile iç içe sistemler olsa da ben Veri Bilimi kategorisinde yalnızca veri nedir, veri ön işleme adımları neden gereklidir, veri görselleştirme ne işimize yarar gibi sorulara yanıt vermek daha sonra makine öğrenmesinde yalnızca kullanılan algoritmalar ve teorik konulardan bahsetmeyi tercih ettim.
Serinin diğer yazısında görüşmek dileğiyle.
Keyifli Çalışmalar Dilerim 🙂