Adım Adım Büyük Veri Gelişimi
Günümüz dünyasında birçok teknoloji trendi söz konusudur. Yapay zeka, akıllı evler, otonom sürüşlü arabalar ve daha pek çoğu… Peki bu gibi yeni teknolojilerin hayatımızda yer alabilmeleri için en fazla ihtiyaçları olan şey nedir? Tabii ki de veri!
Cihazların insanlarla insanların cihazlarla iç içe geçtiği bir dönemde yaşıyoruz. Kullandığımız tüm uygulamalardan, aldığımız her üründen hatta söylediğimiz her bir kelimeden birçok veri elde ediliyor. Bu verilerle ne yapılıyor diye sorarsanız robotlar, VR- AR gözlükleri, akıllı şehirler ve daha birçok teknolojik aygıt. Ardından yapılan çalışmalarla da birçok veri elde ediliyor. Bununla birlikte gün geçtikçe veri havuzu genişlemeye başladı. Yaklaşık olarak 2013 yıllarının başlarında Endüstri 4.0 ile birlikte hayatımıza BİG DATA (Büyük Veri) dediğimiz bir kavram girdi ve yerleşti. Büyük veri; toplumsal medya paylaşımları, ağ günlükleri, bloglar, fotoğraf, video, log dosyaları gibi değişik kaynaklardan toparlanan tüm verinin, anlamlı ve işlenebilir biçime dönüştürülmüş biçimine denir. Şimdi birlikte büyük verinin dününden bugününden ve yarınından bahsedelim.
Büyük verinin kullanımı zordur. Çünkü düzensiz birçok veri bir arada bulunur ve bunların yararlı hale getirilmesi için işlenmesi gerekir. Fakat o kadar fazla akış vardır ki… Sosyal medyadan, uçan uçaktan, otonom sürüş halinde olan araçtan ve daha birçok yerden aynı anda ve hızlı bir şekilde veri gelmektedir. Bunun faydalı olabilmesi için ilk olarak yeni depolama sistemleri ve kategorilere ayırarak depolama yani temiz bilgi şeklinde depolama geliştirildi. 2015 yılından itibaren geliştirilmeye başlanan bulut verileri önümüzdeki 5 senede 3 kat daha hızlı büyüyeceği aynı zaman da gerçekliği arttırılmış uygulamaların da iş hayatımız da 2.5 kat daha fazla yer kaplayacağı düşünülmektedir.
2016 yıllarının başlarında ise elde edilen verilerin daha düzenli olarak depolanması ve yönetiminin daha kolay olması için Hodoop ve NoSql dediğimiz veri yönetimi programları geliştirildi. SQL programının tarihi eskilere dayansa da şu anki güncellenmiş hali şirketlerde verilerin analizinde en çok kullanan programdır. Artık birçok aygıtın İnternetli olmasıyla birlikte veri akışının daha hızlı olduğunun belirtmiştik. 2016 yılında bu hız daha da artarak neredeyse gerçek zaman dediğimiz verinin anında analiz edilip depolara aktarılmasını sağlamıştır.
Büyük verinin en çok kullanıldığı alan ise Makine Öğrenmesi. Peki makine öğrenmesi nedir? Makine öğrenmesi matematiksel ve istatistiksel yöntemler kullanarak mevcut verilerden çıkarımlar yapan, bu çıkarımlarla bilinmeyene dair tahminlerde bulunan yöntem paradigmasıdır. Makine öğrenmesine güncel hayatımızdan bazı örnekler: Yüz tanıma, belge sınıflandırma, spam tespiti. 2016 yılında makine öğrenmesinin büyüme oranının %65’ten daha fazla olduğu tahmin ediliyor. Makine öğrenmesinin bu kadar hızlı büyümesi gelecek senelerde yapılacak olan nesnelerin İnterneti ve yapay zeka çalışmalarını daha da kolaylaştıracaktır. 2017 yılında büyük veri kaynakları yapılandırılmış ve yapılandırılmamış veri kaynakları diye ikiye ayrıldı. Yapılandırılmamış kaynaklar bloglar, sosyal medya, video ve online olarak elde edilen verileri kapsamaktadır. Yapılandırılmış veriler ise finans, satış bilgileri, şirket kaynakları ve sensörlerden elde edilen bilgiler gibi şeyleri kapsamaktadır.
Gelecekte büyük veri nerede olacak ve onunla birlikte dünyamızda neler değişecek?
Veriler, günümüzde de olduğu gibi gelecekte de önemli bir yere sahip olacak. Ne kadar bilgi fazla olsa da şirketler dışarıdan katma değerli veri satın almaya başlayacak. Günümüzde bu oran %70 iken 2019 yılında bu oran %100 olacaktır. İnsanların yarıdan fazlası herhangi bir konuda sipariş vereceğinde ya da şikayet edeceğinde direkt olarak bilgisayar servis sistemlerine yönlendirilecekler. Şuanda da birçok şirket pazarlama departmanında chatbot kullanarak o alanda çalışan çalışanlarının iş yükünü azaltarak farklı alanlara odaklanmalarına olanak sağlamıştır.
2021 yılında tahmin edici analiz dediğimiz olay daha çok gelişmiş olacak. Şirketler aylık raporlarına ya da senelik raporlarına bakarak yeni dönemlerini planlıyorlardı. Fakat bu durum az bilgiyle ya da düzenlenmemiş bilgiyle kısıtlı ölçülerde bir planlama, tahmin etme oluyordu. Fakat büyük veri ile bu olay daha da basitleşecek.
En son ve en önemli gelişmelerden biri Derin Öğrenme kullanımı 2023 yılında en üst seviyelere çıkacak. Derin öğrenme bir veya daha fazla gizli katman içeren yapay sinir ağları ve benzeri makine öğrenme algoritmalarını kapsayan çalışma alanıdır. Yararlı bilgiyi verilerden soyutlamak için kullanılır. Görüntü, ses, metin gibi verilere anlam kazandıran sunum ve soyutlama seviyelerini öğrenmek için çok katmanlı sinir ağlarını kullanır.
Her ne kadar geleneksel sistemlerle büyük veri kullanmaya başlamış olsak da asıl büyümeyi yakalayabilmiş değiliz. Gelecek 10 yıl içerisinde asıl devrimi yaşayabileceğiz. İnternet’e bağlanabilen nesnelerin kullanımının artmasıyla birlikte anında nerede sorun olduğu bildirilecek, büyük miktarda veriler de ortaya çıkacaktır. Bundan dolayı elimizdeki veri miktarında gelecek yıllarda büyük bir sıçrama bekleniyor. Bakalım büyük veri hayatımızın hangi alanlarına daha yavaşa yavaş girecek!