Sağlıktan finansa, eğitimden ticarete kadar pek çok alanda “büyük veri” yaygın formda kullanılıyor. Uzmanlar, “büyük veri”nin kıymetinin ne kadar fazla bilgiye sahip olunduğu ile değil, bu datanın nasıl verimli kullanıldığı ile ilgili olduğuna dikkat çekiyor. O denli ki büyük datayı kullanan şirketler, 50 daha fazla çıkar elde ediyor, pazar çalışmalarında 41 tesirli oluyor, reklam harcamaları 37 azalıyor. Uzmanlar, dünyanın yeni ve sonsuz kaynağı olarak son yıllarda toplanan, işlenen ve ticari kıymeti olan “büyük veri”nin önümüzdeki yıllarda ehemmiyetinin artacağına dikkat çekiyor.
Üsküdar Üniversitesi Mühendislik ve Tabiat Bilimleri Fakültesi Yazılım Mühendisliği Kısım Lideri, Yapay Zeka ve Akıllı Sistemler Uygulama ve Araştırma Merkezi (YAZAMER) Müdürü Doç. Dr. Türker Tekin Ergüzel, günümüzde pek çok alanda öne çıkan büyük bilgi kavramına ait değerlendirmede bulundu.
Sonsuz ve yenilenebilir kaynak: Veri
Doç. Dr. Türker Tekin Ergüzel, büyük datanın temel olarak toplanan yapılandırılmış yahut yapılandırılmamış datanın hacimsel büyüklüğünü tabir ettiğini kaydederek “Günümüzde birçok alanda toplanan datanın çözünürlüğünün de artması ile birlikte bu dataların tahlilini yapan sistemler için büyük data sıhhat, finans, eğitim, ticaret alanlarında yaygın kullanılmaktadır. Burada temel olan aslında bilginin hacimsel büyüklüğünden değil bu bilginin tahlili sonrasında elde edilen sonuç ve stratejik karar verme öncesi sağladığı öngörü becerisidir” dedi.
Büyük bilgiyi kullanan şirketler daha fazla kazanıyor
Sağlık hizmetlerinin güzelleştirilmesinde büyük bilginin kullanılmasının büyük katkı sağladığını kaydeden Doç. Dr. Türker Tekin Ergüzel, “Veri odaklı tıp, hastalıkların erken teşhisi, tedavi sonucunun öngörülmesi ve biyo-belirteçlerin ortaya çıkarılmasına katkı sağlayacak tahlil sistemlerini kullanmaktadır. Araştırmalara nazaran büyük datayı kullanan şirketler; 50 daha fazla yarar elde etmiş, pazar çalışmalarında 41 tesirli olmuş, reklam harcamaları 37 azalmış ve toplumsal medya kullanımında 37 üzere yüksek oranlarla daha başarılı olmuşlar” diye konuştu.
Büyük bilginin üç temel özelliği var
Büyük datanın temel özelliklerini; yüksek hacim, yüksek sürat ya da fazla çeşitlilik olarak sıralayan Ergüzel, şunları söyledi:
“Bu özelliklere sahip bilginin ham yani işlenmemiş haliyle bir kıymeti yoktur. Bu datanın istatistiksel teknikleri makine öğrenmesi, derin öğrenme üzere data tahlil yolları ile manalandırılması temeldir. “Büyük veri” kavramını klasik “veri” kavramından ayıran temel özellik datanın daha süratli, daha yüksek çözünürlüklü ve daha yaygın toplanması ve sonrasında da daha süratli fizikî sistemler tarafından yeni bilgi tahlil metotları ile işlenmesi ve öngörü modellerinin ortaya çıkarılmasıdır.”
Büyük data kavramının hayatımıza 2000’li yılların başında analistlerin tanımladığı üç temel kavram ile yeni akım tanımlamalarda yaygın kullanıldığını kaydeden Doç. Dr. Türker Tekin Ergüzel, şu bilgileri verdi:
Hacim : İşletmeler; ticari süreçler, akıllı (IoT) aygıtlar, endüstriyel donanımlar, görüntüler, toplumsal medya ve daha fazlası dâhil olmak üzere çeşitli kaynaklardan bilgi toplarlar. Geçmişte, bunu depolamak bu kadar kolay değildi günümüz platformları ile büyük datanın saklanması artık daha kolay.
Hız : Objelerin interneti ve bu alanda kullanılan ve data sağlayan aygıtların yaygınlaşması ile birlikte bilgi transfer suratları da artış göstermiştir. Bu sürat, anlık bilginin işlenme hızınında artması sonucunu doğurmuştur.
Çeşitlilik: Datalar, klâsik data tabanlarındaki yapılandırılmış sayısal datalardan yapılandırılmamış metin dokümanlarına, e-postalara, görüntülere, seslere, pay senedi dataları ve finansal süreçlere kadar her cins biçimde elde edilir. Bu data çeşitliliği üstte sayılan hacim ve sürat ile birlikte değerli bilginin seçimini de beraberinde getirmektedir. Bu evrede özellik seçim ve öznitelik azaltma algoritmaları kullanılmaktadır.
Büyük bilginin değeri, verimli kullanımı ile ilgilidir
“Büyük bilginin kıymeti ne kadar fazla bilgiye sahip olunduğu ile değil, bu bilginin nasıl verimli kullanıldığı ile ilgilidir” diyen Ergüzel, “Düşük maliyet (1), süratli karar veren sistem (2), yüksek doğruluklu öngörü modelleri ve optimize edilmiş modeller ve (3) akıllı sistemler (4) ile farklı bilgi kaynaklarından toplanan datalar önişleme, öznitelik belirleme ve modelleme süreçlerini takiben oluşturulur. Büyük data tahlilinde yaygın olarak derin öğrenme algoritmaları kullanılmaktadır. Bu algoritmalar daha uygun performans için büyük dataya muhtaçlık duyarlar ve bilgi sayısı arttıkça “tecrübeli” sistemler daha yeterli sistem karşılığı üretirler” diye konuştu.
Büyük bilgi nasıl çalışır?
Doç. Dr. Türker Tekin Ergüzel, büyük data tahlilleri öncesi datanın toplandığı kaynakların standartları, çözünürlükleri üzere özellikleri ile yapılandırılmamış, yarı yapılandırılmış yahut yapılandırılmış bilgileri direktörün beş kıymetli adımı olduğunu kaydetti.
1-Büyük bilgi stratejisi belirlemek
Yüksek seviyede, büyük bilgi stratejisi, veritabanınız içinde ve dışında dataları elde etme, depolama, yönetme, paylaşma ve kullanma halinizi denetlemenize ve iyileştirmenize yardımcı olmak için tasarlanmış bir plandır. Büyük data stratejisi, bol ölçüdeki bilgi sürecinde iş başarısı için gerekli tabanı belirler. Bir strateji geliştirirken, mevcut – ve gelecekteki – iş ve teknoloji amaçlarını ve teşebbüslerini dikkate almak değerlidir. Bu, büyük datayı yalnızca uygulamaların bir yan eseri olarak değil, öbür tüm bedelli ticari varlıklar üzere ele almayı gerektirir.
2-Büyük bilginin kaynaklarını bilmek
Akış bilgileri, Objelerin İnternetinden (IoT) ve giyilebilir aygıtlar, akıllı otomobiller, tıbbi aygıtlar, endüstriyel ekipmanlar vb. üzere BT sistemlerine akan öteki bağlı aygıtlardan elde edilir. Bu büyük bilgileri elde edildikçe tahlil edebilir, hangi bilgilerin saklanıp saklanmayacağına ve hangilerinin daha fazla tahlil edilmesi gerektiğine karar verebilirsiniz.
Sosyal medya dataları Facebook, YouTube, Instagram vb. üzerindeki etkileşimlerden kaynaklanır. Bu, pazarlama, satış ve dayanak fonksiyonları için faydalı olan görseller, görüntüler, ses, metin ve ses biçiminde büyük ölçüdeki büyük bilgiyi içerir. Bu bilgiler çoklukla yapılandırılmamış yahut yarı yapılandırılmış biçimdedir, bu nedenle tüketim ve tahlil için eşsiz bir zorluk oluşturur.
Halka açık datalar, ABD hükümetinin veri.gov, CIA Dünya Gerçekleri Kitabı (CIA World Factbook) yahut Avrupa Birliği Açık Bilgi Portalı üzere büyük ölçülerde açık data kaynaklarından gelir.
Diğer büyük datalar, Data göllerinden, bulut data kaynaklarından, tedarikçilerden ve müşterilerden gelebilir.
3-Verilere erişmek, yönetmek ve depolamak
Modern bilgi süreç sistemleri, çok büyük ölçülerde ve çeşitte büyük bilgilere süratle erişmek için gereken suratı, gücü ve esnekliği sağlar. Muteber erişimin yanı sıra, şirketler ayrıyeten dataları entegre etmek, bilgi kalitesini, data idaresini ve depolamayı sağlamak ve dataları tahlil için hazırlamak gayesiyle metotlara gereksinim duyar. Birtakım datalar kuruluş içinde klasik bir data ambarında depolanabilir, fakat büyük bilgileri bulut tahlilleri, data gölleri ve Hadoop aracılığıyla depolamak ve işlemek için esnek, düşük maliyetli seçenekler de vardır.
4-Verileri tahlil etmek
Dağıtımlı hesaplama (Grid computing) yahut bellek içi tahlili üzere yüksek performanslı teknolojilerle, kuruluşlar tüm büyük bilgilerini tahliller için kullanmayı seçebilirler. Öteki bir yaklaşım, tahlil etmeden evvel hangi bilgilerin alakalı olduğunu evvelden belirlemektir. Her iki durumda da büyük data tahlili, şirketlerin bilgilerden nasıl kıymet ve öngörü kazandıklarıdır. Büyük bilgi, günümüzün yapay zekâ üzere gelişmiş tahlil teşebbüslerini giderek daha da fazla beslemektedir.
5-Veriye dayalı kararlar almak
İyi yönetilen sağlam bilgiler, emniyetli tahlillere ve sağlam kararlara yol açar. Rekabetçi kalmak için işletmelerin büyük bilginin tam bedelini anlaması ve bilgiye dayalı bir formda çalışması, içgüdülerden fazla büyük bilginin sunduğu delillere dayalı kararlar vermesi gerekir. Data odaklı olmanın yararları açıktır. Data odaklı kuruluşlar daha düzgün performans gösterir, operasyonel olarak daha öngörülebilir ve daha kârlıdır.
Büyük bilgi, geleceğin mesleklerini belirleyecek
Doç. Dr. Türker Tekin Ergüzel, dünyanın yeni ve sonsuz kaynağı olarak son yıllarda toplanan, işlenen ve ticari pahası olan “büyük veri”nin önümüzdeki yıllarda değerinin artacağını belirterek bu alanda yazılım mühendisleri, yapay zeka mühendisleri, bilgi analistleri öne çıkan meslekler olarak dikkat çekeceğini kaydetti.
Kaynak: (BHA) – Beyaz Haber Ajansı