Veri reyonu nedir?
Veri reyonu, bir kuruluşun iş birimine özgü bilgileri içeren bir veri depolama sistemidir. Şirketin daha büyük bir depolama sisteminde sakladığı verilerin küçük ve seçilmiş bir bölümünü içerir. Şirketler, departmana özgü bilgileri daha verimli bir şekilde analiz etmek için bir veri reyonu kullanır. Önemli paydaşların hızlı bir şekilde bilinçli kararlar almak için kullanabilecekleri özet veriler sağlar.
Örneğin, bir şirket tedarikçi bilgileri, siparişler, sensör verileri, çalışan bilgileri ve mali kayıtlar gibi çeşitli kaynaklardan verileri ambarında veya veri gölünde depolayabilir. Ancak, şirket sosyal medya incelemeleri ve müşteri kayıtları gibi pazarlama departmanıyla ilgili bilgileri bir veri reyonunda depolar.
Bir veri reyonu, diğer veri depolama sistemi türleriyle nasıl karşılaştırılır?
Şirketler, veri yönetimi ve analitiği için birkaç farklı türde veri depolama sistemi kullanır. Şirketlerin veri reyonları kullandığı bağlamı anlamak için bazı yaygın veri depolama türlerine bakalım.
Veritabanı
Veri tabanı, bilgisayar sistemlerinin bilgileri depolamak, aramak, almak ve analiz etmek için kullandığı düzenli depolamadır. İlişkisel veri tabanları gibi çeşitli veri tabanı türleri vardır. İlişkisel veri tabanı, bilgileri satır ve sütunlardan oluşan tablolarda depolar. Farklı tablolardaki veriler, anahtar olarak bilinen benzersiz bir tanımlayıcıyla bağlanır. Anahtarlar, belirli sütunlarda tekrarlanmayan değerlerdir.
Veri reyonu ve veri tabanı
Bir veri reyonu, bir departmanın verileri için öne bakan öge görevi görür. Bilgileri almak ve analiz etmek için bir veri reyonu kullanabilirsiniz. o esnada, bir veri tabanı bilgileri toplar, yönetir ve depolar. Daha sonra, depolanan bilgileri işlemek, biçimlendirmek ve bir veri reyonuna aktarmak için araçları kullanabilirsiniz.
Veri ambarı
Veri ambarı, tüm işletme için bilgi depolayan kapsamlı bir veri tabanı sistemidir. Çeşitli kaynaklardan iş yazılımı ve sosyal medya akışları gibi ham bilgiler toplar ve bunları tablo biçiminde depolanan yapılandırılmış verilere işler. İşletmeler, daha akıllı kararlar almak için kurumsal veri ambarını iş zekâsı araçlarına bağlayabilir.
Veri reyonu ve veri ambarı
Bir veri reyonu, bir veri ambarının niteliklerinin çoğunu taşır. Farklı oldukları nokta, veri ambarının çeşitli konular hakkında kurumsal çapta veriler içermesidir. Veri reyonu ise belirli bir konuyla yakından ilgili bilgileri depolar. Örneğin, bir veri ambarı pazarlama, insan kaynakları, satın alma ve müşteri desteği departmanları için bilgi depolayabilir. Ancak, bir veri reyonu yalnızca tek bir departmanla ilgili işlem verilerini depolayabilir. Bir veri reyonu oluşturmayı cazip kılan unsur, veri reyonlarını yöneten departmanların verilerinin yüklenmesi ve yönetimi üzerinde tam kontrole sahip olmasıdır.
Birçok kuruluş, veri reyonlarını merkezi bir veri ambarında yayınlamak için veri paylaşımı gibi teknolojileri kullanıyor. Bunu sayede sahiplik dağıtarak ve iş yüklerini izole ederek daha çevik olabilirler. Benzer şekilde, veri paylaşımı, departman veri reyonlarının bir veri ambarından veya diğer veri reyonlarından paylaşılan verileri kullanmasına olanak tanır.
Veri gölü
Veri gölü, ham ve yapılandırılmamış bilgileri tutan veri depolamasıdır. Bilgileri dosya ve klasörlerde saklamaz. Bunun yerine, işlenmemiş bilgileri büyük depolama alanında düz bir hiyerarşide depolar. Veri gölleri metin belgeleri, görüntüler, videolar ve sesler dâhil olmak üzere farklı türlerde ham bilgileri depolar.
Veri analistleri, yapılandırılmamış verilerden tahmine dayalı analiz yapmak için veri göllerini kullanır. Örneğin, bir veri gölü, işletmelerin duygu analizi için kullanabileceği sosyal medya incelemelerinden metinleri depolayabilir. Veri analistleri, bir şirketin olumsuz görüş trendlerini tespit etmek için duygu analizini kullanabilir.
Veri reyonu ve veri gölü
Veri gölleri işlenmemiş verileri depoladığından, bazı bilgiler çoğaltılmış olabilir veya şirket için bir anlam ifade etmeyebilir. Bir veri reyonu ise belirli bir ihtiyacı karşılayan işlenmiş verileri depolar. Bir veri gölü, bir veri reyonunun kaynağı olabilir. İşletmeler, veri reyonlarındaki geçmiş verilere bakarak veri trendlerini belirler ancak depolanan bilgileri derinlemesine analiz etmek için veri göllerini kullanırlar.
OLAP
Çevrimiçi Analitik İşleme (OLAP), verileri birden çok boyutta temsil eden bir yöntemdir. Örneğin, veri analistleri, aylar, şehirler ve ürünlere göre satış gelirini eş zamanlı olarak göstermek için bir OLAP küpü kullanır. OLAP veri yapıları geniştir, gerçekler veya boyutlar olarak sınıflandırılan alanlara sahiptir ve veri çoğaltılmasına neden olur. Bu, dar yapıları ve çok az veri çoğaltmayı destekleyen geleneksel ilişkisel veri tabanlarıyla çelişir.
Veri reyonu ve OLAP küpü
OLAP, verileri geniş tablolarda denormalize eden belirli bir bilgi depolama stratejisidir. OLAP, çok boyutlu verilerin karmaşık temsillerini basitleştirir. Bazı veri reyonları, bilgilerini yapılandırmak için OLAP kullanabilir ancak diğerleri geleneksel, normalleştirilmiş yapılar kullanır. İş analistleri, bir veri reyonundaki bilgileri görselleştirmek için OLAP yapılarından yararlanır.
Operasyonel veri deposu
Operasyonel veri deposu (ODS), veri kaynakları ile veri ambarı arasında aracı görevi gören bilgi depolamasıdır. Veri analistleri, işlem verileri hakkında neredeyse gerçek zamanlı raporlama sağlamak için ODS'yi kullanır. ODS basit sorguları destekler ve yalnızca sınırlı miktarda bilgi sağlar. Örneğin, ODS, satış kayıtlarını yalnızca son 12 saat boyunca saklayabilir.
Veri reyonu ve ODS
Veri reyonu, bir veri ambarından konuya yönelik bilgiler çıkarır ancak ODS, bilgileri işlenmek üzere veri ambarına gönderir. Veri reyonları, analiz edebileceğiniz geçmiş bilgiler sunar ancak ODS mevcut işlemlerin güncellenmiş bir görünümünü sağlar. Örneğin, son çeyreğe ait satış modellerini belirlemek için bir veri reyonu kullanabilirsiniz ancak ODS'den saatlik satış rakamı güncellemeleri alabilirsiniz.
Veri reyonu neden önemlidir?
Şirketlerin bir veri reyonu kullanmasını sağlayan bazı iyi nedenler vardır.
Verileri daha verimli bir şekilde alma
Şirketler bir veri reyonu kullanarak belirli bilgilere daha verimli şekilde erişebilir. Veri ambarıyla karşılaştırıldığında veri reyonu, bir departmanın sık sık eriştiği ilgili ve ayrıntılı bilgileri içerir. Bu sayede, işletme yöneticilerinin performans raporları veya grafikler oluşturmak için tüm veri ambarında arama yapmasına gerek kalmaz.
Karar verme sürecini kolaylaştırma
Şirketler, veri reyonuna sahip veri ambarından bir veri alt kümesi oluşturabilir. Departman içindeki çalışanlar daha sonra verileri analiz edebilir ve aynı bilgi kümesine dayalı olarak kararlar alabilir.
Bilgiyi daha etkili şekilde kontrol etme
Veri reyonu, çalışanlara son derece ayrıntılı erişim ayrıcalıkları sağlar. Bu, şirketin belirli bir kişiye belirli verileri görüntüleme veya alma yetkisi verebileceği anlamına gelir. Şirketlerin veri yönetişimini iyileştirmesine ve bilgi erişim politikalarını uygulamasına yardımcı olur. Örneğin, çalışanlara veri ambarındaki belirli bilgiler için kullanıcı erişimi sağlamak üzere veri reyonlarını kullanabilirsiniz.
Verileri esnek bir şekilde yönetme
Veri reyonu daha küçüktür ve bir veri ambarından daha az tablo içerir. Bu, veri mühendislerinin bir veri reyonundaki bilgileri büyük veri tabanı değişikliklerine neden olmadan yönetebileceği ve değiştirebileceği anlamına gelir.
Veri reyonu nasıl çalışır?
Bir veri reyonu, ham bilgileri belirli bir iş departmanı için yapılandırılmış, anlamlı bir içerik hâline getirir. Bunu yapmak için veri mühendisleri bir veri ambarından veya doğrudan harici veri kaynaklarından bilgi almak amacıyla bir veri reyonu oluşturur.
Veri reyonu, bir veri ambarına bağlandığında bir iş birimi ile ilgili bir dizi bilgi alır. Genellikle bilgiler özetlenmiş veriler içerir ve gereksiz veya ayrıntılı verileri hariç tutar.
ETL
Ayıkla, dönüştür ve yükle (ETL), çeşitli veri kaynaklarından gelen bilgileri tek bir fiziksel veri tabanına entegre etmeye ve aktarmaya yönelik bir süreçtir. Veri reyonları, bir veri ambarından gelmediğinde harici kaynaklardan bilgi almak için ETL kullanır. İşlem aşağıdaki adımları içerir.
- Ayıkla: çeşitli kaynaklardan ham bilgi toplama
- Dönüştür: bilgiyi ortak bir biçime dönüştürme
- Yükle: işlenen verileri veri tabanına aktarma
ETL araçları elektronik tablolar, uygulamalar ve metin belgeleri gibi harici kaynaklardan bilgi kopyalar. Veri reyonu daha sonra bilgileri yapılandırılmış bir biçimde işler, düzenler ve depolar.
Analiz
İş analistleri, veri reyonundan verileri almak, analiz etmek ve temsil etmek için yazılım araçlarını kullanır. Örneğin, veri reyonlarında depolanan bilgileri iş zekâsı analitiği, raporlama panoları ve bulut uygulamaları için kullanırlar.
Her veri reyonu az sayıda kullanıcıya hizmet eder. Örneğin, pazarlama müdürü ve kıdemli pazarlamacılar bir veri reyonuna erişebilir, bu nedenle raporlar ve grafikler oluşturmak veya tahmine dayalı analiz yapmak daha az zaman alır.
Veri reyonu türleri nelerdir?
Bunlar farklı veri reyonu türleridir.
Bağımlı veri reyonu
Bağımlı veri reyonu, depolamasını merkezi bir veri ambarından gelen bir bilgi alt kümesiyle doldurur. Veri ambarı, veri kaynaklarından gelen tüm bilgileri toplar. Daha sonra, veri reyonu, veri ambarından konuyla ilgili bilgileri sorgular ve alır.
Artıları ve eksileri
Çoğu veri yönetimi ve yönetim çalışması veri ambarında gerçekleştirilir. Bu, iş analistlerinin veri reyonundan gelen bilgileri kullanmak için veri tabanı yönetiminde çok yetenekli olmaları gerekmediği anlamına gelir. Bağımlı veri reyonları bilgi almayı çok daha kolay hâle getirse de tek bir başarısızlık noktası sunarlar. Veri ambarı başarısız olursa tüm bağlı veri reyonları da başarısız olur.
Bağımsız veri reyonu
Bağımsız veri reyonu, merkezi bir veri ambarına veya başka herhangi bir veri reyonuna ihtiyaç duymaz. Her veri reyonu, bir veri ambarı yerine kendi kaynaklarından bilgi toplar. Bağımsız veri reyonları daha küçük şirketler için uygundur ancak yalnızca belirli departmanların bilgiye erişmesi ve analiz etmesi gerekir.
Artıları ve eksileri
Şirketler nispeten daha kolay şekilde bağımsız veri reyonları kurabilir. Ancak bu veri reyonlarını yönetmek zor olabilir. Bunun nedeni, iş analistlerinin her veri reyonunda veri tabanıyla ilgili idari çalışma yapmasının gerekli olmasıdır. Veri paylaşımı gibi stratejiler kullanarak farklı veri reyonları arasında veri paylaşmak kolaydır, departmanlar başka bir departmanın verilerini okuyabilir ve hatta kendi verileriyle güçlendirebilir. Bununla birlikte, her departmanın neye baktıklarını bilmesini sağlamak için güçlü bir veri kataloglama stratejisi uygulanmalıdır.
Hibrit veri reyonu
Hibrit veri reyonları, bir veri ambarından ve harici kaynaklardan bilgi toplar. Bu, verileri veri ambarına yönlendirmeden önce şirketlere bağımsız veri kaynaklarını test etme esnekliği sağlar.
Örneğin, yeni bir ürünü piyasaya sürdüğünüzü ve ilk satış verilerini analiz etmek istediğinizi varsayalım. Veri reyonu, doğrudan e-ticaret yazılımından gelen satış bilgilerini kullanır ve diğer ürünler için veri reyonundan satış kayıtlarını alır. Ürün, mağazanızda daimi olarak yer almaya başladıktan sonra, işlem bilgilerini veri ambarına aktarırsınız.
Bir veri reyonunun yapıları nelerdir?
Veri reyonları bu yapıları bilgileri depolamak ve temsil etmek için kullanır.
Yıldız
Yıldız yapısının merkezinde bir bilgi tablosu ve çeşitli boyut tablolarına kolları vardır. Bu, yıldız şeklinde bir bağlantı sağlar. Bilgi tablosu, analitik amaçlar için kullanabileceğiniz özetlenmiş verileri içeren bir veri tablosudur. Boyut tabloları ise bir bilgi tablosunda açıklayıcı bilgileri içerir. Her boyut tablosu, yabancı bir anahtarla bilgi tablosuna bağlanır. Yabancı anahtar, ürün kimliği veya tedarikçi kimliği gibi benzersiz bir tanımlayıcıdır.
Örneğin, satış işlemlerine yönelik bir bilgi tablosunda aşağıdaki sütunlar yer alır:
- Satış kimliği
- Ürün kimliği
- Tedarikçi kimliği
- Satış tutarı
Ürünlere yönelik bir boyut tablosu aşağıdaki bilgileri depolar:
- Ürün kimliği
- Ürün adı
- Ürün maliyeti
Tedarikçi boyut tablosunda aşağıdaki sütunlar bulunur:
- Tedarikçi kimliği
- Tedarikçi adı
- Şehir
Avantajlar
Yıldız yapısında, boyut tablosu ek tablolara genişletilmeyecek şekilde denormalize hâle getirilir. Bu, boyut tablosunun yedekli veriler içerebileceği ancak arama ve alma hızını artıracağı anlamına gelir. Ayrıca boyut tablolarını depolamak daha az yer kaplar.
İş analistleri, karmaşık sorguları basitleştirmek için yıldız şeklinde yapılandırılmış bir veri reyonu kullanabilir. Belirli bir satış kaydını aradıklarında, veri yönetim sistemi bilgi tablosunda arama yapar. Veri reyonu sistemi doğru kaydı bulduğunda, ilgili boyut tablolarındaki verileri sorgulamak için ürün kimliğini ve tedarikçi kimliğini kullanır.
Denormalize edilmiş
Denormalize edilmiş bir yapı, ilgili tüm verileri tek bir tabloda depolar. Bilgi tabloları ve boyut tabloları arasında karmaşık bağlantılara sahip değildir. Veri analistleri, sorgu hızını artırdığı için denormalize edilmiş bir veri reyonu kullanır. Örneğin, bir satış kaydı araması, aşağıdaki gibi denormalize edilmiş tek bir tabloda gerçekleşir:
- Satış kimliği
- Ürün
- Ürün adı
- Ürün maliyeti
- Model adı
- Ağırlık
- Boyut
- Tedarikçi
- Tedarikçi adı
- Şehir
- Satış tutarı
Denormalize edilmiş bir veri reyonu, tek tablo yaklaşımı nedeniyle gerçek zamanlı raporlama için uygundur. Ancak, veri reyonunun denormalize edilmesi veri yedekliliğine yol açar. Örneğin, aynı ürün adı birden çok kayıtta görünebilir. Bu, ek depolama alanı ve yüksek uygulama maliyetlerine yol açar.
Bir veri reyonunun uygulanmasındaki adımlar nelerdir?
Bulut veri mühendisleri aşağıdakileri yaparak bir veri reyonu oluştururlar:
- Bulut temelli veri platformlarını başlatma.
- Veri reyonunu iş verileriyle doldurma. Verilerin doğru biçime sahip olmasını ve işletme kullanıcılarıyla alakalı olmasını sağlarlar.
- Veri reyonunu birden fazla kullanıcının veriye erişebileceği şekilde ayarlama. Örneğin, veri reyonuna bir raporlama panosu yüklerler.
- Veri reyonu çalıştığında sorunları izlemeye, optimize etmeye ve çözmeye devam etme.
AWS'de veri reyonunu nasıl uygulayabilirsiniz?
Şirketlerin, geleneksel veri reyonu depolamasını sınıra kadar esneten, artan veri hacimlerini işlemesi gerekir. Şirket içi sunuculara yüklenen veri reyonlarının ölçeklendirilmesi zordur. Bulut mimarisi, veri reyonları için daha ucuz, daha ölçeklenebilir ve daha yönetilebilir kurumsal düzeyde entegrasyon sunar.
Amazon Redshift, bulutta veri reyonlarını uygulamak için kullanabileceğiniz bir veri ambarı çözümüdür. Operasyonel veri tabanlarınız, veri gölünüz, veri ambarınız ve binlerce üçüncü taraf veri kümeniz genelindeki karmaşık, ölçeklendirilmiş veriler üzerinde gerçek zamanlı ve tahmine dayalı analizler yürüterek entegre öngörüler elde edebilirsiniz. Kolay bir şekilde otomatik olarak makine öğrenimi modelleri oluşturabilir, eğitebilir ve dağıtabilirsiniz. Amazon Redshift'te veri reyonları oluşturabilir ve bunları daha akıllı kararlar almak için kullanabilirsiniz.
Amazon Redshift, veri reyonunuzu harika bir çözüm hâline getiren bazı temel özelliklere sahiptir:
- Amazon Redshift Serverless ile kümenin boyutu ve ölçeğiyle ilgili hususlar sizin için ele alınır.
- Yerel veri paylaşımı sayesinde veri reyonunuzdaki veriler, veri ambarınızdaki verilere erişebilir veya veri ambarınızla paylaşılabilir.
Hemen bir AWS hesabı oluşturarak veri reyonlarını kullanmaya başlayın.