Neden Athena?
Amazon Athena, petabaytlarca veriyi bulunduğu yerde analiz etmenizi sağlayan açık kaynaklı çerçeveler üzerine kurulmuş sunucusuz, etkileşimli bir analitik hizmetidir. Athena ile birlikte SQL veya Apache Spark kullanabilir ve bir altyapı kurmaya veya yönetmeye ihtiyaç duymazsınız. Fiyatlandırma basittir: İşlenen verilere veya yapılan hesaplamalara göre ödeme yaparsınız.
Başlamak için sorgu altyapınızı, yürütmenizin sonuçlarını tutmak üzere Amazon Basit Depolama Hizmeti’ndeki (S3) çalışma dizininizi, AWS Kimlik ve Erişim Yönetimi (IAM) rollerini (gerekirse) ve kaynak etiketlerinizi belirtmenize olanak sağlayan bir çalışma grubu oluşturursunuz. Kullanıcıları, ekipleri, uygulamaları veya iş yüklerini ayırmak için çalışma gruplarını kullanabilir, her sorgunun veya tüm çalışma grubunun işleyebileceği veri miktarına ilişkin sınırlar belirleyebilir ve maliyetleri takip edebilirsiniz. Oluşturduğunuz çalışma grubuna bağlı olarak (a) SQL sorguları çalıştırabilir ve taranan bayta veya yapılan hesaplamalar temelinde ücretlendirilir veya (b) Apache Spark Python kodunu çalıştırabilir ve kodunuzu yürüttüğünüz süreye göre saatlik ücretlendirilirsiniz.
AWS fiyatlandırma hesaplama aracı
Amazon Athena ve mimari maliyetinizi tek bir tahminle hesaplayın.
SQL sorguları
Tahsis Edilmiş Kapasite ile SQL sorguları
Apache Spark
Ek maliyetler
Athena, verileri doğrudan Amazon S3’ten sorgular. Athena ile verilerinizi sorgulamak için ek depolama ücreti alınmaz. Depolama, istekler ve veri aktarımı için standart S3 fiyatlarına göre ücretlendirilirsiniz. Varsayılan olarak, sorgu sonuçları seçtiğiniz bir S3 klasöründe saklanır ve standart S3 fiyatlarına göre faturalandırılır.
- S3 tarafından, iş yükleriniz verileri okur, depolar ve aktarırken faturalandırılırsınız. Bu, başarılı ve başarısız sorguları içerir. Varsayılan olarak, SQL sorgu sonuçları ve Spark hesaplama sonuçları seçtiğiniz bir S3 bucket’inde saklanır ve standart S3 fiyatlarına göre faturalandırılır. Daha fazla bilgi edinmek için Amazon S3 Fiyatlandırması sayfasına bakın.
- AWS Glue Veri Kataloğu ile Athena’yı birlikte kullanırsanız standart Veri Kataloğu ücretlerini ödersiniz. Ayrıntılar için AWS Glue Fiyatlandırma sayfasını ziyaret edin.
- Federe veri kaynaklarına ilişkin SQL sorguları (S3'te depolanmayan veriler) Athena birleştirilmiş veri kaynakları tarafından taranan terabayt (TB) başına faturalandırılır ve Tahsis Edilmiş Kapasite kullanılmadığı sürece sorgu başına en az 10 megabayt olacak şekilde en yakın megabayta yuvarlanır. Bu tür sorgular, hesabınızdaki AWS Lambda işlevlerini de çalıştırır ve Lambda kullanımı için standart ücretlerden ödeme yaparsınız. Birleştirilmiş sorgular tarafından çalıştırılan Lambda işlevleri, Lambda’nın ücretsiz kullanımına tabiidir. Ayrıntılar için Lambda fiyatlandırma sayfasını ziyaret edin.
Fiyatlandırma örnekleri
Örnek 1 – SQL sorgusu
4 eşit boyutlu sütuna sahip bir tablonun Amazon S3'te toplam 3 TB boyutunda sıkıştırılmamış bir metin dosyası olarak depolandığını düşünelim. Metin biçimindeki dosyalar ayrılamadığından tablonun tek bir sütunundan veri almak için sorgu çalıştırılması durumunda Amazon Athena’nın dosyanın tamamını taraması gerekir.
- Bu sorgunun maliyeti: 15 USD. (Taranan 3 TB için fiyat, 3 * 5 USD/TB = 15 USD.)
Dosyanızı GZIP kullanarak sıkıştırırsanız sıkıştırmadan 3:1 oranında kazanç elde edebilirsiniz. Bu durumda, sıkıştırılmış dosyanın boyutu 1 terabayt olacaktır. Bu dosya üzerinde aynı sorgunun maliyeti 5 USD’dir. Athena tüm dosyayı tekrar taramak zorundadır. Ancak boyutu üç kat daha küçük olduğundan daha önce yaptığınız ödemenin üçte birini ödersiniz. Dosyanızı sıkıştırır ve 3:1 sıkıştırma elde ederek Apache Parquet gibi bir sütunlu biçime dönüştürürseniz S3 üzerinde yine de 1 TB veri elde edersiniz. Ancak bu durumda, Parquet sütunlu olduğundan Athena yalnızca çalıştırılan sorguyla ilgili sütunu okuyabilir. Söz konusu sorgu yalnızca tek bir sütunla ilgili olduğundan Athena, yalnızca bu sütunu okur ve dosyanın dörtte üçünü okumayabilir. Athena, dosyanın sadece dörtte birini okuduğundan S3’ten yalnızca 0,25 TB veri tarar.
- Bu sorgunun maliyeti: 1,25 USD. Sıkıştırmadan 3 kat ve yalnızca bir sütunu okumak için de 4 kat tasarruf sağlanır.
(Dosya boyutu = 3 TB/3 = 1 TB. Tek bir sütun okunurken taranan veriler = 1 TB/4 = 0,25 TB. 0,25 TB için fiyat = 0,25 * 5 USD/TB = 1,25 USD)
Örnek 2 — Tahsis Edilmiş Kapasite ile SQL sorguları
Ekibinizin mesai saatleri içinde sorgu gönderen ve sorgularının tahmin edilebilir bir sürede tamamlanmasını bekleyen kullanıcılara self servis analiz sağlayan bir web uygulamasını desteklediğini varsayalım. Geçen hafta, uygulama kullanıcıları 500 TB veri tarayan toplam 10.000 sorgu gönderdi. Kullanıcı sayısı arttıkça tutarlı bir kullanıcı deneyimi sağlamanıza yardımcı olması için Tahsis Edilmiş Kapasiteyi kullanmak istiyorsunuz. Sorgularınızın analizinden, 96 DPU'nun mevcut iş yükünüz için yeterli olduğunu belirlediniz.
- Bir iş günü için, Tahsis Edilmiş Kapasite ile bu iş yükünü destekleme maliyeti 96 DPU * DPU Saati başına 0,30 USD * günde 12 saat = 345,60 USD olarak hesaplanır.
Bir sabah, yeni bir uygulama kullanıcı grubunun işe alım işlemini tamamladığını öğrendiniz ve bunun sonucunda o günkü sorgu hacminin önceki günden 2 kat daha yüksek olmasını bekliyorsunuz. Kullanıcıların dünküne benzer bir performansa sahip olmasını sağlamak istiyorsunuz ancak tüm kullanıcıların aynı anda sorgu göndermesini beklemiyorsunuz. İki saat geçtikten sonra kapasiteyi %50 artırarak 144 DPU'ya yükselttiniz.
- Bugünün iş yükünün maliyeti, 2 saat boyunca 96 DPU artı 10 saat boyunca 144 DPU veya 96 DPU * DPU Saati başına 0,30 USD * 2 saat + 144 DPU * DPU Saat başına 0,30 USD * 10 saat = 489,60 USD.
Örnek 3 - Apache Spark uygulaması
Bir önceki çeyreğe ait satış rakamlarını almak ve bir rapor oluşturmak üzere bunları grafik haline getirmek için Athena konsolunda bir not defteri kullanmayı düşünün. Not defteri kullanarak bir oturum başlatırsınız. Oturumunuz 1 saat sürer ve oturumun bir parçası olarak 6 hesaplama gönderir. Her hesaplama, çalışmak için 20 1-DPU çalışan düğümü gerektirir ve 1 dakika sürer.
- Çalışan DPU saati = Hesaplama sayısı * hesaplama başına kullanılan DPU * hesaplamanın yürütme süresi = 6 hesaplama * hesaplama başına 20 DPU * hesaplama başına (1/60) saat = 2,0 DPU saati
- Sürücü DPU saati = oturum başına kullanılan DPU * oturum süresi = oturum başına 1 DPU * oturum başına 1 saat = 1,0 DPU saati
- Toplam DPU saati = Çalışan DPU saati + Sürücü DPU saati = 2,0 DPU saati + 1,0 DPU saati = 3,0 DPU saati
- Spark uygulama ücretleri = DPU saati başına 0,35 USD * 3,0 DPU saati = 1,05 USD
Not: S3, verilerinizi ve yürütmenizin sonuçlarını depolamak ve okumak için sizden ayrı olarak ücret alacaktır.
Ek fiyatlandırma kaynakları
Aylık AWS maliyetlerinizi kolayca hesaplayın
Kişiselleştirilmiş bir fiyat teklifi almak için AWS uzmanlarıyla iletişime geçin
Amazon Athena’yı nasıl kullanmaya başlayacağınızı öğrenin.
AWS Yönetim Konsolu’nda Amazon Athena ile oluşturmaya başlayın.