Apa itu tata kelola data?

Tata kelola data mencakup proses dan kebijakan yang memastikan data berada dalam kondisi yang tepat untuk mendukung inisiatif dan operasi bisnis. Organisasi modern mengumpulkan data dari berbagai sumber dalam skala besar untuk meningkatkan operasi dan pengiriman layanan. Namun, pengambilan keputusan berbasis data hanya efektif ketika data memenuhi standar kualitas dan integritas yang diperlukan.

Tata kelola data menentukan peran, tanggung jawab, dan standar untuk penggunaan data. Hal ini menguraikan siapa yang dapat mengambil tindakan apa, atas data apa, menggunakan metode apa, dan dalam situasi apa. Dengan lebih banyak data yang digunakan untuk mendukung kasus penggunaan kecerdasan buatan (AI) dan machine learning (ML), sangat penting untuk semua penggunaan data memenuhi persyaratan peraturan dan etika. Tata kelola data menyeimbangkan keamanan data dengan tujuan taktis dan strategis untuk memastikan efektivitas maksimum.

Apa itu tata kelola analitik?

Tata kelola analitik mengatur data untuk digunakan dalam aplikasi analitik serta mengatur penggunaan sistem analitik. Tim tata kelola analitik Anda dapat menetapkan mekanisme tata kelola, seperti versioning dan dokumentasi laporan analitik. Selalu lacak persyaratan peraturan, buat kebijakan perusahaan, dan berikan pagar pembatas untuk organisasi yang lebih luas.

Mengapa tata kelola data itu penting?

Program tata kelola data secara historis telah digunakan untuk mengunci data dalam silo untuk mencegah kebocoran atau penyalahgunaan data. Namun, konsekuensi dari silo data adalah bahwa pengguna sah akan juga mengalami kesulitan untuk mendapatkan akses ke data ketika mereka membutuhkannya. Secara tidak sengaja, hal ini menyebabkan terhambatnya inovasi yang didorong data.

Dalam survei tahun 2024 terhadap 350 CDO dan peran yang setara dengan CDO, MIT CDOIQ menemukan bahwa sebesar 45% Chief Data Officer mengidentifikasi tata kelola data sebagai prioritas utama. Para pemimpin data tersebut ingin menetapkan kerangka kerja tata kelola data agar data dapat tersedia untuk personel dan aplikasi yang tepat ketika mereka membutuhkannya, sekaligus menjaga data tetap aman dan terlindungi, dengan pemberlakuan kontrol yang tepat. 

Menyeimbangkan akses dan kontrol

Anda memiliki dua pendorong yang dapat menjadikan tata kelola sebagai penggerak inovasi: akses dan kontrol. Kunci keberhasilannya adalah menemukan keseimbangan yang tepat antara keduanya—titik keseimbangan masing-masing organisasi berbeda. Ketika Anda terlalu banyak mengontrol, data akan terkunci dalam silo dan pengguna tidak dapat mengakses data saat dibutuhkan. Hal ini menghambat kreativitas dan menyebabkan terciptanya sistem IT bayangan yang menjadikan data usang serta tidak aman. Sebaliknya, ketika Anda menyediakan terlalu banyak akses, data berisiko menjadi tidak diatur di seluruh aplikasi dan penyimpanan data, sehingga meningkatkan risiko akses tidak sah dan memengaruhi kualitas data.

Proses tata kelola data menyeimbangkan akses dengan kontrol, sehingga memberi pengguna kepercayaan dan keyakinan terhadap data. Proses ini mempromosikan penemuan, kurasi, perlindungan, dan berbagi data yang tepat, yang mendorong inovasi sambil menjaga data.

Apa itu tata kelola machine learning (ML)?

Tata kelola ML menerapkan banyak praktik tata kelola data yang sama untuk ML. Kualitas data dan integrasi data perlu menyediakan data yang diperlukan untuk pelatihan model serta deployment produksi (tempat penyimpanan fitur adalah salah satu aspek penting dalam proses ini). Kecerdasan buatan (AI) yang bertanggung jawab memberikan perhatian khusus pada penggunaan data sensitif untuk pembuatan model. Kemampuan tata kelola ML tambahan mencakup memungkinkan orang-orang untuk berpartisipasi dalam pembuatan model, deployment, dan pemantauan; mendokumentasikan pelatihan model, versioning, kasus penggunaan yang didukung, serta memandu penggunaan model etis; dan memantau model dalam produksi untuk akurasi, penyimpangan, overfitting, dan underfitting.

AI Generatif memerlukan kemampuan tata kelola data tambahan, seperti kualitas dan integritas data, guna mendukung adaptasi model fondasi untuk pelatihan serta inferensi, tata kelola toksisitas dan bias AI Generatif, serta operasi model fondasi (FM): FMOps.

Anda dapat mendukung AI/ML dengan program tata kelola data yang sama. Persiapan data diperlukan untuk mengubah data menjadi bentuk yang dapat digunakan oleh model AI/ML untuk pelatihan dan inferensi produksi, tetapi persiapan data yang paling efisien adalah persiapan yang tidak harus Anda lakukan. Ilmuwan data menghabiskan terlalu banyak waktu dalam menyiapkan data untuk setiap kasus penggunaan. Tim tata kelola data Anda dapat membantu meringankan beban berat yang tidak terdiferensiasi ini. Selain itu, tata kelola data dapat mengawasi pembuatan tempat penyimpanan fitur berbentuk untuk digunakan di seluruh kasus penggunaan AI dan ML.

Terakhir, data sensitif perlu dilindungi dengan baik sehingga tim Anda dapat memitigasi risiko data sensitif yang digunakan untuk melatih model fondasi.

Sama seperti analitik pada umumnya, Anda harus mengelola penggunaan model AI/ML yang Anda buat atau sesuaikan. Idealnya, ini harus berkaitan erat dengan tata kelola analitik karena fungsi tersebut akan mengetahui cara mendukung berbagai bidang bisnis.

Apa saja keuntungan dari tata kelola data?

Tata kelola data menawarkan kerangka kerja terstruktur untuk mengelola data di seluruh organisasi. Berikut adalah beberapa keuntungan utama.

Meningkatkan kualitas data

Tata kelola data menetapkan standar untuk akurasi, kelengkapan, dan konsistensi data. Anda mendapatkan data yang relevan, terkini, mudah ditafsirkan yang dipercaya oleh semua pemangku kepentingan. Data berkualitas tinggi ini mengurangi kesalahan dan menghasilkan wawasan yang akurat serta tepat waktu untuk pengambilan keputusan strategis dan operasional.

Mendukung budaya berbasis data

Strategi tata kelola data yang efektif menumbuhkan budaya yang menghargai data, sehingga mendorong semua karyawan untuk menggunakan dan memahami data dalam pekerjaan mereka. Hal ini memotivasi partisipasi komunitas bisnis dan mendorong integrasi data di seluruh area bisnis yang berpartisipasi. Penyelarasan antara rekayasawan data dan pengguna bisnis meningkatkan literasi data organisasi secara keseluruhan dan kemampuan analitik.

Meningkatkan efisiensi operasional

Tata kelola data membantu menentukan model operasi yang tepat, terutama tingkat sentralisasi dan desentralisasi yang diperlukan. Anda dapat menetapkan praktik manajemen data yang konsisten yang menyederhanakan operasi. Kepemilikan data dan hak akses yang jelas memfasilitasi kolaborasi di seluruh departemen, sehingga memastikan semua orang bekerja dengan sumber data yang sama dan andal. Selaraskan upaya di seluruh tim untuk mengurangi duplikasi, menurunkan biaya operasional, dan meningkatkan produktivitas.

Mendukung kepatuhan terhadap peraturan

Kerangka kerja tata kelola data mengambil pendekatan proaktif untuk manajemen risiko, yang memastikan bahwa praktik data selaras dengan peraturan hukum dan industri. Anda dapat mencegah akses tidak sah dengan kebijakan yang ditentukan secara terpusat untuk siapa yang dapat mengakses atau memodifikasi data. Alat tata kelola data mendukung kepatuhan terhadap peraturan privasi untuk melindungi data sensitif.

Siapa yang membangun tata kelola data?

Membangun strategi tata kelola data yang kuat membutuhkan banyak fungsi tugas.

Sponsor eksekutif

Sponsor eksekutif mengidentifikasi dan menetapkan prinsip, standar, dan kebijakan tata kelola data di seluruh organisasi. Sponsor eksekutif memahami banyak inisiatif bisnis di roadmap perusahaan dan dapat membantu menentukan prioritas untuk mendorong aktivitas tata kelola data.

Pengelola data

Pengelola data berasal dari bisnis tersebut dan terlibat dalam detail proyek setiap harinya. Pengelola data membantu memahami masalah data yang mungkin menyebabkan tantangan dengan inisiatif bisnis tertarget. Pengelola data juga menerapkan proses tata kelola data dalam proyek dan memastikan data dikelola dengan tepat. Pengelola data memantau kepatuhan karyawan dan pelanggan serta mengekskalasi masalah jika muncul.

Pemilik data

Pemilik data membuat kebijakan tentang data, termasuk pihak yang dapat memiliki akses ke data dan keadaan yang memungkinkan data dapat diakses, cara menafsirkan serta menerapkan peraturan, dan definisi istilah kunci. Pemiliki data juga bertanggung jawab atas administrasi teknis set data dan kontrol akses Anda.

Teknisi data

Rekayasawan data berasal dari bagian IT dan memilih serta menerapkan alat tata kelola data terbaik untuk mengamankan data, mengintegrasikan data dari berbagai sumber, mengelola kualitas data, dan menemukan data yang tepat.

Apa saja gaya tata kelola data?

Program tata kelola data Anda harus menyeimbangkan sentralisasi dan desentralisasi (termasuk layanan mandiri). Di seluruh organisasi, Anda mungkin akan menemukan perpaduan antara tata kelola tersentralisasi, gabungan, dan terdesentralisasi yang, sekali lagi, bergantung pada kebutuhan bisnis. Anda harus secara maksimal memberdayakan tim domain sekaligus mempertahankan koherensi lintas domain (seperti kemampuan untuk menautkan berbagai data).  

Tata kelola data terpusat

Organisasi pusat pada akhirnya bertanggung jawab atas pernyataan misi, kebijakan, pilihan alat, dan lain-lain. Namun, tindakan harian sering kali didorong ke lini bisnis (LOB).

Tata kelola data gabungan

Tata kelola data gabungan mendukung unit atau inisiatif bisnis individu untuk beroperasi dengan cara yang paling sesuai dengan kebutuhannya. Namun, tim terpusat yang lebih kecil berfokus pada pemecahan masalah yang sering berulang, termasuk alat kualitas data di seluruh korporasi, misalnya.

Tata kelola data mandiri atau terdesentralisasi

Setiap departemen melakukan hal yang dibutuhkan untuk proyek tertentu sambil menyelaraskan dengan kebijakan terpusat. Setiap proyek menggunakan alat atau proses dari proyek lain apabila cocok untuk digunakan. Popularitas topik seperti jala data (terdesentralisasi secara mandiri) mengalami peningkatan, begitu pun dengan tata kelola data mandiri. 

Bagaimana cara kerja tata kelola data?

Tata kelola data memerlukan personel, proses, dan solusi teknologi dengan berbagai kemampuan.

cara kerja bagan tata kelola data

Kurasi data dalam skala besar untuk membatasi penyebaran data

Mengkurasi data Anda dalam skala besar berarti mengidentifikasi dan mengelola sumber data Anda yang paling berharga, termasuk basis data, danau data, dan gudang data. Anda dapat membatasi proliferasi dan transformasi aset data yang krusial. Mengkurasi data juga berarti memastikan bahwa data yang tepat merupakan data yang akurat, baru, dan bebas dari informasi sensitif sehingga pengguna dapat memiliki kepercayaan diri terkait keputusan berbasis data dan aplikasi untuk memasukkan data.

Kemampuan:  Manajemen kualitas data, integrasi data, dan manajemen data utama

Temukan dan pahami data Anda dalam konteks.

Memahami data Anda dalam konteks berarti bahwa semua pengguna dapat menemukan dan memahami makna data mereka sehingga dapat menggunakannya dengan percaya diri untuk mendorong nilai bisnis. Dengan katalog data tersentralisasi, data dapat ditemukan dengan mudah, akses dapat diminta, dan data dapat digunakan untuk membuat keputusan bisnis.

Kemampuan: pembuatan profil data, silsilah data, dan katalog data

Lindungi dan bagikan data Anda secara aman dengan kontrol serta kepercayaan diri.

Melindungi data Anda berarti dapat mencapai keseimbangan yang tepat antara privasi, keamanan, dan akses data. Mengelola akses data di seluruh batas-batas organisasi menggunakan alat yang intuitif untuk pengguna bisnis dan rekayasawan adalah hal yang sangat penting.

Kemampuan: Siklus hidup data, kepatuhan data, dan keamanan data

Mengurangi risiko bisnis dan meningkatkan kepatuhan terhadap peraturan.

Mengurangi risiko berarti memahami cara data digunakan dan pihak yang menggunakan data. Layanan AWS membantu Anda memantau dan mengaudit akses data—termasuk akses melalui model ML untuk membantu memastikan keamanan data serta kepatuhan terhadap peraturan. Machine learning juga membutuhkan transparansi audit untuk memastikan penggunaan yang bertanggung jawab dan pelaporan yang disederhanakan.

Kemampuan: audit penggunaan untuk data dan ML

 

Bagaimana cara agar tim tata kelola data menjadi lebih baik?

Kunci efektivitas program tata kelola data adalah dengan menerapkan inisiatif bisnis yang sudah didanai. Pastikan tim Anda memahami domain, sumber, dan elemen data yang diperlukan untuk mendukung inisiatif tersebut.

  • Bangun peta langkah tata kelola data yang menunjukkan dukungan terhadap inisiatif bisnis tertarget. Kemudian, mulailah mengidentifikasi tumpang tindih data di antara beberapa inisiatif bisnis yang dipilih.
  • Identifikasi aplikasi dan kasus penggunaan kecerdasan bisnis yang perlu didukung dan disediakan oleh data, termasuk kebutuhan akan kesegaran dan privasi.
  • Pahami data yang sesuai dengan tujuan untuk setiap inisiatif bisnis yang dipilih.
  • Pertahankan dan perluas program tata kelola data dengan menyematkannya dalam model operasi korporasi sehingga perencanaan dan implementasi data menjadi bagian yang alami dari operasi organisasi.
  • Atur komunitas analitik untuk layanan mandiri dan konsistensi.
  • Dukung kecerdasan buatan (AI) dan machine learning (ML) dengan tata kelola data dan tata kelola ML. Gunakan program tata kelola data yang sama, tetapi perluas ke tempat penyimpanan fitur dan model ML.

Apa saja praktik terbaik tata kelola data?

Kunci efektivitas tata kelola data adalah melampirkan ke inisiatif bisnis yang sudah didanai. Pastikan tim Anda memahami domain, sumber, dan elemen data yang diperlukan untuk mendukung inisiatif tersebut.

  • Bangun peta langkah tata kelola data yang menunjukkan dukungan terhadap inisiatif bisnis tertarget. Kemudian, mulailah mengidentifikasi tumpang tindih data di antara beberapa inisiatif bisnis yang dipilih.
  • Identifikasi aplikasi dan kasus penggunaan kecerdasan bisnis yang perlu didukung dan disediakan oleh data, termasuk kebutuhan akan kesegaran dan privasi.
  • Pahami data yang sesuai dengan tujuan untuk setiap inisiatif bisnis yang dipilih.
  • Pertahankan dan perluas tata kelola penyematan dalam model operasi korporasi sehingga perencanaan dan implementasi data menjadi bagian yang alami dari operasi organisasi.
  • Atur komunitas analitik untuk layanan mandiri dan konsistensi.
  • Mendukung kecerdasan buatan (AI) dan machine learning (ML) dengan tata kelola data dan tata kelola ML. Gunakan program tata kelola data yang sama, tetapi perluas ke penyimpanan fitur dan model ML.

Bagaimana dampak tata kelola data terhadap analitik, machine learning, dan kecerdasan buatan?

Tata kelola data memainkan peran kunci dalam kasus penggunaan data yang berat.

Tata kelola analitik

Tata kelola analitik mengatur data untuk digunakan dalam aplikasi analitik serta mengatur penggunaan sistem analitik. Tim tata kelola analitik Anda dapat menetapkan mekanisme tata kelola, seperti versioning dan dokumentasi laporan analitik. Selalu lacak persyaratan peraturan, buat kebijakan perusahaan, dan berikan pagar pembatas untuk organisasi yang lebih luas.

Tata kelola AI

Tata kelola AI menerapkan banyak praktik tata kelola data yang sama untuk kasus penggunaan AI/ML. Kualitas dan integrasi data harus menyediakan data yang diperlukan untuk pelatihan model serta deployment produksi (penyimpanan fitur adalah salah satu aspek penting dalam proses ini). Kecerdasan buatan (AI) yang bertanggung jawab memberikan perhatian khusus dalam penggunaan data sensitif untuk pembuatan model. Kemampuan tata kelola AI tambahan mencakup memungkinkan orang-orang berpartisipasi dalam pembuatan model, deployment, dan pemantauan; mendokumentasikan pelatihan model, penentuan versi, dan kasus penggunaan yang didukung, serta memandu penggunaan model etis; dan memantau model dalam produksi untuk akurasi, penyimpangan, overfitting, dan underfitting.

AI Generatif memerlukan kemampuan tata kelola data tambahan, seperti kualitas dan integritas data, agar dapat mendukung adaptasi model fondasi untuk pelatihan serta inferensi, tata kelola toksisitas dan bias AI Generatif, serta operasi model fondasi (FM): FMOps.

Anda dapat mendukung AI/ML dengan program tata kelola data yang sama. Persiapan data diperlukan untuk mentransformasikan data menjadi bentuk yang dapat digunakan oleh model AI/ML untuk pelatihan dan inferensi produksi, tetapi persiapan data yang paling efisien adalah persiapan yang tidak harus Anda lakukan. Ilmuwan data menghabiskan terlalu banyak waktu dalam menyiapkan data untuk setiap kasus penggunaan. Tim tata kelola data Anda dapat membantu meringankan beban berat yang tidak terdiferensiasi ini. Selain itu, tata kelola data dapat mengawasi pembuatan penyimpanan fitur berbentuk untuk kasus penggunaan AI dan ML.

Terakhir, data sensitif harus dilindungi dengan baik sehingga tim Anda dapat memitigasi risiko penggunaan data sensitif untuk melatih model fondasi.

Sama seperti analitik, Anda harus mengelola penggunaan model AI/ML yang Anda buat atau sesuaikan. Idealnya, ini harus berkaitan erat dengan tata kelola analitik karena fungsi tersebut akan mengetahui cara mendukung berbagai bidang bisnis.

Apa saja tantangan utama tata kelola data?

Tantangan strategis yang paling umum untuk tata kelola data adalah penyelarasan program Anda dengan inisiatif bisnis, alih-alih pengusulan nilai tata kelola data secara langsung. Misalnya, Anda mungkin mengusulkan nilai yang akan memudahkan pengguna akhir menemukan data yang mereka cari, atau Anda mungkin mengusulkan nilai yang akan menyelesaikan berbagai masalah tentang kualitas data. Namun, ini merupakan solusi untuk masalah yang belum tentu ada. Jika melakukannya dengan cara ini, Anda akan bersaing dalam hal pendanaan dan sponsor dengan para inisiatif bisnis yang seharusnya Anda dukung. Sebagai gantinya, gunakan tata kelola data untuk mendukung inisiatif bisnis. Setiap inisiatif bisnis utama membutuhkan data. Tata kelola data harus memastikan bahwa data berada dalam kondisi yang benar untuk mendukung keberhasilan inisiatif bisnis. Jangan mengabaikan praktik pelaporan dan audit tentang cara tata kelola data mendukung inisiatif ini.

Tantangan strategis umum lainnya adalah menghindari penerapan tata kelola data terlalu sempit. Definisi yang terlalu sempit dapat berarti menyelaraskan program dengan area bisnis individu atau kasus penggunaan tanpa mengambil pandangan yang lebih luas di seluruh area bisnis. Definisi yang sempit juga bisa berarti mendefinisikan tata kelola data hanya dengan satu atau dua kemampuan. Misalnya, memiliki katalog data bukan merupakan program tata kelola data.

Apa saja penawaran AWS untuk tata kelola data?

Dengan tata kelola data ujung ke ujung di AWS, organisasi memiliki kendali atas penempatan data mereka, orang yang mendapatkan akses ke data, dan hal-hal yang dapat dilakukan dengan data pada setiap langkah alur kerja data. Tata kelola data dengan AWS membantu organisasi mempercepat pengambilan keputusan berbasis data dengan memudahkan personel dan aplikasi yang tepat untuk menemukan, mengakses, serta berbagi data yang diperlukan dengan aman serta terjamin. Anda dapat mengkurasi data dengan mengotomatiskan integrasi data dan kualitas data untuk membatasi proliferasi data. Anda dapat menemukan dan memahami data menggunakan katalog tersentralisasi yang meningkatkan literasi data. Anda dapat melindungi data dengan izin yang tepat, yang dapat memungkinkan Anda berbagi data tanpa ragu. 

Anda dapat mengurangi risiko dan meningkatkan kepatuhan terhadap peraturan dengan memantau dan mengaudit akses data.

Mulai Tata Kelola Data di AWS dengan membuat akun gratis sekarang juga .

Langkah selanjutnya di AWS

Lihat sumber daya terkait produk tambahan
Pelajari selengkapnya tentang Layanan Analitik AWS 
Daftar untuk akun gratis

Dapatkan akses secara instan ke AWS Tingkat Gratis.

Daftar 
Mulai membangun di konsol

Mulai membangun di konsol manajemen AWS.

Masuk