การกำกับดูแลข้อมูลคืออะไร
การกำกับดูแลข้อมูลประกอบด้วยกระบวนการและนโยบายที่ทำให้แน่ใจว่าข้อมูลอยู่จะในสภาพที่เหมาะสมเพื่อสนับสนุนโครงการริเริ่มและการดำเนินธุรกิจ องค์กรสมัยใหม่รวบรวมข้อมูลจากแหล่งต่าง ๆ ในวงกว้างเพื่อปรับปรุงการดำเนินงานและการให้บริการ อย่างไรก็ตาม การตัดสินใจที่ขับเคลื่อนด้วยข้อมูลจะมีผลก็ต่อเมื่อข้อมูลเป็นไปตามมาตรฐานคุณภาพและความสมบูรณ์ที่กำหนดเท่านั้น
การกำกับดูแลข้อมูลจะกำหนดบทบาท ความรับผิดชอบ และมาตรฐานสำหรับการใช้ข้อมูล โดยสรุปว่าใครสามารถดำเนินการอะไรได้บ้าง ใช้ข้อมูลใดได้บ้าง และใช้วิธีการและในสถานการณ์ใด เนื่องจากมีการใช้ข้อมูลเพื่อรองรับกรณีการใช้งานปัญญาประดิษฐ์ (AI) และแมชชีนเลิร์นนิง (ML) มากขึ้น การใช้ข้อมูลทั้งหมดจึงต้องเป็นไปตามข้อกำหนดด้านกฎระเบียบและจริยธรรม การกำกับดูแลข้อมูลจะสร้างความสมดุลระหว่างความปลอดภัยของข้อมูลโดยมีวัตถุประสงค์ทางยุทธวิธีและเชิงกลยุทธ์เพื่อให้มั่นใจถึงประสิทธิภาพสูงสุด
การกำกับดูแลการวิเคราะห์คืออะไร
การกำกับดูแลการวิเคราะห์เป็นทั้งการควบคุมข้อมูลเพื่อใช้ในแอปพลิเคชันเชิงวิเคราะห์ ตลอดจนควบคุมการใช้ระบบการวิเคราะห์ ทีมกำกับดูแลการวิเคราะห์ของคุณสามารถสร้างกลไกการกำกับดูแล เช่น การกำหนดเวอร์ชันรายงานการวิเคราะห์และเอกสารประกอบได้ และเช่นเคย การติดตามข้อกำหนดด้านกฎระเบียบ สร้างนโยบายของบริษัท และกำหนดกฎควบคุมระบบที่กว้างขึ้นให้กับองค์กร
ทำไมการกำกับดูแลข้อมูลจึงมีความสำคัญ
ในอดีตมีการใช้โปรแกรมการกำกับดูแลข้อมูลเพื่อล็อกข้อมูลในไซโลเพื่อป้องกันการรั่วไหลของข้อมูลหรือการใช้ในทางที่ผิด อย่างไรก็ตาม ผลของ Data Silo ก็คือผู้ใช้ที่ถูกต้องตามกฎหมายต้องเจออุปสรรคในการเข้าถึงข้อมูลเมื่อพวกเขาต้องการ และนวัตกรรมที่ขับเคลื่อนด้วยข้อมูลก็เผชิญปัญหาโดยไม่ได้ตั้งใจ
ในการสำรวจเมื่อปี 2024 ผ่านตำแหน่ง CDO และตำแหน่งที่เทียบเท่ากับ CDO 350 ตำแหน่งของ MIT CDOIQ พบว่าหัวหน้าฝ่ายข้อมูล 45% ระบุว่าการกำกับดูแลข้อมูลเป็นลำดับความสำคัญสูงสุด ผู้นำข้อมูลเหล่านี้ต้องการสร้างกรอบการกำกับดูแลข้อมูลที่ช่วยให้พวกเขาสามารถเปิดเผยข้อมูลแก่บุคคลและแอปพลิเคชันที่เหมาะสมได้เมื่อจำเป็น และรักษาข้อมูลให้ปลอดภัยด้วยการควบคุมที่เหมาะสมไปด้วยในขณะเดียวกัน
สร้างความสมดุลในการเข้าถึงและการควบคุม
คุณมีสองวิธีที่จะทำให้การกำกับดูแลกเป็นตัวช่วยในสร้างนวัตกรรม ได้แก่ การเข้าถึงและการควบคุม กุญแจสู่ความสำเร็จคือการค้นหาสมดุลที่เหมาะสมระหว่างทั้งสองอย่าง และจุดสมดุลของแต่ละองค์กรนั้นจะแตกต่างกัน เมื่อคุณใช้การควบคุมมากเกินไป ข้อมูลจะถูกล็อกเอาไว้ในไซโลและผู้ใช้จะไม่สามารถเข้าถึงข้อมูลได้เมื่อพวกเขาต้องการ วิธีนี้จะยับยั้งความคิดสร้างสรรค์และนำไปสู่การเกิดระบบไอทีที่บกพร่องที่ทำให้ข้อมูลล้าสมัยและไม่ปลอดภัยอีกด้วย ในทางตรงกันข้าม เมื่อคุณให้สิทธิ์ในการเข้าถึงมากเกินไป ข้อมูลก็จะมีความเสี่ยงเนื่องจากไม่ได้รับการควบคุมทั่วทั้งแอปพลิเคชันและที่เก็บข้อมูล ซึ่งจะเพิ่มความเสี่ยงในการเข้าถึงโดยไม่ได้รับอนุญาต และส่งผลกระทบต่อคุณภาพของข้อมูล
กระบวนการกำกับดูแลข้อมูลจะสร้างความสมดุลระหว่างการเข้าถึงกับการควบคุม ทำให้ผู้ใช้ไว้วางใจและมั่นใจในข้อมูล โดยส่งเสริมการค้นพบ การดูแลจัดการ การป้องกัน และการแบ่งปันข้อมูลที่เหมาะสม ส่งเสริมนวัตกรรมในขณะที่ปกป้องข้อมูล
ประโยชน์ของการกำกับดูแลข้อมูลมีอะไรบ้าง
การกำกับดูแลข้อมูลจะนำเสนอกรอบงานที่มีโครงสร้างสำหรับการจัดการข้อมูลทั่วทั้งองค์กร โดยมีประโยชน์ที่สำคัญดังต่อไปนี้
ปรับปรุงคุณภาพข้อมูล
การกำกับดูแลข้อมูลจะกำหนดมาตรฐานสำหรับความถูกต้อง ความสมบูรณ์ และความสม่ำเสมอของข้อมูล คุณจะได้รับข้อมูลที่เกี่ยวข้อง เป็นปัจจุบัน และสามารถตีความได้ง่าย ซึ่งได้รับความไว้วางใจจากผู้มีส่วนได้ส่วนเสียทั้งหมด ข้อมูลคุณภาพสูงนี้สามารถช่วยลดข้อผิดพลาดและสร้างข้อมูลเชิงลึกที่แม่นยำและเป็นปัจจุบันสำหรับการตัดสินใจเชิงกลยุทธ์และการปฏิบัติงาน
รองรับวัฒนธรรมที่ขับเคลื่อนด้วยข้อมูล
กลยุทธ์การกำกับดูแลข้อมูลที่มีประสิทธิภาพจะส่งเสริมวัฒนธรรมที่ให้ความสำคัญกับข้อมูล และส่งเสริมให้พนักงานทุกคนใช้และเข้าใจข้อมูลในการทำงานของตนเอง โดยจะกระตุ้นการมีส่วนร่วมของชุมชนธุรกิจต่าง ๆ และขับเคลื่อนการบูรณาการข้อมูลในพื้นที่ธุรกิจที่เข้าร่วม การวางแนวทางระหว่างวิศวกรข้อมูลและผู้ใช้ทางธุรกิจช่วยเพิ่มความรู้ข้อมูลและความสามารถในการวิเคราะห์โดยรวมขององค์กรได้
เพิ่มประสิทธิภาพด้านการปฏิบัติงาน
การกำกับดูแลข้อมูลช่วยกำหนดรูปแบบการดำเนินงานที่เหมาะสม โดยเฉพาะในระดับของการรวมศูนย์และการกระจายศูนย์ที่จำเป็น คุณสามารถสร้างแนวทางปฏิบัติในการจัดการข้อมูลที่สอดคล้องกันเพื่อปรับปรุงการดำเนินงาน ความเป็นเจ้าของข้อมูลและสิทธิ์การเข้าถึงที่กำหนดไว้อย่างชัดเจนจะช่วยอำนวยความสะดวกในการทำงานร่วมกันระหว่างแผนกต่าง ๆ ได้ และทำให้มั่นใจได้ว่าทุกคนจะสามารถทำงานร่วมกับแหล่งที่มาของข้อมูลเดียวกันและมีความเสถียร ประสานความพยายามระหว่างทีมต่าง ๆ เพื่อลดความซ้ำซ้อน ลดค่าใช้จ่ายในการดำเนินงาน และปรับปรุงประสิทธิภาพการทำงาน
รองรับการปฏิบัติตามกฎระเบียบ
กรอบการกำกับดูแลข้อมูลจะใช้แนวทางเชิงรุกในการบริหารความเสี่ยง เพื่อให้มั่นใจว่าแนวทางปฏิบัติด้านข้อมูลสอดคล้องกับกฎหมายและข้อบังคับของอุตสาหกรรม คุณสามารถป้องกันการเข้าถึงที่ไม่ได้รับอนุญาตได้จากการใช้นโยบายที่กำหนดจากส่วนกลางสำหรับผู้ที่สามารถเข้าถึงหรือแก้ไขข้อมูล เครื่องมือการกำกับดูแลข้อมูลสนับสนุนการปฏิบัติตามกฎระเบียบด้านความเป็นส่วนตัวเพื่อปกป้องข้อมูลที่ละเอียดอ่อน
การกำกับดูแลแมชชีนเลิร์นนิง (ML) คืออะไร
การกำกับดูแล ML นำแนวปฏิบัติด้านการกำกับดูแลข้อมูลมาใช้กับ ML เช่นกัน คุณภาพของข้อมูลและการรวมข้อมูลต้องให้ข้อมูลที่จำเป็นสำหรับการเทรนโมเดลและการใช้งานการผลลัพธ์ (หนึ่งในตัวอย่างสำคัญก็คือแหล่งเก็บคุณสมบัติ) ปัญญาประดิษฐ์ (AI) ที่มีความรับผิดชอบให้ความสำคัญเป็นพิเศษกับการใช้ข้อมูลที่ละเอียดอ่อนในการสร้างโมเดล ความสามารถในการกำกับดูแล ML อื่นๆ ได้แก่ การเปิดโอกาสให้ผู้คนมีส่วนร่วมในการสร้างโมเดล การนำไปใช้จริง และการตรวจสอบ การจัดเก็บเอกสารการเทรนโมเดล การกำหนดเวอร์ชัน กรณีการใช้งานที่รองรับ และแนวทางในการใช้แบบจำลองทางจริยธรรม และการเฝ้าตรวจสอบแบบโมเดลในการผลิตเพื่อความถูกต้อง การดริฟท์ การโอเวอร์ฟิตติ้ง และอันเดอร์ฟิตติ้ง
AI ช่วยสร้าง ต้องมีความสามารถในการกำกับดูแลข้อมูลอื่นๆ เช่น คุณภาพและความสมบูรณ์ของข้อมูลเพื่อสนับสนุนการปรับตัวของโมเดลพื้นฐานสำหรับการเทรนและการอนุมาน การกำกับดูแลความเป็นพิษและความลำเอียงของ AI ช่วยสร้าง และการทำงานของโมเดลพื้นฐาน (FM): FMOP
คุณสามารถสนับสนุน AI/ML ได้ด้วยโปรแกรมการกำกับดูแลข้อมูลเดียวกัน การเตรียมข้อมูล เป็นสิ่งจำเป็นในการแปลงข้อมูลเป็นรูปแบบที่โมเดล AI/ML สามารถใช้ในการเทรนและสร้างสำหรับการฝึกอบรมและการสร้างการอนุมานได้ แต่การเตรียมข้อมูลที่มีประสิทธิภาพมากที่สุดคือการเตรียมการที่คุณไม่ต้องทำ นักวิทยาศาสตร์ข้อมูลใช้เวลามากเกินไปในการเตรียมข้อมูลสำหรับแต่ละกรณีการใช้งาน ทีมกำกับดูแลข้อมูลของคุณสามารถช่วยแก้ปัญหาหนักหนานี้ได้ นอกจากนี้ การกำกับดูแลข้อมูลสามารถคาดเดาการสร้างรแหล่งเก็บคุณสมบัติที่ต้องการเพื่อใช้ในกรณีการใช้งาน AI และ ML ได้อีกด้วย
สุดท้ายแล้ว ข้อมูลสำคัญจะต้องได้รับการปกป้องอย่างเหมาะสม เพื่อให้ทีมของคุณสามารถลดความเสี่ยงของข้อมูลที่ละเอียดอ่อนที่ใช้ในการฝึกอบรมโมเดลพื้นฐานได้
เช่นเดียวกับการวิเคราะห์ทั่วไป คุณจะต้องควบคุมการใช้งานโมเดล AI/ML ที่คุณสร้างหรือปรับแต่ง โดยทั่วไปแล้ว ควรจะดูแลการกำกับดูแลการวิเคราะห์อย่างใกล้ชิด เพราะฟังก์ชั่นนั้นจะรู้วิธีการสนับสนุนพื้นที่ธุรกิจต่างๆ
ใครเป็นผู้สร้างการกำกับดูแลข้อมูล
การสร้างกลยุทธ์การกำกับดูแลข้อมูลที่แข็งแกร่งจำเป็นต้องมีหน้าที่งานมากมาย
ผู้สนับสนุนผู้บริหาร
บุคคลเหล่านี้จะระบุและสร้างหลักการกำกับดูแลข้อมูล มาตรฐาน และนโยบายทั่วทั้งองค์กร อีกทั้งพวกเขายังเข้าใจโครงการริเริ่มทางธุรกิจมากมายตามแผนงานขององค์กร และสามารถช่วยกำหนดลำดับความสำคัญในการขับเคลื่อนกิจกรรมการกำกับดูแลข้อมูลได้อีกด้วย
ผู้ดูแลข้อมูล
บุคคลเหล่านี้มาจากธุรกิจและมีส่วนร่วมในรายละเอียดโครงการในแต่ละวัน และช่วยทำความเข้าใจปัญหาข้อมูลที่อาจก่อให้เกิดความท้าทายกับโครงการธุรกิจที่ต้องการ อีกทั้งยังใช้กระบวนการกำกับดูแลข้อมูลในโครงการของตนและรับรองว่าข้อมูลได้รับการจัดการอย่างเหมาะสม พวกเขาจะตรวจสอบการปฏิบัติตามข้อกำหนดของพนักงานและลูกค้า และดูแลปัญหาที่อาจเกิดขึ้น
เจ้าของข้อมูล
บุคคลเหล่านี้จะกำหนดนโยบายเกี่ยวกับข้อมูล รวมถึงผู้ที่สามารถเข้าถึงข้อมูลได้และภายใต้สถานการณ์ใด วิธีการตีความและใช้กฎระเบียบ และคำจำกัดความสำคัญ อีกทั้งพวกเขายังรับผิดชอบการบริหารทางเทคนิคและการควบคุมการเข้าถึงชุดข้อมูลของคุณอีกด้วย
วิศวกรข้อมูล
บุคคลเหล่านี้มาจากฝ่ายไอทีและเลือกและใช้เครื่องมือการกำกับดูแลข้อมูลที่ดีที่สุดเพื่อรักษาความปลอดภัยข้อมูล บูรณาการข้อมูลจากแหล่งต่าง ๆ จัดการคุณภาพของข้อมูล และค้นหาข้อมูลที่ถูกต้อง
รูปแบบของการกำกับดูแลข้อมูลคืออะไร
โปรแกรมการกำกับดูแลข้อมูลของคุณควรปรับสมดุลการรวมศูนย์และการกระจายศูนย์ (รวมถึงบริการตนเอง) ทั่วทั้งองค์กรของคุณ คุณจะมีระบบการปกครองแบบรวมศูนย์ แบบแบ่งศูนย์ และแบบกระจายศูนย์ และทั้งนี้ขึ้นอยู่กับความต้องการของธุรกิจเช่นเดิม คุณควรเพิ่มขีดความสามารถให้กับทีมโดเมนให้มากที่สุดเท่าที่จะเป็นไปได้ในขณะที่ยังรักษาความเชื่อมโยงกันระหว่างโดเมน (เช่น ความสามารถในการเชื่อมโยงข้อมูลเข้าด้วยกัน)
การกำกับดูแลข้อมูลแบบรวมศูนย์
องค์กรส่วนกลางจะรับผิดชอบสูงสุดเกี่ยวกับพันธกิจ นโยบาย ตัวเลือกเครื่องมือ และอื่น ๆ อย่างไรก็ตาม การดำเนินงานในแต่ละวันมักจะมีความเกี่ยวข้องกับสายงานธุรกิจ (LOB)
การกำกับดูแลข้อมูลที่เช่ือมโยงกับส่วนกลาง
การกำกับดูแลข้อมูลที่เชื่อมโยงกับส่วนกลางช่วยให้หน่วยธุรกิจแต่ละหน่วยหรือโครงการต่าง ๆ สามารถดำเนินการได้ตรงกับความต้องการของตนได้ดีที่สุด อย่างไรก็ตาม ทีมขนาดเล็กกว่าที่ทำงานแบบรวมศูนย์จะมุ่งเน้นไปที่การแก้ปัญหาที่เกิดซ้ำบ่อยครั้ง เช่น เครื่องมือคุณภาพข้อมูลทั่วทั้งองค์กร เป็นต้น
การกำกับดูแลข้อมูลแบบบริการตนเองหรือแบบกระจายศูนย์
แต่ละแผนกจะทำสิ่งที่จำเป็นสำหรับโครงการโดยเฉพาะและยังคงสอดคล้องกับนโยบายแบบรวมศูนย์ในขณะเดียวกัน แต่ละโครงการใช้เครื่องมือหรือกระบวนการใดๆ จากโครงการอื่นๆ ที่มีความเหมาะสมสำหรับการใช้งาน ในขณะที่หัวข้อต่าง ๆ เช่น ตาข่ายข้อมูล (การกระจายศูนย์) ได้รับความนิยมเพิ่มขึ้น การกำกับดูแลข้อมูลแบบบริการตนเองก็เช่นกัน
การกำกับดูแลข้อมูลเป็นไปอย่างไร
การกำกับดูแลข้อมูลต้องใช้คน กระบวนการ และโซลูชันเทคโนโลยีที่มีความสามารถหลากหลาย
ดูแลข้อมูลในระดับที่เหมาะสมเพื่อจำกัดการปรับขนาดข้อมูล
การดูแลจัดการข้อมูลตามขนาดหมายถึงการระบุและการจัดการแหล่งที่มาของข้อมูลที่มีค่าที่สุดของคุณ รวมถึงฐานข้อมูล, Data Lake และ คลังข้อมูล คุณสามารถจำกัดการแพร่กระจายและการเปลี่ยนแปลงของสินทรัพย์ข้อมูลที่สำคัญได้ นอกจากนี้ การรักษาข้อมูลยังหมายถึงการสร้างความมั่นใจว่าข้อมูลนั้นถูกต้อง ล่าสุด และปราศจากข้อมูลที่ละเอียดอ่อนเพื่อให้ผู้ใช้สามารถมีความมั่นใจในการตัดสินใจที่ขับเคลื่อนด้วยข้อมูลและแอปพลิเคชันที่ใช้ข้อมูล
ความสามารถ: การจัดการคุณภาพข้อมูล การรวมข้อมูล และการจัดการข้อมูลหลัก
ค้นพบและทำความเข้าใจข้อมูลของคุณในบริบท
การทำความเข้าใจข้อมูลของคุณในบริบทหมายความว่าผู้ใช้ทุกคนสามารถเรียนรู้และเข้าใจความหมายของข้อมูลเพื่อให้สามารถใช้งานได้อย่างมั่นใจเพื่อผลักดันมูลค่าทางธุรกิจ ด้วยแค็ตตาล็อกข้อมูลแบบรวมศูนย์ สามารถค้นหาข้อมูลได้ง่าย เข้าถึงได้ และสามารถนำข้อมูลมาใช้ในการตัดสินใจทางธุรกิจได้
ความสามารถ: การจัดทำโปรไฟล์ข้อมูล การติดตามข้อมูล และแค็ตตาล็อกข้อมูล
ปกป้องและแบ่งปันข้อมูลของคุณอย่างปลอดภัยด้วยการควบคุมและความมั่นใจ
การปกป้องข้อมูลของคุณหมายถึงการสร้างสมดุลที่เหมาะสมระหว่างความเป็นส่วนตัวของข้อมูล ความปลอดภัย และการเข้าถึง โดยจำเป็นอย่างยิ่งที่จะต้องควบคุมการเข้าถึงข้อมูลข้ามขอบเขตองค์กรโดยใช้เครื่องมือที่ใช้งานง่ายสำหรับผู้ใช้ทั้งทางธุรกิจและวิศวกรรม
ความสามารถ: วงจรการใช้งานข้อมูล การปฏิบัติตามข้อบังคับของข้อมูล และความปลอดภัยของข้อมูล
ลดความเสี่ยงทางธุรกิจและปรับปรุงการปฏิบัติตามกฎระเบียบ
การลดความเสี่ยงหมายถึงการทำความเข้าใจว่าข้อมูลนั้นถูกใช้อย่างไรและใครเป็นผู้ใช้ บริการ AWS ช่วยคุณเฝ้าระวังและตรวจสอบการเข้าถึงข้อมูล รวมถึงการเข้าถึงผ่านโมเดล ML เพื่อช่วยให้มั่นใจถึงความปลอดภัยของข้อมูลและการปฏิบัติตามกฎระเบียบ แมชชีนเลิร์นนิงยังต้องถูกตรวจสอบความโปร่งใสเพื่อให้มั่นใจว่าการใช้งานมีความรับผิดชอบและการรายงานที่ง่าย
ความสามารถ: การตรวจสอบการใช้งานข้อมูลและ ML
คุณจะทำให้ทีมกำกับดูแลข้อมูลของคุณดยอดเยี่ยมขึ้นได้อย่างไร
กุญแจสำคัญของโปรแกรมการกำกับดูแลข้อมูลที่มีประสิทธิภาพคือการสอดคล้องกับโครงการธุรกิจที่ได้รับทุนแล้ว ทำให้แน่ใจว่าทีมของคุณเข้าใจว่าโดเมน แหล่งข้อมูล และองค์ประกอบใดที่จำเป็นต่อการสนับสนุนโครงการเหล่านั้น
- สร้างโรดแมปการกำกับดูแลข้อมูลที่แสดงการสนับสนุนโครงการธุรกิจที่ต้องการ จากนั้นเริ่มต้นระบุข้อมูลที่ทับซ้อนกันระหว่างโครงการธุรกิจที่เลือก
- เลือกแอปพลิเคชันและกรณีการใช้งานระบบอัจฉริยะทางธุรกิจที่ข้อมูลต้องการเพื่อสนับสนุนและฟีด รวมถึงข้อกำหนดสำหรับความสดใหม่และความเป็นส่วนตัว
- ทำความเข้าใจว่าข้อมูลที่เหมาะสมกับวัตถุประสงค์สำหรับโครงการธุรกิจแต่ละรายการมีลักษณะอย่างไร
- รักษาและขยายโปรแกรมการกำกับดูแลข้อมูลด้วยการฝังไว้ในโมเดลการดำเนินงานขององค์กร ดังนั้นการวางแผนและการนำข้อมูลไปใช้งานจึงกลายเป็นส่วนหนึ่งตามธรรมชาติของการดำเนินงานขององค์กร
- จัดระเบียบชุมชนการวิเคราะห์เพื่อการบริการตนเองและความสม่ำเสมอ
- สนับสนุนปัญญาประดิษฐ์ (AI) และแมชชีนเลิร์นนิง (ML) ด้วยการกำกับดูแลข้อมูลและการกำกับดูแล ML ใช้โปรแกรมการกำกับดูแลข้อมูลเดียวกัน แต่ขยายไปยังรแหล่งเก็บคุณสมบัติและโมเดล ML
แนวทางปฏิบัติที่ดีที่สุดในการกำกับดูแลข้อมูลคืออะไร
กุญแจสำคัญของการกำกับดูแลข้อมูลที่มีประสิทธิภาพคือการสอดคล้องกับโครงการธุรกิจที่ได้รับทุนแล้ว ทำให้แน่ใจว่าทีมของคุณเข้าใจว่าโดเมน แหล่งข้อมูล และองค์ประกอบใดที่จำเป็นต่อการสนับสนุนโครงการเหล่านั้น
- สร้างโรดแมปการกำกับดูแลข้อมูลที่แสดงการสนับสนุนโครงการธุรกิจที่ต้องการ จากนั้นเริ่มต้นระบุข้อมูลที่ทับซ้อนกันระหว่างโครงการธุรกิจที่เลือก
- เลือกแอปพลิเคชันและกรณีการใช้งานระบบอัจฉริยะทางธุรกิจที่ข้อมูลต้องการเพื่อสนับสนุนและฟีด รวมถึงข้อกำหนดสำหรับความสดใหม่และความเป็นส่วนตัว
- ทำความเข้าใจว่าข้อมูลที่เหมาะสมกับวัตถุประสงค์สำหรับโครงการธุรกิจแต่ละรายการมีลักษณะอย่างไร
- รักษาและขยายโปรแกรมการกำกับดูแลข้อมูลด้วยการฝังการกำกับดูแลในรูปแบบการดำเนินงานขององค์กร เพื่อให้การวางแผนข้อมูลและการใช้งานกลายเป็นส่วนหนึ่งของการดำเนินงานขององค์กร
- จัดระเบียบชุมชนการวิเคราะห์เพื่อการบริการตนเองและความสม่ำเสมอ
- รองรับ ปัญญาประดิษฐ์ (AI) และแมชชีนเลิร์นนิง (ML) ด้วยข้อมูล การกำกับดูแลข้อมูลและการกำกับดูแล ML ใช้โปรแกรมการกำกับดูแลข้อมูลเดียวกัน แต่ขยายไปยังที่เก็บฟีเจอร์และโมเดล ML
การกำกับดูแลข้อมูลส่งผลต่อการวิเคราะห์ แมชชีนเลิร์นนิง และปัญญาประดิษฐ์อย่างไร
การกำกับดูแลข้อมูลมีบทบาทสำคัญในกรณีการใช้งานที่มีข้อมูลจำนวนมาก
การกำกับดูแลการวิเคราะห์
การกำกับดูแลการวิเคราะห์เป็นทั้งการควบคุมข้อมูลเพื่อใช้ในแอปพลิเคชันเชิงวิเคราะห์ ตลอดจนควบคุมการใช้ระบบการวิเคราะห์ ทีมกำกับดูแลการวิเคราะห์ของคุณสามารถสร้างกลไกการกำกับดูแล เช่น การกำหนดเวอร์ชันรายงานการวิเคราะห์และเอกสารประกอบได้ และเช่นเคย การติดตามข้อกำหนดด้านกฎระเบียบ สร้างนโยบายของบริษัท และกำหนดกฎควบคุมระบบที่กว้างขึ้นให้กับองค์กร
การกำกับดูแล AI
การกำกับดูแล AI ใช้แนวปฏิบัติเดียวกันหลายอย่างเหมือนกับการกำกับดูแลข้อมูลกับกรณีการใช้งาน AI/ ML คุณภาพข้อมูลและการผสานรวมจะต้องให้ข้อมูลที่จำเป็นสำหรับการฝึกโมเดลและ การนำไปใช้จริง (ที่เก็บฟีเจอร์เป็นส่วนสำคัญประการหนึ่งของสิ่งนี้) ปัญญาประดิษฐ์ (AI) ที่มีความรับผิดชอบให้ความสำคัญเป็นพิเศษกับการใช้ข้อมูลที่ละเอียดอ่อนในการสร้างโมเดล ความสามารถในการกำกับดูแล AI อื่น ๆ ได้แก่ การเปิดโอกาสให้ผู้คนมีส่วนร่วมในการสร้างโมเดล การนำไปใช้จริง และการตรวจสอบ การจัดเก็บเอกสารการฝึกโมเดล การกำหนดเวอร์ชัน กรณีการใช้งานที่รองรับ และแนวทางในการใช้แบบจำลองทางจริยธรรม และการเฝ้าตรวจสอบแบบโมเดลในการผลิตเพื่อความถูกต้อง การดริฟท์ การโอเวอร์ฟิตติ้ง และอันเดอร์ฟิตติ้ง
AI ช่วยสร้าง ต้องมีความสามารถในการกำกับดูแลข้อมูลอื่น ๆ เช่น คุณภาพและความสมบูรณ์ของข้อมูลเพื่อสนับสนุนการปรับตัวของโมเดลพื้นฐานสำหรับการฝึกและการอนุมาน การกำกับดูแลความเป็นพิษและความลำเอียงของ AI ช่วยสร้าง และการทำงานของโมเดลพื้นฐาน (FM): FMOps
คุณสามารถสนับสนุน AI/ML ได้ด้วยโปรแกรมการกำกับดูแลข้อมูลเดียวกัน การเตรียมข้อมูล เป็นสิ่งจำเป็นในการแปลงข้อมูลเป็นรูปแบบที่โมเดล AI/ML สามารถใช้ในการฝึกและสร้างสำหรับการฝึกอบรมและการสร้างการอนุมานได้ แต่การเตรียมข้อมูลที่มีประสิทธิภาพมากที่สุดคือการเตรียมการที่คุณไม่ต้องทำ นักวิทยาศาสตร์ข้อมูลใช้เวลามากเกินไปในการเตรียมข้อมูลสำหรับแต่ละกรณีการใช้งาน ทีมกำกับดูแลข้อมูลของคุณสามารถช่วยแก้ปัญหาหนักหนานี้ได้ นอกจากนี้ การกำกับดูแลข้อมูลยังสามารถดูแลการสร้างที่เก็บฟีเจอร์ที่มีรูปทรงสำหรับกรณีการใช้งาน AI และ ML อีกด้วย
สุดท้ายนี้ ข้อมูลที่ละเอียดอ่อนจะต้องได้รับการปกป้องอย่างเหมาะสม เพื่อให้ทีมของคุณสามารถลดความเสี่ยงในการใช้ข้อมูลที่ละเอียดอ่อนในการฝึกโมเดลพื้นฐาน
เช่นเดียวกับการวิเคราะห์ คุณจะต้องควบคุมการใช้โมเดล AI/ML ที่คุณสร้างหรือปรับแต่ง โดยทั่วไปแล้ว ควรจะดูแลการกำกับดูแลการวิเคราะห์อย่างใกล้ชิด เพราะฟังก์ชั่นนั้นจะรู้วิธีการสนับสนุนพื้นที่ธุรกิจต่างๆ
ความท้าทายหลักในการกำกับดูแลข้อมูลคืออะไร
ความท้าทายเชิงกลยุทธ์ที่พบบ่อยที่สุดสำหรับการกำกับดูแลข้อมูลคือการปรับโปรแกรมของคุณให้สอดคล้องกับโครงการธุรกิจแทนที่จะเป็นการเสนอคุณค่าของการกำกับดูแลข้อมูลโดยตรง ตัวอย่างเช่น คุณอาจพูดถึงคุณค่าของการทำให้ผู้ใช้สามารถค้นหาข้อมูลที่พวกเขากำลังค้นหาได้ง่ายขึ้น หรืออาจพูดถึงคุณค่าในการแก้ไขปัญหาด้านคุณภาพข้อมูล แต่นี่เป็นวิธีแก้ปัญหาที่ทำให้เกิดปัญหา ถ้าคุณทำเช่นนี้ คุณจะจบลงด้วยการแข่งขันสำหรับการระดมทุนและการสนับสนุนด้วยโครงการธุรกิจที่คุณควรจะสนับสนุน แทนที่จะวางตำแหน่งการกำกับดูแลข้อมูลเพื่อสนับสนุนโครงการทุรกิจ ทุกโครงการธุรกิจที่สำคัญต้องใช้ข้อมูล การกำกับดูแลข้อมูลควรตรวจสอบให้แน่ใจว่าข้อมูลอยู่ในสภาพที่ถูกต้องเพื่อสนับสนุนความสำเร็จของการริเริ่มทางธุรกิจได้ อย่ามองข้ามการรายงานและการตรวจสอบแนวทางปฏิบัติเกี่ยวกับวิธีที่การกำกับดูแลข้อมูลสนับสนุนโครงการเหล่านี้
ความท้าทายเชิงกลยุทธ์อีกประการหนึ่งคือใช้การกำกับดูแลข้อมูลอย่างแคบเกินไป คำจำกัดความที่แคบเกินไปอาจหมายถึงการปรับโปรแกรมให้สอดคล้องกับพื้นที่ธุรกิจแต่ละส่วนหรือกรณีการใช้งานโดยไม่ต้องมีมุมมองที่กว้างขึ้นในพื้นที่ธุรกิจ อีกทั้งคำจำกัดความที่แคบอาจหมายถึงการกำหนดการกำกับดูแลข้อมูลด้วยความสามารถเพียงหนึ่งหรือสองความสามารถเท่านั้น ยกตัวอย่างเช่น การมีแค็ตตาล็อกข้อมูลไม่ถือเป็นโปรแกรมการกำกับดูแลข้อมูล
AWS มีข้อเสนออะไรบ้างสำหรับการกำกับดูแลข้อมูล
ด้วยการกำกับดูแลข้อมูลแบบต้นทางถึงปลายทางบน AWS องค์กรสามารถควบคุมตำแหน่งที่ตั้งของข้อมูล ใครสามารถเข้าถึงข้อมูลได้ และสิ่งที่สามารถทำได้กับเวิร์กโฟลว์ข้อมูลทุกขั้นตอน การกำกับดูแลข้อมูลด้วย AWS ช่วยให้องค์กรสามารถทำการตัดสินใจที่ขับเคลื่อนด้วยข้อมูลได้โดยการทำให้ผู้คนและแอปพลิเคชันที่เหมาะสมสามารถค้นหา เข้าถึง และแบ่งปันข้อมูลที่ถูกต้องเมื่อพวกเขาต้องการได้อย่างปลอดภัยและปลอดภัยและมั่นคง คุณสามารถดูแลจัดการข้อมูลได้โดยการทำให้การผสานข้อมูลและควบคุมคุณภาพของข้อมูลโดยอัตโนมัติเพื่อจำกัดการแพร่กระจายของข้อมูล คุณสามารถค้นพบและทำความเข้าใจข้อมูลของคุณด้วยแค็ตตาล็อกแบบรวมศูนย์ที่ช่วยเพิ่มความสามารถในการอ่านข้อมูล คุณสามารถปกป้องข้อมูลของคุณด้วยสิทธิ์ที่แม่นยำที่ช่วยให้คุณแบ่งปันข้อมูลได้อย่างมั่นใจ
คุณสามารถลดความเสี่ยงและปรับปรุงการปฏิบัติตามกฎระเบียบได้โดยการติดตามและตรวจสอบการเข้าถึงข้อมูล
- Amazon DataZone – ปลดล็อกข้อมูลข้ามขอบเขตองค์กรด้วยการกำกับดูแลในตัว
- AWS Glue – ค้นพบ จัดเตรียม และรวมข้อมูลทั้งหมดของคุณในทุกขนาด
- AWS Lake Formation — สร้าง จัดการ และรักษาความปลอดภัยของ Data Lake ภายในไม่กี่วัน
- Amazon QuickSight รวมระบบธุรกิจอัจฉริยะที่ไฮเปอร์สเกล
- Amazon SageMaker – สร้าง ฝึก และใช้โมเดลแมชชีนเลิร์นนิงสำหรับกรณีใช้งานต่าง ๆ ด้วยโครงสร้างพื้นฐานที่มีการจัดการอย่างเต็มรูปแบบ เครื่องมือ และเวิร์กโฟลว์
- หน้าเว็บการกำกับดูแล ML
- Amazon Bedrock – สร้างและปรับขนาดแอปพลิเคชันแบบใช้ AI ช่วยสร้างด้วยโมเดลพื้นฐาน (FM)
- Amazon Macie - ค้นหาและปกป้องข้อมูลที่ละเอียดอ่อนของคุณในทุกขนาด
- จุดการเข้าถึง Amazon Simple Storage Service (Amazon S3) - จัดเก็บในรูปแบบวัตถุที่สร้างขึ้นเพื่อเรียกค้นข้อมูลที่ต้องการจากทุกที่
- AWS Data Exchange – ค้นหา สมัครใช้งาน และใช้ข้อมูลของบุคคลที่สามในระบบคลาวด์ได้อย่างง่ายดาย
- AWS Clean Rooms – สร้างพื้นที่ปลอดภัยในไม่กี่นาทีเพื่อร่วมงานกับพาร์ทเนอร์โดยไม่ต้องแบ่งปันข้อมูลดิบ
เริ่มต้นใช้งานการกำกับดูแลข้อมูลบน AWS ด้วยการสร้างบัญชีฟรีวันนี้