MLOps là gì?

Các hoạt động máy học (MLOps) là một tập hợp các phương pháp tự động hóa và đơn giản hóa quy trình làm việc cũng như triển khai máy học (ML). Máy học và trí tuệ nhân tạo (AI) là những tính năng cốt lõi mà bạn có thể triển khai để giải quyết các vấn đề phức tạp trong thực tế và mang lại giá trị cho khách hàng. MLOps là một văn hóa và phương pháp ML có vai trò hợp nhất việc phát triển ứng dụng ML (Dev) với triển khai và vận hành hệ thống ML (Op). Tổ chức của bạn có thể sử dụng MLOps để tự động hóa và chuẩn hóa các quy trình trong suốt vòng đời ML. Các quy trình này bao gồm phát triển mô hình, kiểm thử, tích hợp, phát hành và quản lý cơ sở hạ tầng.

Tại sao cần sử dụng MLOps?


 

Ở cấp độ cao, để bắt đầu vòng đời máy học, tổ chức của bạn thường phải bắt đầu với việc chuẩn bị dữ liệu. Bạn tìm nạp dữ liệu thuộc nhiều loại khác nhau từ nhiều nguồn khác nhau và thực hiện các hoạt động như tổng hợp, làm sạch trùng lặp và kỹ thuật lấy dữ liệu đặc trưng.

Sau đó, bạn sử dụng dữ liệu đó để đào tạo và xác thực mô hình ML. Tiếp theo, bạn có thể triển khai mô hình đã được đào tạo và xác thực dưới dạng dịch vụ dự đoán mà các ứng dụng khác có thể truy cập thông qua API.

Phân tích dữ liệu thăm dò thường yêu cầu bạn thử nghiệm với các mô hình khác nhau cho đến khi phiên bản mô hình tốt nhất sẵn sàng để triển khai. Việc này dẫn đến việc triển khai phiên bản mô hình và lập phiên bản dữ liệu thường xuyên. Theo dõi thử nghiệm và quản lý quy trình đào tạo ML là điều thiết yếu trước khi các ứng dụng của bạn có thể tích hợp hoặc sử dụng mô hình trong mã của ứng dụng.

MLOps rất quan trọng trong quản lý một cách có hệ thống và đồng thời việc phát hành các mô hình ML mới với mã ứng dụng và các thay đổi đối với dữ liệu. Triển khai MLOps tối ưu coi tài sản ML tương tự như các tài sản phần mềm khác của môi trường tích hợp và phân phối liên tục (CI/CD). Bạn triển khai các mô hình ML cùng với các ứng dụng và dịch vụ mà mô hình sử dụng và những ứng dụng và dịch vụ sử dụng mô hình như một phần của quy trình phát hành hợp nhất.

Những nguyên tắc của MLOps là gì?

Tiếp theo, chúng tôi sẽ giải thích về bốn nguyên tắc chính của MLOps.

Kiểm soát phiên bản

Quy trình này có liên quan đến việc theo dõi thay đổi trong tài sản máy học để bạn có thể tái tạo kết quả và quay lui về phiên bản trước đó nếu cần. Mọi mã đào tạo hoặc thông số mô hình ML đều trải qua giai đoạn xem xét mã. Mỗi mô hình đều được tạo phiên bản để giúp việc đào tạo mô hình ML có thể tái tạo và có thể kiểm tra được.

Khả năng tái tạo trong quy trình làm việc ML đóng vai trò rất quan trọng ở mọi giai đoạn, từ xử lý dữ liệu đến triển khai mô hình ML. Điều này có nghĩa là mỗi giai đoạn sẽ tạo ra kết quả giống hệt nhau với cùng một dữ liệu đầu vào.

Automation

Tự động hóa các giai đoạn khác nhau trong quy trình máy học để đảm bảo khả năng lặp lại, nhất quán và khả năng điều chỉnh quy mô. Điều này bao gồm các giai đoạn từ tải nhập dữ liệu, xử lý trước, đào tạo mô hình và xác thực đến triển khai.

Đây là một số yếu tố có thể kích hoạt đào tạo và triển khai mô hình tự động:

  • Nhắn tin
  • Giám sát hoặc lên lịch sự kiện
  • Thay đổi về dữ liệu
  • Thay đổi về mã đào tạo mô hình
  • Thay đổi về mã ứng dụng.

Tính năng kiểm thử tự động giúp bạn phát hiện sớm các vấn đề để nhanh chóng khắc phục lỗi và rút ra bài học. Tự động hóa hiệu quả hơn với cơ sở hạ tầng dưới dạng mã (IaC). Bạn có thể sử dụng các công cụ để xác định và quản lý cơ sở hạ tầng. Điều này giúp đảm bảo cơ sở hạ tầng có thể tái tạo và có thể được triển khai nhất quán trên nhiều môi trường khác nhau.

Tìm hiểu về IaC »

X liên tục

Thông qua tự động hóa, bạn có thể liên tục chạy kiểm thử và triển khai mã trên quy trình ML của mình.

Trong MLOps, liên tục đề cập đến bốn hoạt động xảy ra liên tục nếu có bất kỳ thay đổi nào được thực hiện ở bất kỳ đâu trong hệ thống:

  • Tích hợp liên tục mở rộng việc xác thực và kiểm thử mã đối với dữ liệu và mô hình trong quy trình
  • Phân phối liên tục tự động triển khai mô hình mới được đào tạo hoặc dịch vụ dự đoán mô hình
  • Đào tạo liên tục tự động đào tạo lại các mô hình ML để triển khai lại
  • Giám sát liên tục liên quan đến giám sát dữ liệu và giám sát mô hình bằng cách sử dụng các chỉ số liên quan đến doanh nghiệp

Quản trị mô hình

Quản trị liên quan đến việc quản lý tất cả các khía cạnh của hệ thống ML để hoạt động hiệu quả. Bạn nên thực hiện nhiều hoạt động để quản trị:

  • Thúc đẩy sự cộng tác chặt chẽ giữa các nhà khoa học dữ liệu, kỹ sư và các bên liên quan của doanh nghiệp
  • Sử dụng tài liệu rõ ràng và các kênh truyền thông hiệu quả để đảm bảo mọi người đều thống nhất
  • Thiết lập cơ chế thu thập phản hồi về dự đoán mô hình và đào tạo lại các mô hình hơn nữa
  • Đảm bảo rằng dữ liệu nhạy cảm được bảo vệ, truy cập vào các mô hình và cơ sở hạ tầng được bảo mật và các yêu cầu tuân thủ được đáp ứng

Ngoài ra, cần phải có một quy trình có cấu trúc để đánh giá, xác thực và phê duyệt các mô hình trước khi chúng đi vào hoạt động. Điều này có thể bao gồm việc kiểm tra tính công bằng, thiên kiến và những cân nhắc về đạo đức.

MLOps mang lại những lợi ích gì?

Máy học giúp các tổ chức phân tích dữ liệu và thu thập thông tin chuyên sâu để ra quyết định. Tuy nhiên, đó là một lĩnh vực sáng tạo và thử nghiệm đi kèm với một loạt các thách thức riêng. Bảo vệ dữ liệu nhạy cảm, ngân sách nhỏ, thiếu kỹ năng và công nghệ không ngừng phát triển sẽ hạn chế thành công của một dự án. Nếu không có sự kiểm soát và hướng dẫn, chi phí có thể tăng và các đội ngũ khoa học dữ liệu có thể không đạt được kết quả mong muốn.

MLOps cung cấp một bản đồ để hướng dẫn các dự án ML hướng tới thành công, bất kể ràng buộc nào. Dưới đây là một số lợi ích chính của MLOps.

Rút ngắn thời gian đưa ra thị trường

MLOps cung cấp cho tổ chức của bạn một khung để đạt được các mục tiêu khoa học dữ liệu của bạn nhanh chóng và hiệu quả hơn. Các nhà phát triển và nhà quản lý của bạn có thể quản lý mô hình một cách có chiến lược và linh hoạt hơn. Các kỹ sư ML có thể cung cấp cơ sở hạ tầng thông qua các tệp cấu hình khai báo để bắt đầu các dự án trơn tru hơn.

Tự động hóa việc tạo và triển khai mô hình dẫn đến thời gian đưa ra thị trường nhanh hơn với chi phí vận hành thấp hơn. Các nhà khoa học dữ liệu có thể nhanh chóng khám phá dữ liệu của một tổ chức để mang lại nhiều giá trị kinh doanh hơn cho tất cả mọi người.

Cải thiện năng suất

Các biện pháp MLOps tăng năng suất và tăng tốc độ phát triển các mô hình ML. Ví dụ: bạn có thể chuẩn hóa môi trường phát triển hoặc thử nghiệm. Sau đó, các kỹ sư ML của bạn có thể khởi chạy các dự án mới, xoay vòng giữa các dự án và tái sử dụng các mô hình ML trên các ứng dụng. Họ có thể tạo ra các quy trình có thể lặp lại để thử nghiệm và đào tạo mô hình nhanh chóng. Các đội ngũ kỹ thuật phần mềm có thể cộng tác và phối hợp thông qua vòng đời phát triển phần mềm ML để tăng cường hiệu quả.

Triển khai mô hình hiệu quả

MLOps cải thiện việc khắc phục sự cố và quản lý mô hình trong sản xuất. Ví dụ: các kỹ sư phần mềm có thể theo dõi hiệu năng của mô hình và tái tạo hành vi để khắc phục sự cố. Họ có thể theo dõi và quản lý tập trung các phiên bản mô hình và chọn phiên bản phù hợp cho các trường hợp sử dụng kinh doanh khác nhau.

Khi bạn tích hợp quy trình làm việc của mô hình với các quy trình tích hợp liên tục và phân phối liên tục (CI/CD), bạn sẽ hạn chế việc suy giảm hiệu năng và duy trì chất lượng cho mô hình của mình. Điều này đúng ngay cả sau khi nâng cấp và điều chỉnh mô hình.

Cách triển khai MLOps trong tổ chức

Có ba cấp độ triển khai MLOps, tùy thuộc vào mức độ hoàn thiện tự động hóa trong tổ chức của bạn.

MLOps cấp 0

Quy trình làm việc ML thủ công và quy trình được điều hành bởi các nhà khoa học dữ liệu là đặc trưng của cấp 0 đối với các tổ chức mới bắt đầu sử dụng hệ thống máy học.

Mỗi bước đều thủ công, bao gồm chuẩn bị dữ liệu, đào tạo ML cũng như hiệu năng và xác thực mô hình. Nó yêu cầu chuyển đổi thủ công giữa các bước và mỗi bước được chạy và quản lý theo hình thức tương tác. Các nhà khoa học dữ liệu thường bàn giao các mô hình được đào tạo dưới dạng tạo tác mà đội ngũ kỹ thuật triển khai trên cơ sở hạ tầng API.

Quy trình này tách biệt các nhà khoa học dữ liệu tạo ra mô hình và các kỹ sư triển khai mô hình đó. Việc phát hành không thường xuyên có nghĩa là các đội ngũ khoa học dữ liệu chỉ có thể đào tạo lại các mô hình vài lần trong năm. Không có những cân nhắc CI/CD cho mô hình ML với phần còn lại của mã ứng dụng. Tương tự, giám sát hiệu năng hoạt động cũng không tồn tại.

MLOps cấp 1

Các tổ chức muốn đào tạo cùng một mô hình với dữ liệu mới thường yêu cầu triển khai hoàn thiện cấp 1. MLOps cấp 1 nhằm mục đích đào tạo mô hình liên tục bằng cách tự động hóa quy trình ML.

Ở cấp 0, bạn triển khai một mô hình được đào tạo vào sản xuất. Ngược lại, đối với cấp độ 1, bạn triển khai một quy trình đào tạo chạy hồi quy để phân phối mô hình được đào tạo tới các ứng dụng khác của bạn. Tối thiểu, bạn đạt được việc phân phối liên tục dịch vụ dự đoán mô hình.

Mức độ hoàn thiện cấp 1 có những đặc điểm sau:

  • Các bước thử nghiệm ML nhanh chóng bao gồm tự động hóa đáng kể
  • Đào tạo liên tục mô hình trong sản xuất với dữ liệu mới làm yếu tố kích hoạt quy trình trực tiếp
  • Triển khai cùng một quy trình trong các môi trường phát triển, tiền sản xuất và sản xuất

Đội ngũ kỹ sư của bạn làm việc với các nhà khoa học dữ liệu để tạo các thành phần mã mô-đun hóa có thể tái sử dụng, kết hợp và có thể chia sẻ trên các quy trình ML. Bạn cũng tạo một kho đặc trưng tập trung cho phép chuẩn hóa việc lưu trữ, truy cập và định nghĩa của các đặc trưng để đào tạo và phân phối ML. Ngoài ra, bạn có thể quản lý siêu dữ liệu – như thông tin về mỗi lần chạy của quy trình và dữ liệu khả năng tái sản xuất.

MLOps cấp 2

MLOps cấp 2 dành cho các tổ chức muốn thử nghiệm nhiều hơn và thường xuyên tạo ra các mô hình mới yêu cầu đào tạo liên tục. Nó phù hợp với các công ty theo định hướng công nghệ cập nhật mô hình của họ trong vài phút, đào tạo lại mô hình theo giờ hoặc hàng ngày và triển khai lại mô hình đồng thời trên hàng nghìn máy chủ.

Vì có nhiều quy trình ML hoạt động nên thiết lập MLOps cấp 2 yêu cầu tất cả các thiết lập của MLOps cấp 1. MLOps cấp 2 cũng yêu cầu những yếu tố sau:

  • Trình điều phối quy trình ML
  • Sổ đăng ký mô hình để theo dõi nhiều mô hình

Ba giai đoạn sau lặp lại trên quy mô lớn đối với nhiều quy trình ML để đảm bảo phân phối liên tục mô hình.

Xây dựng quy trình

Bạn liên tục thử mô hình mới và các thuật toán ML mới, đồng thời đảm bảo các bước thử nghiệm được điều phối. Giai đoạn này xuất mã nguồn cho quy trình ML của bạn. Bạn lưu trữ mã trong một kho lưu trữ nguồn.

Triển khai quy trình

Tiếp theo, bạn xây dựng mã nguồn và chạy kiểm thử để thu thập các thành phần của quy trình để triển khai. Đầu ra là một quy trình được triển khai với việc triển khai mô hình mới.

Phân phối quy trình

Cuối cùng, bạn phân phối quy trình như một dịch vụ dự đoán cho các ứng dụng của bạn. Bạn thu thập số liệu thống kê về dịch vụ dự đoán mô hình được triển khai từ dữ liệu trực tiếp. Đầu ra của giai đoạn này là một bộ kích hoạt để chạy quy trình hoặc một chu kỳ thử nghiệm mới.


 

Điểm khác biệt giữa MLOps và DevOps là gì?

MLOps và DevOps đều là những phương pháp nhằm cải thiện các quy trình phát triển, triển khai và giám sát các ứng dụng phần mềm.

DevOps nhằm mục tiêu thu hẹp khoảng cách giữa đội ngũ phát triển và đội ngũ vận hành. DevOps giúp đảm bảo rằng các thay đổi mã được tự động kiểm thử, tích hợp và triển khai vào sản xuất một cách hiệu quả và đáng tin cậy. Phương pháp này thúc đẩy văn hóa cộng tác để đạt được chu kỳ phát hành nhanh hơn, cải thiện chất lượng ứng dụng và sử dụng tài nguyên hiệu quả hơn.

Trái lại, MLOps là một tập hợp các phương pháp tốt nhất được thiết kế riêng cho các dự án máy học. Mặc dù việc triển khai và tích hợp phần mềm truyền thống có thể tương đối đơn giản, các mô hình ML cũng tạo ra những thách thức riêng. Các thách thức đó liên quan đến việc thu thập dữ liệu, đào tạo mô hình, xác thực, triển khai cũng như giám sát và đào tạo lại liên tục.

MLOps tập trung vào việc tự động hóa vòng đời ML. MLOps giúp đảm bảo rằng các mô hình không chỉ được phát triển mà còn được triển khai, giám sát và đào tạo lại một cách có hệ thống và lặp đi lặp lại. Nó đưa các nguyên tắc DevOps vào ML. MLOps mang lại khả năng triển khai mô hình ML nhanh hơn, độ chính xác cao hơn theo thời gian và đảm bảo mạnh mẽ hơn rằng các mô hình ML cung cấp giá trị kinh doanh thực sự.

AWS có thể hỗ trợ các yêu cầu MLOps của bạn như thế nào?

Amazon SageMaker là một dịch vụ được quản lý toàn phần mà bạn có thể sử dụng để chuẩn bị dữ liệu và xây dựng, đào tạo và triển khai các mô hình ML. Dịch vụ này phù hợp với bất kỳ trường hợp sử dụng nào với cơ sở hạ tầng được quản lý toàn phần, công cụ và quy trình làm việc.

SageMaker cung cấp các công cụ được xây dựng cho mục đích nhất định cho MLOps để tự động hóa các quy trình trong suốt vòng đời ML. Bằng cách sử dụng các công cụ Sagemaker dành cho MLOps, bạn có thể nhanh chóng đạt được mức độ hoàn thiện MLOps cấp 2 trên quy mô lớn. 

Dưới đây là các tính năng chính của SageMaker bạn có thể sử dụng:

  • Sử dụng Thử nghiệm của SageMaker để theo dõi các tạo tác liên quan đến công việc đào tạo mô hình của bạn, như các tham số, chỉ số và tập dữ liệu.
  • Cấu hình Quy trình của SageMaker để chạy tự động theo khoảng thời gian đều đặn hoặc khi một số sự kiện nhất định được kích hoạt.
  • Sử dụng Sổ đăng ký mô hình của SageMaker để theo dõi các phiên bản mô hình. Bạn cũng có thể theo dõi siêu dữ liệu của các phiên bản mô hình, chẳng hạn như nhóm trường hợp sử dụng và các đường cơ sở chỉ số hiệu năng của mô hình trong kho lưu trữ trung tâm. Bạn có thể sử dụng thông tin này để chọn mô hình tốt nhất dựa trên yêu cầu kinh doanh của bạn.

Bắt đầu sử dụng MLOps trên Amazon Web Services (AWS) bằng cách tạo tài khoản ngay hôm nay.

Các bước tiếp theo trên AWS

Tham khảo các tài nguyên bổ sung liên quan đến sản phẩm
Tăng tốc độ đổi mới với các dịch vụ AI tạo sinh của AWS 
Đăng ký tài khoản miễn phí

Nhận ngay quyền sử dụng Bậc miễn phí của AWS.

Đăng ký 
Bắt đầu xây dựng trong bảng điều khiển

Bắt đầu xây dựng trong AWS Management Console.

Đăng nhập