Immagina di essere uno sviluppatore di machine learning che lavora presso una banca. Ti viene richiesto di sviluppare un modello di machine learning per aiutare gli analisti all'interno dell'azienda con la quantità di notizie che devono leggere per prendere decisioni in merito a un investimento. Il modello sarà addestrato sul set di dati 20newsgroups che contiene informazioni su 20 argomenti in circa 20.000 documenti.

Come parte del modello, devi estrarre informazioni semantiche dai dati delle notizie, identificare articoli di notizie simili dal corpus e fornire agli analisti raccomandazioni sui contenuti per notizie simili in base a quelle che stanno leggendo.

In questa esercitazione, imparerai a creare un'istanza notebook Amazon SageMaker, scaricare, preparare e allestire un set di dati utilizzando un notebook Jupyter, addestrare e distribuire il tuo modello di argomento e infine addestrare e distribuire il modello di raccomandazione dei contenuti.

Nel Modulo 1, configurerai l'ambiente che utilizzerai durante l'esercitazione.

Tempo necessario per completare il modulo: 20 minuti

 


  • Fase 1: Creazione di un account AWS

    Utilizza un account AWS personale oppure crea un nuovo account AWS per questo corso. Non utilizzare un account aziendale per disporre dell'accesso completo ai servizi necessari e non tralasciare nessuna risorsa da questo corso. Al termine del corso, se non elimini le risorse utilizzate potrebbero venirti addebitati ulteriori costi AWS.

  • Fase 2: Creazione di un bucket Amazon S3

    Amazon Simple Storage Service (Amazon S3) è un servizio di storage di oggetti che offre scalabilità, disponibilità dei dati, sicurezza e prestazioni all'avanguardia nel settore.

    Con l'addestramento di un modello si producono dati di addestramento e artefatti del modello. In questa esercitazione, utilizzerai un bucket Amazon S3 per allestire i set di dati di addestramento e convalida e archiviare gli artefatti del modello generati da Amazon SageMaker durante l'addestramento del modello.

    Per creare un bucket Amazon S3:

    1. Accedi alla Console di gestione AWS e apri la console di Amazon S3.
    2. Scegli Crea bucket.
    3. Per Nome bucket, digita sagemaker-xx dove xx sono le iniziali che contraddistinguono il nome del bucket.
    4. Nel campo Regione, scegli la regione AWS in cui deve risiedere il bucket.
    5. In Impostazioni del bucket per il blocco all'accesso pubblico, lascia abilitate le impostazioni.
    6. Scegli Crea bucket.
  • Fase 3: Creazione di un'istanza notebook Amazon SageMaker

    Un'istanza notebook Amazon SageMaker è un'istanza di calcolo Amazon Elastic Compute Cloud (Amazon EC2) per machine learning (ML) completamente gestita, che esegue l'app per notebook Jupyter.

    In questa esercitazione, utilizzerai l'istanza notebook per creare e gestire il notebook Jupyter notebook che puoi utilizzare per preparare ed elaborare dati, nonché addestrare e distribuire il modello di machine learning per la raccomandazione dei contenuti.   

    Per creare un'istanza notebook Amazon SageMaker:

    1. Apri la console di Amazon SageMaker.
    2. Scegli Istanze notebook, quindi Crea un'istanza notebook.
    3. Nella pagina Crea un'istanza notebook, per Nome dell'istanza notebook, digita un nome per l'istanza notebook.
    4. Per Tipo di istanza, scegli ml.t2.medium. Questo è il tipo di istanza meno costoso supportato dalle istanze notebook ed è sufficiente ai fini di questa esercitazione.
    5. Per Ruolo IAM, scegli Crea un nuovo ruolo, quindi Crea ruolo.
    6. Scegli Crea un'istanza notebook.

    Nel giro di pochi minuti, Amazon SageMaker avvia un'istanza di calcolo ML (in questo caso, un'istanza notebook) e la collega a un volume di storage ML. L'istanza notebook presenta un server notebook Jupyter preconfigurato e un set di librerie Anaconda.

  • Fase 4: Creazione di un notebook Jupyter

    Crei un notebook Jupyter nell'istanza notebook Amazon SageMaker. Crei inoltre una cella che fa in modo che il ruolo IAM necessario al notebook esegua le API Amazon SageMaker e specifichi il nome del bucket Amazon S3 che utilizzerai per archiviare i set di dati che utilizzi per i dati di addestramento e gli artefatti del modello generati da un'attività di addestramento di Amazon SageMaker.

    Per creare un notebook Jupyter:

    1. Apri la console di Amazon SageMaker.
    2. Scegli Istanze notebook, quindi apri l'istanza notebook creata scegliendo Apri Jupyter per la classica vista Juypter o Apri JupyterLab per la vista JupyterLab.
      Nota: se nella colonna Stato a destra dell'istanza notebook è visualizzato In attesa, il notebook è ancora in fase di creazione. Lo stato cambierà in InService quando il notebook è pronto per l'uso.
    3. Crea il notebook.
      • Se hai aperto il notebook in Jupyter, nella scheda File, scegli Nuovo, quindi conda_python3. Questo ambiente preinstallato include l'installazione predefinita di Anaconda e Python.
      • Se si è aperto il notebook in JupyterLab, nel menu File, scegli Nuovo, quindi selezion Notebook. Per Seleziona kernel, scegli conda_python3. Questo ambiente preinstallato include l'installazione predefinita di Anaconda e Python 3.
    4. Nel notebook Jupyter, scegli File e Salva con nome, quindi assegna un nome al notebook.

In questo modulo, ti abbiamo illustrato il modello ML di esempio utilizzato per l'addestramento in questa esercitazione. Hai inoltre configurato un account AWS e l'ambiente del corso con un bucket Amazon S3, l'istanza notebook Amazon SageMaker e un notebook Jupyter.

Sei pronto per iniziare il corso. Nel modulo successivo, scaricherai, preparerai e allestirai il tuo set di dati.