La norma stabilisce approcci organizzativi generali comuni, indipendentemente dal tipo, dalle dimensioni o dalla natura dell'organizzazione richiedente, al fine di garantire la qualità dei dati per la formazione e la valutazione nell'ambito dell'analisi e dell'apprendimento automatico (ML). Essa include linee guida sul processo di qualità dei dati per:
— ML supervisionato in relazione all'etichettatura dei dati utilizzati per l'addestramento dei sistemi ML, compresi approcci organizzativi comuni per l'etichettatura dei dati di addestramento;
— ML non supervisionato;
— ML semi-supervisionato;
— apprendimento per rinforzo;
— analisi.
La norma è applicabile ai dati di formazione e valutazione che provengono da diverse fonti, compresa l'acquisizione e la composizione dei dati, la preparazione dei dati, l'etichettatura dei dati, la valutazione e l'utilizzo dei dati. La norma non definisce servizi, piattaforme o strumenti specifici.