La Gen AI può essere la risposta ai problemi con i dati? Sì, ma non in tutti i casi
È importante utilizzare lo strumento giusto per il lavoro che si deve svolgere, considerando tutto il clamore che circonda la Gen AI. “Molte persone stanno cercando di sfruttare questa tecnologia, che sembra in grado di fare tutto”, dice, “ma ciò non significa che si debba usare per tutto”.
Quindi, per esempio, ABBYY ha già uno strumento che può trasformare una singola immagine in centinaia di immagini sintetiche da utilizzare come dati di addestramento. Se ci sono record duplicati, la tecnologia di corrispondenza con logica fuzzy è ottima per verificare se si tratta della stessa persona. Ma un articolo di The Onion che consiglia di mangiare un sasso ogni giorno, o un post su Reddit che parla di mettere la colla sulla pizza possono essere considerati fonti di informazione credibili che dovrebbero far parte di un set di dati di addestramento?
“Questo richiede che la tecnologia ragioni sul fatto che le persone mettano, o meno, la colla sulla pizza”, dice Vermeir. Si tratta è un compito interessante da affidare a un modello linguistico di grandi dimensioni, che deve ragionare su un’ampia quantità di informazioni”. Quindi, siamo di fronte a un caso d’uso molto utile”. ABBYY lavora a qualcosa di simile: capire se una particolare informazione, aggiunta a un set di dati di formazione, aiuterà le prestazioni di un modello in fase di formazione.