Root NationNotiziaGiornale informaticoMicrosoft rivela dettagli sulla sua infrastruttura AI di Singularity

Microsoft rivela dettagli sulla sua infrastruttura AI di Singularity

-

Microsoft ha annunciato che sta lavorando a un nuovo sistema di pianificazione “su scala planetaria” per i carichi di lavoro dell’intelligenza artificiale (AI) chiamato Singularity.

Come spiegato in un white paper pubblicato dall'azienda, Singularity è "un nuovo schedulatore sensibile al carico di lavoro che può anticipare in modo trasparente e ridimensionare in modo elastico i carichi di lavoro di deep learning per garantire un utilizzo elevato senza influire sulla loro correttezza o prestazioni su scala globale degli acceleratori di intelligenza artificiale".

In termini non tecnici, ciò significa che il sistema è progettato per utilizzare in modo ottimale la rete globale dell'hardware del server dell'azienda, riducendo così i costi associati all'esecuzione dei carichi di lavoro dell'IA. Al centro della proposta di valore di Singularity c'è la capacità di ridimensionare i lavori a metà flusso e spostarli tra diverse infrastrutture dislocate in tutto il mondo.

Microsoft

Come spiega il documento, un lavoro in esecuzione può essere spostato su un altro cluster o data center e ripreso esattamente da dove era stato interrotto, ottimizzando così l'utilizzo della capacità. Può anche essere ampliato o ridotto in modo elastico utilizzando diversi tipi e numeri di acceleratori IA. La bellezza di questo sistema, secondo le parole Microsoft, in quanto non richiede lavoro aggiuntivo da parte degli sviluppatori, poiché non sono necessarie modifiche al codice affinché Singularity funzioni.

Tuttavia, per rendere ciò possibile, Microsoft dovevo trovare un modo per separare i carichi di lavoro dalle risorse hardware. La nuova soluzione utilizza quello che l'azienda chiama un "dispositivo proxy" che opera nel proprio spazio di indirizzi e stabilisce un livello di separazione che garantisce una riallocazione fluida delle risorse.

Sebbene il focus del documento sia sul servizio di pianificazione, gli autori affermano che il sistema è progettato per adattarsi a una flotta di centinaia di migliaia di GPU e altri acceleratori di intelligenza artificiale.

Leggi anche:

Iscrizione
Avvisare su
ospite

0 Commenti
Recensioni incorporate
Visualizza tutti i commenti
Altri articoli
Iscriviti per gli aggiornamenti
Popolare ora