Root NationNotíciasnotícias de TIMicrosoft revela detalhes sobre sua infraestrutura Singularity AI

Microsoft revela detalhes sobre sua infraestrutura Singularity AI

-

Microsoft anunciou que está trabalhando em um novo sistema de agendamento em “escala planetária” para cargas de trabalho de inteligência artificial (IA), chamado Singularity.

Conforme explicado em um white paper publicado pela empresa, o Singularity é "um novo agendador com reconhecimento de carga de trabalho que pode antecipar e dimensionar de forma transparente e elástica cargas de trabalho de aprendizado profundo para garantir alta utilização sem afetar sua correção ou desempenho na escala global de aceleradores de IA".

Em termos não técnicos, isso significa que o sistema foi projetado para otimizar o uso da rede global de hardware de servidor da empresa, reduzindo assim os custos associados à execução de cargas de trabalho de IA. No centro da proposta de valor da Singularity está a capacidade de redimensionar trabalhos no meio do fluxo e movê-los entre diferentes infraestruturas localizadas em todo o mundo.

Microsoft

Conforme explica o documento, um trabalho em execução pode ser movido para outro cluster ou data center e retomado exatamente de onde parou, otimizando assim a utilização da capacidade. Ele também pode ser ampliado ou reduzido de forma elástica usando diferentes tipos e números de aceleradores de IA. A beleza deste sistema, segundo as palavras Microsoft, na medida em que não requer trabalho adicional dos desenvolvedores, pois nenhuma modificação de código é necessária para que o Singularity funcione.

Contudo, para tornar isso possível, Microsoft tive que encontrar uma maneira de separar as cargas de trabalho dos recursos de hardware. A nova solução utiliza o que a empresa chama de “dispositivo proxy” que opera em seu próprio espaço de endereço e estabelece um nível de separação que garante uma realocação suave de recursos.

Embora o foco do artigo esteja no serviço de agendamento, os autores dizem que o sistema foi projetado para ser dimensionado para uma frota de centenas de milhares de GPUs e outros aceleradores de IA.

Leia também:

Inscrever-se
Notificar sobre
convidado

0 Comentários
Avaliações incorporadas
Ver todos os comentários
Outros artigos
Inscreva-se para atualizações
Popular agora