De olho em oferecer ofertas e inovações conjuntas para IA e as bases de virtualização, Red Hat e a AMD recentemente anunciaram uma colaboração estratégica para permitir novos avanços para clientes, fornecedores e parceiros. A partir do aprofundamento dessa aliança, ambas companhias irão ampliar opções e ofertas na nuvem híbrida, desde a implantação de modelos de IA otimizados e eficientes até a modernização mais econômica de máquinas virtuais (VMs) tradicionais.
Com a crescente demanda e diversidade de cargas de trabalho impulsionadas pela IA, as organizações precisam de capacidade e recursos para atender a esses requisitos em expansão. Os data centers médios, no entanto, ainda são majoritariamente dedicados a sistemas de TI tradicionais, dificultando o suporte a cargas intensivas como IA. Para enfrentar esse desafio, Red Hat e AMD estão unindo o poder das soluções open source líderes da Red Hat com o portfólio completo de arquiteturas de computação de alto desempenho da AMD.
AMD e Red Hat: impulsionando uma IA generativa mais eficiente
A Red Hat e a AMD estão combinando o poder do Red Hat AI, com o portfólio de processadores x86 e arquiteturas de GPU da AMD para oferecer ambientes otimizados, econômicos e prontos para operar com cargas de trabalho de IA.
As GPUs AMD Instinct agora são totalmente compatíveis com o Red Hat OpenShift AI, oferecendo aos clientes o poder de processamento necessário para implantações de IA na nuvem híbrida sem exigir recursos extremos. Além disso, usando as GPUs AMD Instinct MI300X com Red Hat Enterprise Linux AI, as companhias realizaram testes na plataforma Microsoft Azure ND MI300X v5, demonstrando com sucesso a inferência de IA em escala para modelos de linguagem pequenos (SLMs) e grandes (LLMs), todos executados em múltiplas GPUs dentro de uma única VM, reduzindo a necessidade de múltiplas VMs e diminuindo os custos de desempenho.
Para impulsionar ainda mais o desempenho e as capacidades de ajuste fino, a Red Hat e a AMD estão colaborando com a comunidade upstream do vLLM para promover uma inferência de IA mais eficiente. Com essa ativação, Red Hat e AMD tem como objetivo oferecer:
- Mais desempenho em GPUs AMD: ao contribuir com a biblioteca de kernel AMD e otimizar componentes como o kernel Triton e FP8, Red Hat e AMD melhoram o desempenho de inferência para modelos densos e quantizados, permitindo execução mais rápida e eficiente do vLLM nos aceleradores AMD Instinct MI300X.
- Suporte aprimorado a múltiplas GPUs: promovendo melhorias na comunicação coletiva e na otimização de cargas distribuídas, esses aperfeiçoamentos aumentam a escalabilidade e eficiência energética, o que é particularmente benéfico para workloads distribuídos em múltiplas GPUs, eliminando gargalos e melhorando o throughput geral.
- Maior engajamento com o ecossistema vLLM: a colaboração entre Red Hat, AMD e outros líderes do setor, como a IBM, acelera o desenvolvimento upstream para impulsionar melhorias contínuas no projeto vLLM e na otimização de GPUs AMD, beneficiando diretamente os usuários de vLLM em hardware AMD para inferência e treinamento da IA.
A partir dessa colaboração com a comunidade vLLM, as GPUs AMD Instinct passarão a oferecer suporte ao Red Hat AI Inference Server, distribuição empresarial pronta para o uso do vLLM da Red Hat, proporcionando uma solução robusta, confiável e escalável para inferência de IA. Como maior colaboradora comercial do projeto vLLM, a Red Hat está comprometida em garantir compatibilidade com o hardware de escolha da organização, o que inclui GPUs AMD Instinct. Executar o vLLM com GPUs AMD Instinct permite implantar qualquer modelo de IA open source em hardware validado e testado, garantindo desempenho e otimização excepcionais.
As CPUs AMD EPYC™ também oferecem desempenho de ponta a ponta em IA e são ideais para hospedar sistemas com GPUs, aumentando o desempenho e o retorno sobre investimento (ROI) de cada servidor equipado com GPU, mesmo nas cargas de trabalho mais exigentes.
Transformando o data center para a era moderna
Ao otimizar o footprint dos data centers atuais, as organizações podem reinvestir recursos de forma mais eficaz para viabilizar a inovação em IA. O Red Hat OpenShift Virtualization, um recurso do Red Hat OpenShift, oferece um caminho simplificado para migração e gestão de cargas de VMs com a velocidade e a facilidade de uma plataforma nativa da nuvem. O OpenShift Virtualization é validado para processadores AMD EPYC, aproveitando seu excelente desempenho e eficiência energética em qualquer ponto da nuvem híbrida, mantendo uma ponte para o futuro nativo na nuvem.
O Red Hat OpenShift Virtualization com CPUs AMD EPYC ajuda as empresas a otimizarem a implantação de aplicações em servidores líderes de mercado como Dell PowerEdge, HPE ProLiant e Lenovo ThinkSystem. Ao renovar um data center legado, o Red Hat OpenShift Virtualization permite a unificação de VMs e aplicações conteinerizadas, seja on-premise, em nuvens públicas ou em ambientes híbridos. Isso permite altos índices de consolidação de infraestrutura, resultando em redução significativa no custo total de propriedade (TCO), incluindo hardware, licenças de software e consumo energético. Com isso, as equipes de TI podem gerenciar workloads críticos com mais eficiência e liberar recursos e energia para cargas de trabalho de IA no presente e no futuro.
Fonte: TI INSIDE Online - Leia mais