NVIDIA Grace Hopper Superchip Conquista a Liderança nos Benchmarks de Inferência MLPerf

Por Rafael Ramos

A indústria da inteligência artificial (IA) está em constante evolução, impulsionada pelo desenvolvimento de hardware cada vez mais poderoso e eficiente. Recentemente, a NVIDIA, uma das principais empresas do setor, fez história ao apresentar seu mais recente feito tecnológico: o NVIDIA GH200 Grace Hopper Superchip, que impressionou a todos ao liderar nos benchmarks de inferência MLPerf.

O Superchip NVIDIA GH200

O GH200 Grace Hopper Superchip é uma inovação notável que combina uma GPU Hopper com uma CPU Grace, criando um superchip altamente avançado. Esta junção resulta em um aumento significativo de memória, largura de banda e na capacidade de alternar automaticamente a energia entre a CPU e a GPU para otimizar o desempenho. Isso é particularmente importante para aplicações de IA que requerem grande poder de processamento, como aprendizado profundo e inferência em tempo real.

Desempenho Líder em Todos os Testes

A estreia do GH200 nos benchmarks da indústria MLPerf foi verdadeiramente impressionante. Este superchip executou todos os testes de inferência de data center, ampliando o já impressionante desempenho das GPUs NVIDIA H100 Tensor Core. Os resultados abrangentes destacaram a excepcionalidade da plataforma de IA da NVIDIA, que se estende desde a nuvem até a borda da rede.

Liderando em Diversos Domínios de IA

Os testes de MLPerf incluíram uma variedade de domínios de IA, desde visão computacional e reconhecimento de fala até imagens médicas e sistemas de recomendação. O GH200 Grace Hopper Superchip e as GPUs H100 lideraram todos esses testes de data center, demonstrando sua capacidade de desempenho em cenários de IA diversificados.

Além disso, a última rodada do MLPerf apresentou um novo benchmark de inferência em GPT-J, um modelo de linguagem com seis bilhões de parâmetros. Isso representa um passo significativo na medição do tamanho de modelos de IA, e a NVIDIA mais uma vez provou seu domínio, destacando-se nesse desafio.

Software TensorRT-LLM: Aceleração de Desempenho

Para tornar a sua plataforma ainda mais poderosa, a NVIDIA desenvolveu o TensorRT-LLM, um software de IA generativa projetado para otimizar a inferência. Embora não tenha sido pronto a tempo para a competição MLPerf, o TensorRT-LLM permite que os clientes aumentem significativamente o desempenho de suas GPUs H100 existentes, sem custos adicionais.

Testes internos mostraram que o TensorRT-LLM pode acelerar o desempenho em até 8x em comparação com GPUs da geração anterior ao executar o modelo GPT-J 6B. Isso não apenas melhora o desempenho, mas também resulta em uma redução notável nos custos de propriedade e de energia.

Colaboração com Líderes do Setor

A NVIDIA não desenvolve seus avanços tecnológicos sozinha. Ela colabora com empresas líderes, como Meta, AnyScale, Cohere, Deci, Grammarly, Mistral AI, MosaicML (agora parte do Databricks), OctoML, Tabnine e Together AI, para aprimorar e expandir suas soluções. Essa colaboração tem resultado em um software de IA generativa robusto e altamente eficiente.

GPU L4: Potência em Uma Embalagem Compacta

As GPUs NVIDIA L4 também foram destaque nos benchmarks MLPerf mais recentes. Elas executaram uma ampla gama de cargas de trabalho com desempenho excepcional, superando CPUs com consumo de energia significativamente maior.

As GPUs L4 incluem mecanismos de mídia dedicados que, quando combinados com o software CUDA, proporcionam uma velocidade até 120 vezes maior em visão computacional. Isso faz delas uma escolha poderosa para uma variedade de aplicações, desde serviços de internet ao consumidor até a descoberta de medicamentos.

Compressão de Modelo: Aumentando o Desempenho

A NVIDIA também demonstrou um aumento de desempenho de até 4,7x ao executar o modelo BERT LLM em uma GPU L4, graças a uma nova tecnologia de compressão de modelo. Esta técnica promissora pode ser aplicada em todas as cargas de trabalho de IA e é especialmente benéfica em dispositivos de ponta com restrições de tamanho e consumo de energia.

Jetson Orin: Aumento Significativo no Desempenho

Por fim, o módulo NVIDIA Jetson Orin impressionou com aumentos de desempenho de até 84% em comparação com a rodada anterior nos testes de detecção de objetos. Isso é significativo para cenários de IA de ponta e robótica, onde o desempenho é essencial.

Conclusão

Os benchmarks MLPerf são um indicador importante do estado da arte da IA e a NVIDIA provou mais uma vez seu domínio nesse campo. Com seus avanços em hardware e software, a empresa continua a liderar o setor, oferecendo soluções de IA poderosas e eficientes que beneficiam uma ampla variedade de aplicações.

A colaboração com líderes do setor e a dedicação contínua à inovação garantem que a NVIDIA permanecerá na vanguarda da IA, proporcionando um desempenho que cresce ao longo do tempo, sem custos adicionais, e atendendo às diversas necessidades das cargas de trabalho de IA atuais. Os benchmarks MLPerf são uma prova concreta dessa liderança, respaldada por uma ampla gama de organizações e parceiros comprometidos com o avanço da IA. Todo o software utilizado está disponível para a comunidade, permitindo que outros alcancem resultados de classe mundial e contribuam para o progresso da IA. Com esses avanços, a NVIDIA continua a moldar o futuro da inteligência artificial e a fortalecer sua posição como líder nesse cenário em constante evolução.

Leave a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Scroll to Top
Aluf dá Show de Moda na Abertura do SPFW com Participação Especial da Orquestra Sinfônica Heliópolis TEDx Praia do Forte: Descubra o Poder da Sustentabilidade e Empoderamento em um Mundo em Transformação Navio Roupa Nova 40 Anos: Uma Viagem Mágica pelos Mares da Música Brasileira 7 Jogos leves para celulares fracos (Android 1GB RAM / Mobile) Explorando a Nova Parceria: Belle Belinha e Kine-Chan Agitam as Redes Sociais Sabores Sem Glúten no Nikkey Palace Hotel Como funciona o sorteio da Loteria Federal, saiba como concorrer aos prêmios 12 Cidades para incluir numa viagem para a Tailândia  Projeto de Lei: Regulamentação da Inteligência Artificial