Tutorial detalha o uso do Unsloth e apresenta a nova família de modelos abertos NVIDIA Nemotron 3
A NVIDIA publicou nesta semana, no blog RTX AI Garage, um guia completo ensinando como realizar ajuste fino de modelos de inteligência artificial utilizando o Unsloth, um framework open source altamente otimizado para GPUs da empresa. A solução foi pensada tanto para notebooks equipados com RTX quanto para o NVIDIA DGX Spark, o supercomputador compacto de IA da marca.
No artigo, a NVIDIA explica como o Unsloth permite executar fine-tuning local de forma mais eficiente, reduzindo significativamente o consumo de VRAM e acelerando o treinamento. A proposta atende a um cenário cada vez mais comum entre desenvolvedores, que buscam adaptar LLMs para tarefas específicas, como chatbots de suporte técnico ou assistentes pessoais capazes de gerenciar agendas, fluxos de trabalho e decisões automatizadas.
Segundo a empresa, trabalhar com GPUs NVIDIA oferece vantagens claras nesse processo, como maior controle sobre o treinamento, mais memória disponível e ciclos de iteração muito mais rápidos. O conteúdo também destaca o DGX Spark como a plataforma ideal para ajustes em modelos maiores, especialmente aqueles que exigem janelas de contexto estendidas e fluxos de trabalho agentivos mais avançados.
Outro grande destaque do material é a apresentação da nova família de modelos abertos NVIDIA Nemotron 3. Trata-se de um conjunto de modelos, dados e bibliotecas projetados especificamente para um ajuste fino eficiente, escalável e de alta precisão. O Nemotron 3 foi desenvolvido para aplicações de IA agentiva e é considerado o portfólio de modelos abertos mais avançado já lançado pela NVIDIA. Ele está disponível nos tamanhos Nano, Super e Ultra, atendendo desde cargas de trabalho leves até aplicações corporativas complexas.
O post do RTX AI Garage também aborda pontos essenciais do fine-tuning, como técnicas eficientes em parâmetros, uso de aprendizado por reforço e orientações práticas sobre o consumo de VRAM para cada tamanho de modelo. Além disso, detalha como o Unsloth acelera o treinamento em GPUs NVIDIA e por que o DGX Spark se destaca quando o objetivo é trabalhar com modelos de grande porte.
Para quem busca um exemplo prático, a NVIDIA recomenda o vídeo de Matthew Berman, que demonstra um processo de aprendizado por reforço rodando em uma GeForce RTX 5090 com o Unsloth. Há ainda instruções para instalação do framework no DGX Spark e guias adicionais voltados ao ajuste fino de LLMs tanto em GPUs RTX Série 50 quanto no próprio DGX Spark.
Por fim, a empresa confirmou que o ajuste fino do Nemotron 3 Nano já está disponível no Unsloth. O modelo pode ser baixado diretamente na plataforma Hugging Face, além de estar acessível via Llama.cpp e LM Studio, facilitando testes e experimentações locais.
Em resumo, a NVIDIA reforça sua estratégia de democratizar o desenvolvimento de IA avançada, oferecendo ferramentas, modelos abertos e guias práticos que colocam o ajuste fino de LLMs ao alcance de desenvolvedores, pesquisadores e empresas de todos os portes.
Aprenda como instalar o Unsloth no NVIDIA DGX Spark e confira abaixo os guias adicionais de ajuste fino do Unsloth para começar hoje mesmo:
- Ajuste fino de LLMs com GPUs NVIDIA RTX Série 50 e Unsloth
- Ajuste fino de LLMs com NVIDIA DGX Spark e Unsloth
O ajuste fino do Nemotron 3 Nano já está disponível no Unsloth! Baixe agora o Nemotron 3 Nano na plataforma Hugging Face ou experimente ele por meio do Llama.cpp e do LM Studio.
