IBM dá salto quântico na IA com novos modelos IBM Granite 3.2 

Mulher de terno cinza trabalhando em laptop com visualização de dados em escritório moderno

Menores, mais inteligentes e extraordinariamente eficazes. A IBM acaba de rasgar o envelope da inovação tecnológica. Sua mais recente criação, a família de modelos IBM Granite 3.2, chegou para virar o jogo das inteligências artificiais corporativas com uma proposta ousada: modelos compactos que entregam resultados gigantescos. 

Quem diria que uma IA com poucos parâmetros conseguiria rivalizar com gigantes de mercado? 

Disponibilizada integralmente sob licença Apache 2.0 no Hugging Face, a nova linha estará acessível também no watsonx.ai, Ollama, Replicate e LM Studio. Em breve, chegará ao RHEL AI 1.5. 

Visão que impressiona 

Um diamante lapidado para brilhar além de seu tamanho. O novo modelo de linguagem de visão (VLM) da IBM demonstra desempenho equivalente ou superior a modelos significativamente maiores, como Llama 3.2 11B e Pixtral 12B, em benchmarks essenciais para o ambiente corporativo. 

Para chegar a esse resultado, a equipe de pesquisa da IBM meteu a mão na massa. Utilizaram seu próprio kit de ferramentas Docling de código aberto para processar uma quantidade colossal de informação: 85 milhões de PDFs. Deste trabalho hercúleo, geraram 26 milhões de pares sintéticos de perguntas e respostas. Tudo para que seu VLM pudesse dar conta do recado nos mais complexos fluxos de trabalho documentais. 

Raciocínio que faz a diferença 

Os cérebros digitais estão evoluindo. E rápido. 

A nova versão traz funções de cadeia de pensamento para raciocínio aprimorado nos modelos 3.2 2B e 8B. Com a cereja do bolo: a capacidade de ligar ou desligar esse raciocínio para otimizar a eficiência computacional. Essa função não é para inglês ver. Com ela ativada, o modelo 8B alcança melhorias de dois dígitos em relação ao seu antecessor em benchmarks de instruções como ArenaHard e Alpaca Eval. 

Mas a coisa não para por aí, meu amigo. A IBM tirou da cartola novos métodos de dimensionamento de inferência que permitem calibrar o modelo Granite 3.2 8B para competir com colossos como Claude3.5-Sonnet ou GPT-4o em benchmarks matemáticos. 

Nas vicissitudes do universo corporativo, onde cada segundo de processamento conta, essa flexibilidade é ouro em pó. 

Logo da IBM, com letras listradas em preto e fundo cinza
IBM, símbolo de inovação e tecnologia

Segurança enxuta 

O guardião ficou mais leve. As opções de tamanho reduzido para modelos de segurança Granite Guardian mantêm o desempenho dos modelos anteriores com uma redução de 30% no tamanho. Imagina o impacto disso em termos de custo e velocidade? 

Os novos modelos também introduzem um recurso que chamaram de “confiança verbalizada”. Uma avaliação de risco mais detalhada, reconhecendo as nuances e a ambiguidade no monitoramento de segurança. Quem já trabalhou com conformidade sabe o valor inestimável desta funcionalidade. 

Previsões de longo alcance em pacotes minúsculos 

Junto aos modelos principais, a IBM está lançando a próxima geração de seus modelos TinyTimeMixers (TTM). Impressionantemente pequenos – menos de 10 milhões de parâmetros – esses modelos são capazes de fazer previsões de longo prazo de até dois anos no futuro. 

Pequenos no tamanho, gigantes na utilidade. No cenário hodierno de instabilidade econômica global, ferramentas de prospecção como estas se tornam indispensáveis para análise de tendências financeiras, previsão de demanda e planejamento de estoque sazonal. 

O ecossistema que sustenta a inovação 

A estratégia da IBM não dá ponto sem nó. Seu foco em fornecer modelos menores e especializados para empresas continua mostrando resultados concretos em testes. Recentemente, o modelo IBM Granite 3.1 8B recebeu altas notas em precisão no Salesforce LLM Benchmark para CRM. 

Seria essa a nova tendência do mercado de IA corporativa? A miniaturização sem perda de qualidade? 

David Tan, CTO do CrushBank, parece apostar nessa direção: “Vimos em primeira mão como os modelos de IA abertos e eficientes da IBM oferecem valor real para a IA empresarial, fornecendo o equilíbrio certo entre desempenho, custo-benefício e escalabilidade”. Ele ainda completa, visivelmente entusiasmado: “O Granite 3.2 vai além com novos recursos de raciocínio, e estamos animados para explorá-los na construção de novas soluções de agente.” 

Falar é fácil, fazer é que são elas. E a IBM está fazendo. O IBM Granite 3.2 representa um avanço significativo na evolução de seu portfólio e estratégia para fornecer IA pequena e prática para empresas. 

Por que menos às vezes é mais 

As abordagens de “cadeia de pensamento” para raciocínio são definitivamente poderosas, mas exigem poder computacional substancial nem sempre necessário para todas as tarefas. Foi precisamente por isso que a IBM introduziu a capacidade de ativar ou desativar essa funcionalidade programaticamente. 

Para tarefas mais simples, o modelo funciona sem raciocínio, reduzindo assim a sobrecarga computacional desnecessária. Além disso, outras técnicas de raciocínio, como escala de inferência, mostraram que o modelo Granite 8B pode igualar ou superar o desempenho de modelos muito maiores em benchmarks de raciocínio matemático padrão. 

]Não se deixe enganar pelo tamanho. Como diria Sriram Raghavan, VP da IBM AI Research: “A próxima era da IA ​​é sobre eficiência, integração e impacto no mundo real – onde as empresas podem alcançar resultados poderosos sem gastos excessivos em computação”. 

Os últimos desenvolvimentos focam em soluções abertas, demonstrando outro passo à frente para tornar a IA mais acessível, econômica e valiosa para empresas modernas. 

Eficiente como deve ser. 

Você também pode gostar deste artigo: Arquitetura Agente de IA: Desvendando os Segredos da Estrutura Inteligente

Autor

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *