ClouderaNOW Saiba mais sobre Agentes de IA, Cloud Bursting e Data Fabrics para IA | 8 de abril

Inscreva-se já

18 de março, 2026 | Parceiros

Cloudera Agent Studio e NVIDIA trazem agentes de próxima geração para a IA empresarial

10 min de leitura • por Charu Anchlia , Suryakant Bhardwaj , e Pamela Pan

AI Enterprise Ai

Agentes autônomos agem em direção a objetivos complexos sem exigir orientação humana em cada etapa. Em ambientes empresariais, a implementação desses agentes introduz um conjunto mais rigoroso de desafios: eles precisam navegar por sistemas de dados heterogêneos, atender a exigências de conformidade, auditoria e soberania de dados, e manter todos os dados dentro do limite operacional da organização.

Agentes de longo horizonte representam uma nova classe de IA autônoma, indo além de tarefas únicas para perseguir objetivos ao longo de dezenas de decisões sequenciais, executando fluxos de trabalho por horas ou dias e mantendo o contexto durante todo o processo. Em escala empresarial, cada um desses desafios é ampliado.

Uma arquitetura criada para agentes de IA empresariais

A Cloudera projetou o Cloudera Agent Studio (parte do Cloudera AI Studios) em colaboração com a NVIDIA para enfrentar exatamente esses desafios.

NVIDIA Nemotron fornece a base do modelo: ele foi criado especificamente para IA agêntica e para as demandas de inferência de alta taxa de transferência de fluxos de trabalho de longo horizonte.

O Cloudera Agent Studio fornece a camada de orquestração que se baseia nessa fundação por meio de quatro pilares arquitetônicos: planejamento dinâmico de várias etapas, colaboração transparente entre vários agentes, engenharia de contexto para precisão e execução em área de testes. Cada pilar atende a um requisito específico que surge quando agentes autônomos operam em escala empresarial.

Figura 1: o Cloudera Agent Studio orquestra fluxos de trabalho autônomos por meio de planejamento iterativo em várias etapas, colaboração entre vários agentes com ferramentas e habilidades, engenharia de contexto orientada por artefatos e execução em área de testes, com base na fundação de disponibilização de modelos com Cloudera AI Inference, com tecnologia NVIDIA NIM, e modelos Nemotron para IA agêntica.

A base: implementação de modelo privado com NVIDIA Nemotron

A IA empresarial começa com a governança de dados. Prompts, dados proprietários e resultados do modelo precisam permanecer dentro do limite operacional da organização, atendendo às exigências de conformidade sem comprometer a arquitetura. Esse é o requisito central da IA privada: todo o stack de inferência executado dentro da empresa, e não fora dela.

O serviço Cloudera AI Inference, viabilizado pelos microsserviços NVIDIA NIM, permite a disponibilização de modelos de alto desempenho e escalável diretamente no ambiente corporativo, mantendo prompts, dados e saídas dentro do perímetro de segurança. Acelerado pelo stack de IA da NVIDIA, incluindo as GPUs Blackwell e o Dynamo-Triton, o serviço oferece suporte a uma ampla variedade de modelos, incluindo a família de modelos Nemotron da NVIDIA para IA agêntica com raciocínio avançado, uso de ferramentas e fluxos de trabalho de longo prazo. Essa base permite que as organizações criem e executem agentes de IA empresariais diretamente sobre seus dados, com segurança e em escala.

Quatro pilares do Cloudera Agent Studio

1. Planejamento Dinâmico, Iterativo e Multietapas

Os ambientes de dados empresariais não são limpos. Implementações reais envolvem dezenas de bancos de dados com esquemas inconsistentes, documentação escassa e nenhum caminho determinístico de uma pergunta de negócios até a fonte de dados correta. O agente deve construir esse caminho em tempo de execução.

O orquestrador do Agent Studio trata a exploração como parte da execução. Ele decompõe solicitações complexas em planos de várias etapas, executa esses planos de forma iterativa e se autoavalia após cada etapa antes de seguir por um caminho. Esse loop de planejamento com autocorreção torna os agentes confiáveis em ambientes que eles nunca encontraram e sustenta fluxos de trabalho de longo prazo em muitas etapas sequenciais.

2. Colaboração entre vários agentes: reutilização e transparência

Fluxos de trabalho empresariais complexos abrangem vários domínios, cada um exigindo estratégias de raciocínio distintas e ferramentas especializadas. Um único agente que tenta abranger todos eles não pode ser bem otimizado para nenhum, e quanto mais amplo for seu escopo, mais difícil se torna entender e governar o comportamento do agente.

O Agent Studio foi criado com base em agentes especializados, cada um delimitado a um domínio específico e equipado com as ferramentas adequadas, coordenados por um orquestrador que entende como delegar. O que torna essa colaboração transparente e reutilizável é a forma como os agentes se comunicam: cada agente grava saídas estruturadas no contexto compartilhado do projeto, e os agentes subsequentes consomem essas saídas como inputs explícitos e inspecionáveis. Toda a cadeia de raciocínio pode ser rastreada em cada etapa, fornecendo a auditabilidade que as empresas exigem e a reutilização necessária para aproveitar o trabalho anterior em diferentes execuções.

3. Engenharia de contexto: precisão, velocidade e custo

Em escalas de dados empresariais, passar dados brutos diretamente para o modelo não funciona. As janelas de contexto são finitas e, à medida que o contexto não estruturado cresce, a precisão se degrada muito antes de o limite da janela ser atingido.

O Agent Studio trata a janela de contexto como um instrumento de precisão: em cada etapa, apenas as informações relevantes para a tarefa específica daquele agente chegam ao modelo. Esse design orientado por artefatos reduz o consumo de tokens, diminuindo o custo e a latência da inferência e melhorando a precisão. Essa combinação é o que torna viáveis os fluxos de trabalho de longo prazo em escala empresarial.

4. Execução em área de testes

O que torna os agentes autônomos realmente poderosos é sua capacidade de gerar dinamicamente ferramentas, habilidades e código executável conforme os fluxos de trabalho exigem, recursos que o Agent Studio oferece nativamente. Mas, sem isolamento, o código e as ferramentas gerados por agentes executados diretamente em sistemas empresariais apresentam um risco inaceitável.

Projetamos a camada de execução do Agent Studio com isolamento por padrão. Todo o código gerado por agentes e a execução de ferramentas ocorrem em um ambiente de execução em área de testes, sem acesso a sistemas fora do escopo definido. Os agentes começam sem permissões, e cada ação é aplicada por política na camada de infraestrutura, não dentro do próprio processo do agente. Isso fornece aos setores regulamentados a auditabilidade de que precisam, sem restringir o que os agentes podem fazer.

História do cliente: IA agêntica transformando a análise de dados em escala de petabytes

A Cloudera gerencia mais de 30 exabytes de dados estruturados em sua base de clientes, tornando a análise de dados estruturados a área em que essa arquitetura gera impacto imediato. Uma grande empresa de mídia e entretenimento o implementou para oferecer aos usuários de negócios e analistas uma interface em linguagem natural para seus dados operacionais. Seu patrimônio de dados abrangia petabytes em dezenas de bancos de dados, muitas vezes com metadados conflitantes e documentação escassa.

O Cloudera Agent Studio orquestrou agentes especializados com tecnologia NVIDIA Nemotron executados na rede privada do cliente. A pergunta analítica de um usuário de negócios acionou um loop de planejamento iterativo: o orquestrador explorou o patrimônio de dados, navegou pela ambiguidade do esquema e identificou de forma autônoma as fontes de dados corretas. Quando a análise exigia computação estatística além do que o SQL podia expressar, o orquestrador delegava ao agente de execução de código apropriado. As saídas intermediárias foram gravadas como artefatos e encaminhadas ao longo do fluxo de trabalho de longo prazo. Todo o código gerado foi executado em um ambiente em área de testes, mantendo uma trilha de auditoria completa durante todo o processo.

Fluxos de trabalho que antes exigiam um engenheiro de dados, um desenvolvedor e um analista trabalhando em sequência tornaram-se acessíveis a qualquer usuário de negócios. Os resultados dos agentes, incluindo comandos SQL, código gerado e visualizações, foram gravados em um contexto de projeto compartilhado, sendo todos inspecionáveis e auditáveis. Esses artefatos também podiam ser exportados como fluxos de produção. Como o código gerado pelos agentes é determinístico, mesmo quando os modelos subjacentes não o são, esses fluxos de trabalho são confiáveis e reproduzíveis sem necessidade de engenharia adicional.

A arquitetura como vantagem competitiva

Cada pilar dessa arquitetura se baseia no anterior. Uma camada de inferência privada fornece a base, dando suporte aos volumes de chamadas e à confiabilidade que os fluxos de trabalho de longo prazo exigem. O planejamento iterativo permite que os agentes naveguem por ambientes que nunca viram. A colaboração entre vários agentes traz precisão de domínio ao raciocínio em várias etapas. O gerenciamento de contexto baseado em artefatos melhora a precisão e reduz o custo e a latência da inferência. A execução em área de testes garante que os agentes operem com segurança dentro de limites definidos, com cada ação governada e auditável.

A Cloudera e a NVIDIA dão vida a essa arquitetura por meio do Cloudera Agent Studio, do Cloudera AI Inference com tecnologia NVIDIA NIM e da família de modelos NVIDIA Nemotron. Juntas, elas oferecem a base de orquestração de criação e raciocínio agêntico necessária para executar agentes de IA empresariais diretamente em dados empresariais, com segurança, privacidade e em escala.

Para saber mais, veja o Cloudera Agent Studio em ação.

Charu Anchlia

Principal Engineer II - ML

Mais deste autor ›

Suryakant Bhardwaj

Senior Software Engineer

Mais deste autor ›

Pamela Pan

Product Marketing Analyst

Mais deste autor ›

Relacionados

30 de abril, 2026 | Técnico

União da computação de alto desempenho (HPC) e a IA soberana: Parte 1 de 3

8 min de leitura • Gabriele Folchi, Lama Itani

Tudo pronto para começar?

Your form submission has failed.

This may have been caused by one of the following:

Your request timed out
A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.