Cloudera nomeada líder no The Forrester Wave™: Plataformas de Data Fabric, no 4º trimestre de 2025

Leia o relatório
  • Cloudera Cloudera
  • | Negócios

    O Contexto é a parte difícil: lições práticas na construção de sistemas de IA agêntica

    Cloudera Author Profile Picture
    Navita Sood Headshot
    construção de janelas

    Por que a engenharia de contexto é importante e como as equipes a estão implementando

    “Como você recebe os dados certos, no lugar certo, na hora certa?” 

    Esse é o principal desafio de dar vida à IA agêntica na empresa. Embora os grandes modelos de linguagem (LLMs) tenham revelado recursos avançados de raciocínio e orquestração, sua eficácia depende de algo mais fundamental: apresentar o contexto de negócios correto para raciocinar e agir. A engenharia de contexto é uma disciplina concentrada na modelagem de como dados, metadados, políticas de acesso e memória se unem para orientar o comportamento do agente de forma segura e explicável.

    Na Cloudera, vemos isso em primeira mão colaborando com clientes corporativos que estão experimentando novos casos de uso da IA generativa (GenAI) e da IA agêntica. A construção de sistemas de IA com agentes depende de algo com que a maioria das organizações tem dificuldades: uma arquitetura de dados que capture, governe e reutilize o conhecimento durante o ciclo de vida da IA. 

    Neste blog, compartilhamos nossa abordagem para criar sistemas de IA agentes, que agrupam os recursos fundamentais em três categorias: conectar, contextualizar e consumir. Essa abordagem permite que nossos clientes corporativos criem sistemas agentes inteligentes, confiáveis, explicáveis e prontos para produção.

    Conecte-se: Quebre os silos com controle

    Os agentes de IA modernos não conseguem prosperar em ambientes fragmentados. No entanto, a maioria das empresas tem dados espalhados por várias nuvens, data centers, sistemas legados e formatos inconsistentes. A exposição desses dados a um sistema de IA sem estrutura ou salvaguardas leva a problemas de desempenho e riscos de governança.

    Em implementações bem-sucedidas, observamos que as organizações se concentram primeiro na criação de uma camada de dados unificada que abrange diferentes ambientes e formatos. Isso não significa centralizar todos os dados, mas integrá-los em uma arquitetura de tecido de dados. Isso proporciona uma camada unificada com metadados compartilhados, políticas de acesso, engenharia de dados federada e interoperabilidade em tempo de execução. 

    A implementação de um formato de tabela aberta e acesso padrão à API simplifica o acesso aos dados e oferece flexibilidade. As arquiteturas Open Lakehouse são importantes aqui porque apresentam visualizações consistentes e em tempo real dos dados em todos os mecanismos — especialmente para fluxos de trabalho com agentes que dependem de geração aumentada de recuperação confiável (RAG) e raciocínio. 

    Contextualizar: Ofereça aos agentes mais do que apenas acesso

    Depois que os dados são conectados, o desafio passa a ser ajudar os agentes a conhecer quais dados existem e como são utilizados. Isso começa com descoberta: identificação automática de fontes de dados em sistemas de nuvem e locais e ativação dos metadados: nomes de tabelas, campos, formatos e outros. Ferramentas como Cloudera Octopai Data Lineage digitalizam scripts ETL, fazem engenharia reversa da lógica de pipelines e capturam como os dados se movem e transformam entre sistemas desde a origem até seu destino final, capturando todas as dependências em seu caminho.

    Essas informações formam a base da linhagem, que mostra como os conjuntos de dados estão relacionados e como mudam ao longo do tempo. A linhagem é importante quando você precisa validar um resultado, explicar uma recomendação ou ação de um agente, ou rastrear uma saída com problemas até sua origem. Isso gera transparência e confiança nos sistemas com os quais os agentes interagem.

    Por fim, a catalogação organiza essas informações em uma estrutura utilizável. Um repositório centralizado de metadados ajuda tanto humanos quanto agentes a localizar o que precisam, conhecer as relações entre conjuntos de dados e identificar políticas que afetam como os dados devem ser tratados. Um catálogo robusto funciona como um modelo, proporcionando um grafo de conhecimento que oferece aos agentes um mapa claro e navegável do conjunto de dados da empresa. Captura os metadados técnicos, operacionais e de negócios, incluindo todas as definições de negócios e a lógica de negócios necessárias para entender os dados e tomar ações. 

    A contextualização permite que os agentes façam mais do que apenas recuperar informações. Isso possibilita que explorem padrões, façam perguntas melhores e tomem decisões com uma compreensão mais profunda do ambiente em que operam.

    Consumir: Entregue o contexto certo no momento certo

    O passo final na construção de sistemas agênticos envolve capacitar a IA a agir de uma maneira que seja rastreável, segura e fundamentada nas informações corretas. É aqui que as escolhas arquitetônicas são importantes: salvaguardas, observabilidade e acesso controlado influenciam se os agentes se comportarão de forma previsível quando isso for necessário.

    Consideramos útil mapear técnicas comuns de engenharia de contexto aos desafios de dados subjacentes que elas se propõem a resolver. Veja a seguir alguns exemplos de como aparecem na prática:

    Desafio de preparação de dados

    Técnica de Engenharia de Contexto

    Abordagem da Cloudera

    Vazamento de dados sensíveis em solicitações

    Engenharia de prompt

    Gateways de acesso para ocultar dados sensíveis

    Dados não estruturados ou índices vetoriais desatualizados

    RAG

    Pipelines de dados de streaming em tempo real governados e seguros

    Falta de linhagem, conjuntos de treinamento frágeis

    Ajuste fino

    Aprimore a explicabilidade da IA com o rastreamento de linhagem

    Agentes que extrapolam seus limites, decisões obscuras

    Acesso à ferramenta/API

    Marcação de metadados, classificação autônoma de dados, acesso refinado e trilhas de auditoria completas em cada chamada do sistema

    Agentes sem acesso ao conhecimento interno da empresa

    Protocolos de contexto de modelo (MCPs)

    Acesso controlado ao contexto baseado no Apache Iceberg com catálogos REST

    A escolha da técnica adequada depende da função do agente, da sensibilidade dos dados e do ambiente operacional. Apresentamos a seguir casos de uso comuns em empresas e as combinações recomendadas que têm apresentado bons resultados na prática:

    caso de uso

    Método(s) Recomendado(s)

    Assistente de conhecimento interno

    RAG + banco de dados vetorial + fallback de engenharia de prompts

    Bot de capacitação de vendas com dados de gestão de relacionamento com o cliente (CRM)

    Chamada de função + Injeção de contexto de negócios

    Agente de suporte específico para produto

    Fine-tuning ou RAG + contexto compartilhado de MCP

    Fluxo de trabalho multiagente de análise de dados para extrair insights 

    LangGraph + MCP + acesso à ferramenta + memória fragmentada

    Compreensão de documentos (PDF, Excel)

    Entradas multimodais + fluxos de pré-processamento

    Essa abordagem de consumo garante que os agentes operem com precisão, segurança e alinhamento aos objetivos de negócios.

    Conclusão: do framework à ação

    Na Cloudera, passamos anos navegando pelas complexidades dos dados corporativos: superando silos, aplicando governança, construindo pipelines seguros para IA e análises, e emergindo linhagens em ambientes híbridos. Portanto, quando os padrões de IA agêntica começaram a surgir, não estávamos começando do zero. Sabíamos onde o contexto se encontrava e como capturá-lo de forma segura e protegida com as devidas salvaguardas.

    Com o Cloudera Octopai Data Lineage, as equipes podem mapear automaticamente fluxos de dados, rastrear dependências e catalogar metadados em ambientes de nuvem e locais. Incorporando camadas de catálogos de dados, observabilidade e controle de acesso, os agentes podem interagir com os sistemas com mais segurança e inteligência. As equipes ganham visibilidade, governança e confiança, fatores essenciais para expandir esses fluxos de trabalho em toda a empresa.

    Para tornar essas peças acionáveis, integramos essas capacidades em nossos Open Data Lakehouse e Cloudera AI Studios, dando às empresas a base para projetar, implantar e gerenciar sistemas agentes seguros em produção.

    Saiba mais sobre como a Cloudera pode ajudar a produzir seus agentes de IA com o contexto comercial correto de que precisam.

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.