ClouderaNOW Saiba mais sobre Agentes de IA, Cloud Bursting e Data Fabrics para IA  |  8 de abril

Inscreva-se já
  • Cloudera Cloudera
  • | Negócios

    Da plataforma de analítica a um sistema operacional de IA: data lakehouse na era da IA agêntica

    Navita Sood Headshot
    Duas mulheres com computador desktop

    A arquitetura de lakehouse foi desenvolvida com a missão de combinar a escala não estruturada do data lake com o desempenho estruturado do data warehouse. Essa mudança unificou os dados empresariais e entregou a primeira verdadeira "fonte única da verdade". Mas, em 2026, a missão se expandiu. Ao entrarmos na era da IA agêntica, o lakehouse está evoluindo de um repositório para relatórios retrospectivos de apoio à tomada de decisões para uma camada de contexto de alto desempenho que alimenta agentes empresariais autônomos para apoiar ações autônomas e imediatas. Sua base aberta, flexível e confiável é aprimorada com interoperabilidade, tratamento de dados em tempo real, segurança, governança, portabilidade entre nuvens e ambientes locais e automações de IA incorporadas para todas as funções administrativas e operacionais. 

    Na Cloudera, estamos vendo uma transformação fundamental na forma como líderes da Fortune 2000 enxergam seus patrimônios de dados. A pressão vem da necessidade de alimentar agentes autônomos de IA com eficiência. Eles estão usando o lakehouse da Cloudera para unificar dados estruturados, semiestruturados e não estruturados, viabilizando ajuste fino de modelos quase em tempo real e inferência em tempo real sem cópia e zero ETL. O lakehouse viabiliza pipelines de RAG, armazenamentos de recursos de AI e pipelines de streaming em tempo real, oferecendo frameworks de governança, camadas de contexto semântico e inteligência operacional para agentes empresariais. 

    Evolução do data lakehouse 

    Interoperabilidade: rompendo a armadilha da “consolidação primeiro”

    Na era da IA, seus dados são sua maior vantagem competitiva. Por isso, é natural que sua estratégia de dados determine quais ferramentas você usa ou onde você treina e executa sua IA, e não o contrário. No entanto, muitos fornecedores ainda promovem um modelo de “consolidação primeiro”, exigindo que você mova ou copie seus dados para um ambiente proprietário de governança ou nuvem antes de poder utilizá-los. Além de adicionar custos, complexidade e riscos à sua estratégia de dados, isso também costuma exigir que você abra mão da propriedade e do controle sobre seus dados.

    Seu data lakehouse precisa ser aberto, flexível, portátil, interoperável e adaptável para que, se sua estratégia de dados mudar, seu lakehouse acompanhe essa mudança. Por isso, formatos de tabela abertos (Apache Iceberg), catálogos abertos (Apache Polaris), mecanismos de consulta abertos, APIs REST e acesso federado estão se tornando o novo padrão e formam os principais blocos de construção do lakehouse da Cloudera. 

    Lakehouse híbrido com reconhecimento de contexto

    Os LLMs são treinados com dados da internet. Eles não conhecem sua empresa. O sucesso da IA não é mais determinado pela qualidade do modelo. Ele depende dos fluxos de trabalho que você está automatizando e da precisão do contexto de negócios que você fornece aos modelos, como registros de ERP, transações financeiras, logs da cadeia de fornecimento e muito mais.

    O Data Lakehouse da Cloudera fornece uma camada segura, protegida e com reconhecimento de contexto para seus agentes: 

    • Contexto de 360 graus: unifique e disponibilize dados da borda, de data centers e da nuvem com uma única camada de governança que fornece um contexto completo de 360 graus.

    • Dados multimodais: transforme, limpe e unifique dados não estruturados, como logs, vídeos e imagens, enriquecendo análises e raciocínio em conjunto com tabelas estruturadas.

    • Semântica compartilhada: combine metadados técnicos, comerciais e operacionais para facilitar que os agentes descubram, compreendam e utilizem seus dados dentro do contexto de negócios correto.

    • Linhagem de espectro completo: quando um agente de IA toma uma decisão de aquisição de US$ 1 milhão, você precisa de uma trilha de auditoria, ou explicabilidade. A Cloudera fornece essa explicabilidade por meio de rastreabilidade fim-a-fim e linhagem automatizada, desde o sensor de borda até a saída final do modelo. 

    O lakehouse da Cloudera oferece contexto em tempo real em ambientes distribuídos e heterogêneos, permitindo que as empresas mantenham seus dados, modelos e regras de negócio sob seu controle enquanto entregam contexto completo aos sistemas de IA.

    IA Portátil

    A Cloudera permite levar análises e IA até os dados, onde quer que eles estejam. Independentemente de seus dados residirem em um armazenamento de objetos local, em uma nuvem privada ou em várias nuvens públicas, nosso lakehouse oferece IA portátil com uma arquitetura unificada e sem cópia. Você pode criar na nuvem e fazer inferência localmente, sem custos de refatoração, para manter seus dados sob seu controle e evitar vazamento de propriedade intelectual. Para instituições financeiras globais, como o OCBC Bank, essa abertura arquitetônica permite escalar recursos de IA/ML em todo o grupo, ao mesmo tempo que atende a requisitos rigorosos de residência e soberania de dados regionais.

    Lakehouse autônomo com auto-otimização

    Os sistemas de IA são altamente sensíveis à qualidade, atualização e consistência dos dados. À medida que os volumes de dados e os fluxos de trabalho de IA crescem exponencialmente, a otimização manual se torna insustentável. A Cloudera integra automações orientadas por IA diretamente à plataforma lakehouse para: 

    • Acesso a dados 

    • Otimização de dados

    • Compactação

    • Evolução de esquemas

    • Marcação e classificação

    • Ajuste de carga de trabalho

    • Monitoramento de qualidade

    • Aplicação de governança

    • Linhagem

    • Gerenciamento do ciclo de vida 

    Ela se auto-otimiza de forma contínua, ao mesmo tempo que reduz a complexidade operacional para equipes de dados e IA. Usando o Cloudera Agent Studio, nossos clientes estão implementando agentes que monitoram, transformam e movem dados de forma autônoma com base na intenção de negócios.

    Do batch ao contínuo: o lakehouse de streaming

    A distinção entre “streaming” e “batch” está desaparecendo. Para dar suporte a fluxos de trabalho agênticos, os dados não podem estar minutos ou horas desatualizados, eles precisam ser contínuos. 

    O Cloudera Open Data Lakehouse funciona como um lakehouse de streaming para tratar cada ponto de dado como um evento, permitindo que agentes de IA respondam a interrupções na cadeia de fornecimento ou anomalias financeiras no milissegundo em que ocorrem. Ele processa esses eventos exatamente onde se originam e realiza análises complexas em dados de streaming antes de ingeri-los no lakehouse para tomada de decisões quase em tempo real. Ele também entrega os dados de streaming pré-processados aos agentes no momento da inferência para ações em tempo real. O lakehouse também inclui recursos de compartilhamento e federação de dados, garantindo que dados de outras fontes possam ser acionados com latência mínima, sem movimentação de dados ou transformações desnecessárias. 

    O continuum edge-to-AI: inferência de borda estende o lakehouse para além do data center

    O lakehouse não é um monólito centralizado. Com a proliferação de IoT, fábricas inteligentes e aplicativos móveis, a inferência de borda se tornou essencial. A Cloudera estende o lakehouse para fora, permitindo análise e ação onde os dados são gerados, na borda, ao mesmo tempo que sincroniza os insights de volta ao hub central. Na Navistar: ao processar dados de sensores de milhares de caminhões conectados em tempo real, a empresa reduziu os custos de manutenção em 30% acionando automaticamente ações de manutenção proativa.

    Convergência de data fabric e lakehouse

    Na Cloudera, estamos observando uma convergência das arquiteturas de lakehouse e fabric. Enquanto o lakehouse unifica os dados, o fabric ativa os metadados, com captura automatizada na ingestão: linhagem, tags de sensibilidade e muito mais. Juntas, essas tecnologias ajudam a automatizar a descoberta, a integração e a governança de dados. Isso simplifica o acesso a dados em qualquer lugar com segurança, sem cópia, sem ETL e sem redundância.

    Da IA que conversa à IA que prevê e age

    A primeira onda da IA foi voltada para a conversa. A próxima onda será voltada para agentes. Os vencedores desta era não serão aqueles que simplesmente “armazenam” mais dados, mas sim aqueles capazes de fornecer contexto confiável, contínuo e multimodal para sistemas autônomos, permitindo recomendações e decisões claras. Ao fornecer aos agentes de IA acesso governado e federado a qualquer dado, a Cloudera está ajudando as maiores empresas do mundo a passar da fase de “conversar” para a de “agir”.

    Independentemente de seus dados estarem no data center, na nuvem ou na borda, o Cloudera Open Data Lakehouse atua como um lakehouse híbrido para garantir que eles estejam prontos para o futuro agêntico. 

     

    Assista ao vídeo para saber como o Cloudera Open Data Lakehouse funciona.

    Visite a página do Cloudera Open Data Lakehouse para saber mais.

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.