Cloudera nomeada líder no The Forrester Wave™: Plataformas de Data Fabric, no 4º trimestre de 2025

Leia o relatório
  • Cloudera Cloudera
  • VISÃO GERAL

    O padrão aberto de engenharia de dados empresariais

    O Data Engineering capacita as equipes empresariais a construir, automatizar e dimensionar pipelines de dados com segurança nas bases de um lakehouse aberto. Potencialize análises multifuncionais e IA para dados em qualquer lugar.

    Diagrama da Cloudera Data Engineering

    Unifique dados estruturados e dados não-estruturados com o Apache Spark no Iceberg, orquestrado pelo Airflow: totalmente aberto, sem dependência de fornecedores.


    Crie, execute e gerencie pipelines de dados em qualquer lugar — nuvens, data centers ou ambientes híbridos — com flexibilidade de contêineres e governança unificada.


    Tenha eficiência de custos com ferramentas de governança financeira para otimização de recursos, incluindo observabilidade em nível de carga de trabalho, escalonamento automático e compartilhamento de dados sem ETL.

    CASOS DE USO

    Crie pipelines de dados do inicio ao fim para acelerar a IA  e a análise de dados.

    • Desenvolva pipelines escaláveis para dados em qualquer lugar

      Ofereça portabilidade de cargas de trabalho, padrões abertos e escalabilidade na nuvem e em ambientes locais.

    • Acelere o DataOps com orquestração

      Automatize fluxos de trabalho, itere pipelines e simplifique colaborações.

    • Compartilhamento de dados Zero-ETL

      Permitir o acesso seguro e confiável aos dados, interna e externamente.

    • Monitore e otimize os custos do pipeline

      Reduza o TCO com observabilidade e computação eficiente.

    • Desenvolva pipelines escaláveis para dados em qualquer lugar

      Ofereça portabilidade de cargas de trabalho, padrões abertos e escalabilidade na nuvem e em ambientes locais.

    • Acelere o DataOps com orquestração

      Automatize fluxos de trabalho, itere pipelines e simplifique colaborações.

    • Compartilhamento de dados Zero-ETL

      Permitir o acesso seguro e confiável aos dados, interna e externamente.

    • Monitore e otimize os custos do pipeline

      Reduza o TCO com observabilidade e computação eficiente.

    20%

    eficiência aprimorada da equipe de dados


    Aumente a eficiência com portabilidade, orquestração e acesso unificado aos dados do Cloudera no local.

    Execute Spark, Iceberg e Airflow de qualquer lugar, com experiência em engenharia de dados nativa da nuvem.

    Captura de tela do produto de engenharia de dados

    Aumente a produtividade dos profissionais com ferramentas intuitivas e segurança corporativa

    Crie, teste e orquestre pipelines com Sessions e Apache Airflow.

    Diagrama de produtos do catálogo Iceberg REST

    Fornecer dados atualizados para fluxos de trabalho subsequentes e plataformas externas.

    Conecte-se a mecanismos externos por meio do Iceberg REST Catalog, com governança e linhagem de metadados.

    Captura de tela do produto Cloudera Observability

    Aumente a escala de forma inteligente com governança financeira em nível de carga de trabalho

    Otimize custos com insights integrados e processadores AWS Graviton energeticamente eficientes.

    Principais recursos

    Execute pipelines escaláveis e governados com Spark on Iceberg em contêineres do data lakehouse aberto. Aproveite a revolução de esquemas, a viagem no tempo e o compartilhamento de dados externos do Iceberg em ambientes locais ou na nuvem.

    Orquestração do tipo "arrastar e soltar" para fluxos de trabalho complexos, simplificando o gerenciamento de tarefas, o controle de dependências e a conectividade com ferramentas externas.

    Crie sessões sob demanda para testes e iterações rápidas. Habilite o desenvolvimento remoto e seguro a partir de qualquer IDE, por exemplo, VSCode e Jupyter Notebook, com a tecnologia do Spark Connect.

    Mantenha os dados atualizados capturando as alterações em nível de linha dos sistemas de origem. Automatize atualizações contínuas para construir pipelines de dados confiáveis.

    Monitore os pipelines de dados fim-a-fim com linhagem integrada e gerenciamento de metadados. Impulsionado pelo Cloudera Shared Data Experience (SDX) e Cloudera Octopai Data Lineage para visibilidade automatizada, governança e insights confiáveis em ambientes híbridos.

    Automatize fluxos de trabalho de pipeline em qualquer serviço com APIs robustas, esteja você trabalhando em SQL, Java, Scala ou Python. Diagnostique e resolva problemas de desempenho com perfis visuais em tempo real, completos com monitoramento e alertas integrados para cada etapa do ciclo de vida.

    Recursos por tipo de cluster de Cloudera Data Engineering

      Núcleo principal Cluster de uso geral

    Infraestrutura

    Cluster de dimensionamento automático    
    Instâncias Spot    
    Cloudera Shared Data Experience    
    Lakehouse aberto com Iceberg    

    Spark

    Gerenciamento do ciclo de vida do trabalho    
    Monitoramento centralizado    
    Orquestração de fluxo de trabalho (Airflow)    
    Spark Streaming    

    Terminais de desenvolvimento

    Sessões interativas    
    Conectividade IDE externa    
    Conector JDBC (em breve)    

    Opções de implantação do Cloudera Data Engineering

    Camada de processamento unificada em um lakehouse de dados aberto e híbrido.  

    Cloudera na nuvem

    • Flexibilidade em várias nuvens: implante em nuvens públicas com serviços conteinerizados e com foco em APIs, sem dependência de fornecedor e totalmente interoperáveis.
    • Experiência modular para desenvolvedores: utilize Apache Airflow, Spark gerenciado, APIs e IDEs — acelere o desenvolvimento com colaborações iterativas.
    • Escalabilidade elástica: as cargas de trabalho do Spark são dimensionadas automaticamente de forma dinâmica, otimizando os custos com base no uso.

    Cloudera on premises

    • Controle sua implementação: implante em nuvens públicas com serviços conteinerizados e com foco em APIs, sem dependência de fornecedor e totalmente interoperáveis.
    • Experiência pronta para a nuvem: tenha os mesmos serviços modulares e conteinerizados da nuvem, desenvolvidos para portabilidade e escalabilidade híbridas.
    • Desenvolvido para empresas: aproveite a integração rápida, o acesso a IDEs externos e controles de acesso refinados por padrão.
    CLIENTES

    Confiança para as equipes transformarem dados híbridos em impacto nos negócios.

    Conectores, integrações e parceiros.

    Construa pipelines em um ecossistema de dados aberto e interoperável. Integre-se com os principais mecanismos, provedores de nuvem e ferramentas em toda a sua infraestrutura de dados moderna.

    Logotipo do Apache Spark

    Processamento de dados

    Logotipo da Apache Iceberg

    Data lakes e warehouses

    Logotipo do Apache Airflow

    Orquestração de dados

    Logotipo do Apache Nifi

    Ingestão de streaming

    Logotipo do HBase

    Mecanismo NoSQL

    Logotipo do Apache Impala

    Data lakes e warehouses

    Logotipo da AWS

    Provedor de serviços de nuvem

    Provedor de serviços de nuvem

    Logotipo do Google Cloud

    Provedor de serviços de nuvem

    Provedor de serviços de nuvem

    Logotipo do Kubernetes

    Orquestração de contêineres

    Data warehouse

    Engaje-se

    Dê o próximo passo

    Aprofunde-se nos detalhes e explore os poderosos recursos do Cloudera Data Engineering. 

    Conheça o produto Data Engineering

    Ícone de tour do produto

    Conheça os bastidores da Cloudera Engineering fazendo um tour pelo produto.

    Comece já

    Documentação de engenharia de dados

    Biblioteca de documentação

    Aprofunde-se nos detalhes de como iniciar com o Cloudera Data Engineering.

    Engenharia de dados na nuvem
    Engenharia de dados no local

    Explore mais produtos

    Cloudera Data Warehouse


    Analise grandes quantidades de dados para milhares de usuários simultâneos sem comprometer a velocidade, o custo ou a segurança.

    Data lakehouse aberto


    Tome decisões inteligentes com uma plataforma flexível que processa quaisquer dados, em qualquer lugar, para análises acionáveis e IA confiável.

    Cloudera AI


    Acelere a tomada de decisão orientada por dados, da pesquisa à produção, com uma plataforma segura, escalonável e aberta para IA empresarial.

    Cloudera Data Flow


    Colete e transfira seus dados de qualquer fonte para qualquer destino de maneira simples, segura, escalonável e com um excelente custo-benefício.

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.