Visão geral
Implante uma ampla gama de análises na nuvem pública de forma rápida e fácil.
O CDP Data Hub é um poderoso serviço de análise na Cloudera Data Platform (CDP) Public Cloud que torna mais fácil e rápida a obtenção de análises de alto valor de Edge to AI em um modelo de cluster familiar na nuvem. Com a mais ampla variedade de cargas de trabalho analíticas — incluindo streaming, ETL, data marts, bancos de dados e machine learning, o CDP Data Hub permite movimentar facilmente cargas de trabalho existentes do local para a nuvem ou criar diretamente na nuvem.
A solução abrangente e baseada em nuvem é alimentada pelo Cloudera Runtime, um conjunto de tecnologias integradas de código aberto e construído com base no SDX. Ele oferece opções extensas em formas de cluster, tipos de carga de trabalho, modelos pré-criados e opções de configuração, oferecendo uma experiência intuitiva e personalizável para usuários que estão confortáveis com arquiteturas tradicionais.
Casos de uso do data hub
Simplifique sua jornada para a nuvem
Levante e transfira facilmente as cargas de trabalho locais da Cloudera para a nuvem pública graças a uma plataforma que abrange nuvens públicas e privadas e oferece:
- O desempenho aprimorado, a governança robusta e a disponibilidade da nuvem pública
- A flexibilidade para otimizar suas cargas de trabalho em ambos os modelos de implantação
- Os benefícios de um fator de forma familiar com um modelo de cluster tradicional facilitando sua migração para a nuvem
- Um caminho de migração simplificado para as experiências em contêiner do CPD
Implante cargas de trabalho multianalíticas complexas de forma rápida
Acelere a implantação de cargas de trabalho complexas na nuvem pública em todo o ciclo de vida dos dados com:
- Uma arquitetura baseada na nuvem que permite implantar uma ampla variedade de cargas de trabalho de análise flexíveis e personalizadas
- Uma experiência intuitiva empregada usando clusters conhecidos baseados em nó, quer você escolha uma abordagem modelada ou crie suas próprias cargas de trabalho
- Um alto grau de personalização, permitindo implantar cargas de trabalho personalizadas para seus requisitos de negócios específicos
Selecionar cargas de trabalho
Data mart em tempo real
Engenharia de dados para pipelines complexos
Transmissão em nuvem híbrida
Banco de dados operacional
Data mart em tempo real
Habilite análises em grandes volumes de dados de chegada rápida.
O modelo Data Mart em Tempo Real no Data Hub permite ingerir milhões de registros por segundo, com atualizações no local conforme necessário. Os dados estão imediatamente disponíveis em um formato ideal para consulta. Esse padrão é ideal para aplicativos de série temporal, análise de eventos, reconciliação CDC e pipelines de processamento de dados em tempo real. O modelo apresenta o mecanismo de armazenamento analítico Apache Kudu, Apache Impala para execução rápida SQL, HUE para desenvolvimento e análise SQL e Apache Spark Streaming para processamento/análise de fluxo.
Engenharia de dados para pipelines complexos
Enriqueça, transforme e carregue dados.
O Data Hub permite enriquecer, transformar e limpar dados para criar, executar e gerenciar pipelines de dados de ponta a ponta com altos graus de flexibilidade e personalização. O modelo de Engenharia de Dados permite que você execute uma ampla gama de cargas de trabalho de processamento de dados, incluindo processamento de fluxo em lote e em tempo real usando o Apache Spark e o Hive.
Transmissão em nuvem híbrida
Colete, processe e crie análises em tempo real
O DataFlow para CDP Data Hub é uma plataforma abrangente de dados de streaming de edge para nuvem que identifica alguns dos desafios de dados de streaming em ambientes híbridos com Apache NiFi e Kafka. Ele permite que os usuários estendam a mesma experiência de streaming local do Cloudera DataFlow para a nuvem sem tributar recursos enormes para desenvolver, configurar e mantê-los.
Banco de dados operacional
Crie aplicativos de classe empresarial altamente confiáveis.
O Data Hub permite executar bancos de dados NoSQL de alto desempenho com suporte para ANSI SQL. Isso oferece escala e desempenho incomparáveis para aplicativos operacionais essenciais para os negócios com o Apache Hbase. O Operational Database oferece suporte a esquemas evolutivos que permite que os desenvolvedores aproveitem o poder dos dados, preservando a flexibilidade no design de aplicativos. Ele também oferece escalonamento automático com base na utilização da carga de trabalho do cluster para otimizar a utilização e o custo da infraestrutura.