ClouderaNOW24     Veja as últimas inovações da Cloudera

Assista agora
Visão geral

Simplifique e operacionalize pipelines de dados com segurança em qualquer escala.

O CDP Data Engineering é o único serviço nativo da nuvem criado especificamente para equipes de engenharia de dados corporativos. Com base no Apache Spark, o Data Engineering é um conjunto de ferramentas de engenharia de dados com tudo incluído que permite a automação de orquestração com o Apache Airflow, monitoramento avançado de pipeline, solução de problemas visuais e ferramentas de gerenciamento abrangentes para agilizar os processos ETL em equipes de análise empresarial.

A engenharia de dados é totalmente integrada à Cloudera Data Platform, permitindo visibilidade e segurança de ponta a ponta com SDX, bem como integrações perfeitas com serviços CDP, como CDP Data Warehouse e CDP Machine Learning O Data Engineering na CDP alimenta fluxos de trabalho de engenharia de dados consistentes, repetíveis e automatizados em uma plataforma de nuvem híbrida em qualquer lugar.

Casos de uso de CDP Data Engineering

  • Automatize pipelines de dados em qualquer lugar
  • Tenha visibilidade e controle de ETL
  • Mantenha a integridade dos dados

Automatize pipelines de dados em qualquer lugar


Ofereça conjuntos de dados de qualidade para CDP Data Warehouse, CDP Machine Learning ou qualquer outra ferramenta analítica.

O Data Engineering simplifica os pipelines de dados para equipes analíticas, desde o machine learning até o data warehousing e muito mais. Acelere o tempo de retorno orquestrando e automatizando pipelines para fornecer conjuntos de dados selecionados e de qualidade em qualquer lugar de forma segura e transparente.

Mãos à obra

Tenha visibilidade e controle de ETL


Gerencie de forma holística seu ciclo de vida de dados de forma transparente.

O gerenciamento do ciclo de vida dos dados e o controle de custos torna-se cada vez mais complexo ao tentar operacionalizar em escala pipelines de dados em toda a empresa.

O Data Engineering oferece um conjunto de recursos de controle operacional e visibilidade para planejamento de capacidade, automação de pipeline, captura automática de linhagem e solução de problemas em todos os casos de uso de negócios.

Leia o blog

Captura de tela da ferramenta CDP Data Engineering | Cloudera

Mantenha a integridade dos dados


Visibilidade completa do pipeline de dados para proteger seus negócios.

À medida que a quantidade e a complexidade dos dados aumentam, garantir precisão e fidelidade contínuas para escalonar cargas de trabalho analíticas em toda a empresa pode ser difícil.

O Data Engineering oferece monitoramento e alertas nativos do pipeline de dados para detectar problemas com antecedência e solução de problemas visuais para resolver problemas de forma rápida antes que eles afetem seus negócios.

 

Captura de tela do CDP Data Engineering - Solução de problemas de pipeline de dados | Cloudera

Principais recursos do CDP Data Engineering

Orquestre fluxos de trabalho complexos de transformação de dados apoiados pelo Apache Airflow com centenas de operadores para atender aos requisitos analíticos de missão crítica.

O Data Engineering é conteinerizado, escalonável e portátil, com ambientes de carga de trabalho isolados e guardrails—permitindo o gerenciamento seguro de pipeline com computação elástica sob demanda para atender aos SLAs de negócios de forma econômica.

Visualize métricas de desempenho, incluindo CPU, memória e E/S em todos os estágios de seus trabalhos do Spark para identificar gargalos de desempenho e identificar a agulha no palheiro enquanto soluciona problemas.

Aproveite uma interface avançada de gerenciamento de tarefas por meio de uma CLI e APIs Rest para automatizar e integrar com fluxos de trabalho existentes, como pipelines de CI/CD e ferramentas de terceiros com facilidade.

O Data Engineering oferece um serviço Spark no Kubernetes totalmente integrado que automatiza e agiliza o gerenciamento de artefatos, a segurança e o agendamento de recursos — aproveitando o Apache Yunikorn para fornecer agendamento FIFO e GANG.

A partir de uma interface centralizada, os administradores de plataforma podem gerenciar o acesso e a segurança e, em seguida, provisionar rapidamente novas cargas de trabalho e, ao mesmo tempo, monitorar facilmente a capacidade e visualizar o uso de recursos ao longo do tempo. A SDX também permite o rastreamento completo da linhagem do ciclo de vida para saber de onde os dados vieram e para onde eles estão indo.

Pronto para conhecer mais de perto?


Experimente você mesmo o Data Engineering na Cloudera Data Platform

Ebook

CDP Data Engineering: elevando seu ciclo de vida de dados para o próximo nível

Webinar

Webinar da Cognilytica: Otimização de Pipelines de Engenharia de Dados

Whitepaper

Lista de verificação do ciclo de vida da engenharia de dados da IA

Webinar

Data Engineering na empresa: como acelerar e dimensionar seus pipelines de dados

Treinamento, serviços e suporte de classe mundial

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.