Descubra a Cloudera Data Platform
O CDP possibilita a tomada de decisões orientada a dados, conectando e protegendo de maneira fácil, rápida e segura, todo o ciclo de vida dos dados.
Gerencie e proteja o ciclo de vida dos dados em qualquer nuvem e data center
-
DataFlow
-
Engenharia de dados
-
Data Warehouse
-
OpDB
-
Machine Learning
-
SDX
-
Plano de Controle
DataFlow: colete fluxos e análises para o ciclo de vida
Ingira, direcione, gerencie e entregue com facilidade dados em repouso e dados em movimento do Edge, de qualquer nuvem ou do data center para qualquer sistema downstream com segurança e proveniência fim-a-fim integradas. O CDP Data Hub usa o Apache NiFi para gerenciamento de fluxo e o Apache Kafka para transmissão de mensagens—ambos parte do Cloudera DataFlow, uma plataforma abrangente de dados em tempo real que fornece informações importantes e inteligência acionável imediata.
Engenharia de dados: Enriqueça, refine, estruture e prepare dados para o ciclo de vida
O Cloudera Data Engineering ajuda a enriquecer, transformar e limpar dados, facilitando a criação, a execução e o gerenciamento de pipelines de dados fim-a-fim. Ele executa uma ampla gama de cargas de trabalho de processamento de dados com desempenho extremamente alto, incluindo processamento em lote e fluxo em tempo real usando o Apache Spark e Spark Streaming, suportado por várias opções de armazenamento, incluindo Apache HBase, Apache Kudu e armazenamento de objetos em nuvem.
Data Warehouse: ofereça acesso de autoatendimento aos relatórios para o ciclo de vida
Forneça informações de negócios sobre grandes quantidades de dados verificados a milhares de usuários com alta velocidade e grande escala, sem comprometer a conformidade e os orçamentos apertados. Movimentando cargas de trabalho locais de maneira perfeita e segura para qualquer nuvem, o Cloudera Data Warehouse supera a shadowTI, acompanhando os requisitos de negócios em evolução e atendendo aos SLAs com acesso de autoatendimento a relatórios, painéis e análises avançadas.
BD operacional: funciona com todos os tipos de dados de todas as fontes para o ciclo de vida
O Cloudera Operational Database serve dados estruturados juntamente com dados não estruturados em uma plataforma de código aberto fim-a-fim unificada, garantindo que a tomada de decisões seja conduzida pelo processamento de fluxo e análises em tempo real nas mudanças constantes dos dados. Os usuários podem fornecer dados em tempo real em escala, com alta simultaneidade e baixa latência, e ciência de dados em escala para criar, pontuar e implantar facilmente modelos de machine learning na produção.
Machine Learning: operacionalize a previsão para o ciclo de vida
Acelere a ciência de dados corporativos da pesquisa à produção em escala com fluxos de trabalho colaborativos de autoatendimento para criar e operacionalizar modelos de machine learning. Usando Python, R e Scala diretamente no navegador Web, o Cloudera Machine Learning oferece uma poderosa experiência de autoatendimento para as equipes de ciência de dados desenvolverem e prototiparem novos recursos de machine learning e os implementarem facilmente na produção.
SDX: garanta segurança, governança e linhagem ao longo do ciclo de vida
O Cloudera SDX (Experiência de dados compartilhados) oferece uma estrutura de segurança e governança de dados abrangente que vincula o ciclo de vida dos dados. O SDX permite que as políticas de governança e segurança de dados e metadados sejam definidas e aplicadas automaticamente ao longo do ciclo de vida dos dados em ambientes híbridos, privados ou com várias nuvens, oferecendo acesso seguro e compatível aos dados em toda a organização.
Plano de controle: gerencie serviços CDP com ferramentas comuns ao longo do ciclo de vida
Gerenciar, monitorar e orquestrar todos os serviços CDP a partir de um único painel com segurança e governança consistentes. Composto pelo Workload Manager, pelo Replication Manager, pelo Data Catalog e pelo Management Console, o Plano de Controle oferece um poderoso conjunto de ferramentas que fornecem recursos de gerenciamento de dados, análise de carga de trabalho, movimentação de dados e descoberta de dados que permitem análises multifuncionais, em qualquer lugar.