Visão geral

A flexibilidade de um data lake e o desempenho de um data warehouse em uma única plataforma.

Um data lakehouse aberto ajuda as empresas a analisar rapidamente todos os dados — estruturados e não estruturados  — em grande escala. Elimina silos de dados e permite que as equipes de dados colaborem nos mesmos dados, com as ferramentas que quiserem, em qualquer nuvem pública e privada.

Essa arquitetura moderna de dados proporciona confiabilidade de dados com facilidade de gerenciamento de dados.  Execute BI, IA, ML e análises de fluxo  nos mesmos dados, sem nunca movê-los bloqueá-los.

O Cloudera Data Platform (CDP) disponibiliza o único data lakehouse aberto do mundo com os seguintes benefícios:

Arquitetura aberta

O data lakehouse da Cloudera com tecnologia Apache Iceberg é 100% aberto: de código aberto e com base em padrões abertos, com ampla adoção da comunidade. Pode armazenar vários formatos de dados e permite que vários mecanismos trabalhem com os mesmos dados.

Facilidade de adoção

Ao integrar o Iceberg diretamente ao Shared Data Experience (SDX), a Cloudera oferece o caminho mais fácil para a implementação de um lakehouse. Os recursos adicionais, como evolução de esquemas, partição oculta etc., simplificam o gerenciamento de dados em grandes conjuntos de dados.

Multinuvem

Construa um data lakehouse em qualquer lugar, em qualquer nuvem pública ou no seu próprio data center. Execute em qualquer lugar sem dores de cabeça e sem precisar construir novamente. A Cloudera oferece os mesmos serviços de dados com portabilidade completa em todas as nuvens.

Seguro e governado

A integração das tabelas do Iceberg no CDP ao SDX permite segurança unificada, políticas refinadas, governança, linhagem e gerenciamento de metadados em várias nuvens. Assim, você se concentra na análise dos seus dados e nós cuidamos do resto.

Principais componentes
 

Potencialize seus dados usando um lakehouse aberto


Análise multifuncional

O Cloudera Data Platform fornece uma ampla gama de serviços de dados para executar IA, ML, BI, análise de fluxo e engenharia de dados no seu data lakehouse. Serviços de dados poderosos e escalonáveis oferecem funções analíticas fundamentais, desde a ingestão e o streaming até o processamento e persistência, orquestração, descoberta e acesso. Além disso, você pode usar a ferramenta da sua preferência.


Análise multifuncional

O Cloudera Data Platform fornece uma ampla gama de serviços de dados para executar IA, ML, BI, análise de fluxo e engenharia de dados no seu data lakehouse. Serviços de dados poderosos e escalonáveis oferecem funções analíticas fundamentais, desde a ingestão e o streaming até o processamento e persistência, orquestração, descoberta e acesso. Além disso, você pode usar a ferramenta da sua preferência.

 

 


Apache Iceberg: um formato de tabela aberto

O Apache Iceberg é o principal elemento de um data lakehouse aberto. Trata-se de um formato de tabela aberto de alto desempenho para grandes tabelas analíticas. Ele traz a confiabilidade das tabelas SQL para o big data e, ao mesmo tempo, possibilita que vários componentes funcionem simultaneamente. O Apache Iceberg oferece recursos valiosos como time travel, isolamento de snapshots, evolução de esquemas, particionamento oculto e muito mais.


Apache Iceberg: um formato de tabela aberto

O Apache Iceberg é o principal elemento de um data lakehouse aberto. Trata-se de um formato de tabela aberto de alto desempenho para grandes tabelas analíticas. Ele traz a confiabilidade das tabelas SQL para o big data e, ao mesmo tempo, possibilita que vários componentes funcionem simultaneamente. O Apache Iceberg oferece recursos valiosos como time travel, isolamento de snapshots, evolução de esquemas, particionamento oculto e muito mais.

 

 


Shared Data Experience (SDX)

O SDX é uma parte fundamental do CDP e fornece um conjunto integrado de tecnologias de segurança e governança a partir de metadados. O SDX reduz os riscos e os custos operacionais ao fornecer gerenciamento completo de dados e análises em todas as infraestruturas, em qualquer lugar. A TI pode implantar data lakehouses totalmente protegidos e controlados com mais rapidez, dando a mais usuários acesso a mais dados, sem comprometer essa segurança.


Shared Data Experience (SDX)

O SDX é uma parte fundamental do CDP e fornece um conjunto integrado de tecnologias de segurança e governança a partir de metadados. O SDX reduz os riscos e os custos operacionais ao fornecer gerenciamento completo de dados e análises em todas as infraestruturas, em qualquer lugar. A TI pode implantar data lakehouses totalmente protegidos e controlados com mais rapidez, dando a mais usuários acesso a mais dados, sem comprometer essa segurança.

 

 


Data Catalog robusto

Encontre, organize e marque dados em qualquer lugar, em todas as infraestruturas, e gere informações relevantes com o Cloudera Data Catalog: 

  • Pesquise, visualize e acesse todos os seus dados em um único lugar 

  • Compreender, documentar e monitorar dados e seu uso

  • Colaborar e compartilhar dados de forma responsável com informações completas


Data Catalog robusto

Encontre, organize e marque dados em qualquer lugar, em todas as infraestruturas, e gere informações relevantes com o Cloudera Data Catalog: 

  • Pesquise, visualize e acesse todos os seus dados em um único lugar 

  • Compreender, documentar e monitorar dados e seu uso

  • Colaborar e compartilhar dados de forma responsável com informações completas

 

 

 

 

Hello Fresh logo

NEW YORKER: explorando informações geradas a partir de dados para identificar tendências na moda e reduzir faltas de estoque Com o data lakehouse, a varejista global NEW YORKER pode prever as necessidades dos clientes e oferecer uma melhor experiência na loja.

 

"A reputação da plataforma de dados da Cloudera, assim como a oferta de confiabilidade, escalabilidade, velocidade e excelente suporte ao cliente foram fatores primordiais na nossa escolha."

—Steffen Minz, Diretor de Ciência de Dados, NEW YORKER

Hello Fresh logo

NEW YORKER: explorando informações geradas a partir de dados para identificar tendências na moda e reduzir faltas de estoque Com o data lakehouse, a varejista global NEW YORKER pode prever as necessidades dos clientes e oferecer uma melhor experiência na loja.

 

"A reputação da plataforma de dados da Cloudera, assim como a oferta de confiabilidade, escalabilidade, velocidade e excelente suporte ao cliente foram fatores primordiais na nossa escolha."

—Steffen Minz, Diretor de Ciência de Dados, NEW YORKER

Recursos
 

Veja mais informações sobre o gerenciamento de dados em qualquer lugar

Webinar

O seu data lakehouse está de fato aberto?

Whitepaper

Série - Arquitetura de dados: data lakehouse aberto

Treinamento, serviços e suporte de classe mundial

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.