Visão geral
A flexibilidade de um data lake e o desempenho de um data warehouse em uma única plataforma.
Um data lakehouse aberto ajuda as empresas a analisar rapidamente todos os dados, estruturados e não estruturados em grande escala. Elimina silos de dados e permite que as equipes de dados colaborem nos mesmos dados, com as ferramentas que quiserem, em qualquer nuvem pública e privada.
Essa arquitetura moderna de dados proporciona confiabilidade de dados com facilidade de gerenciamento de dados. Execute BI, IA, ML e análises de fluxo nos mesmos dados, sem nunca movê-los nem bloqueá-los.

A Cloudera disponibiliza o único data lakehouse aberto do mundo com os seguintes benefícios:
Arquitetura aberta
O data lakehouse da Cloudera com tecnologia Apache Iceberg é 100% aberto: de código aberto e com base em padrões abertos, com ampla adoção da comunidade. Pode armazenar vários formatos de dados e permite que vários mecanismos trabalhem com os mesmos dados.
Facilidade de adoção
Ao integrar o Iceberg diretamente ao Shared Data Experience (SDX), a Cloudera oferece o caminho mais fácil para a implementação de um lakehouse. Os recursos adicionais, como evolução de esquemas, partição oculta etc, simplificam o gerenciamento de dados em grandes conjuntos de dados.
Multinuvem
Construa um data lakehouse em qualquer lugar, em qualquer nuvem pública ou no seu próprio data center. Crie apenas uma vez e execute em qualquer lugar sem nenhuma dor de cabeça. A Cloudera oferece os mesmos serviços de dados com portabilidade completa em todas as nuvens.
Seguro e governado
As tabelas Iceberg na Cloudera se integram ao SDX, o que permite segurança unificada, políticas refinadas, governança, linhagem e gerenciamento de metadados em várias nuvens. Assim, você se concentra na análise dos seus dados e nós cuidamos do resto.
O Open Data Lakehouse da Cloudera agora está disponível na nuvem privada. Saiba os detalhes
Use IA por meio de um Data Lakehouse de ponta a ponta para aumentar a eficiência do ciclo de vida dos dados
Principais componentes
Potencialize seus dados usando um lakehouse aberto
Análise multifuncional
A Cloudera fornece uma ampla gama de serviços de dados para executar IA, ML, BI, análise de fluxo e engenharia de dados no seu data lakehouse. Serviços de dados poderosos e escalonáveis oferecem funções analíticas fundamentais, desde a ingestão e o streaming até o processamento e persistência, orquestração, descoberta e acesso. Além disso, você pode usar a ferramenta da sua preferência.
Apache Iceberg: um formato de tabela aberto
O Apache Iceberg é o principal elemento de um data lakehouse aberto. Trata-se de um formato de tabela aberto de alto desempenho para grandes tabelas analíticas. Ele traz a confiabilidade das tabelas SQL para o big data e, ao mesmo tempo, possibilita que vários componentes funcionem simultaneamente. O Apache Iceberg oferece recursos valiosos como time travel, isolamento de snapshots, evolução de esquemas, particionamento oculto e muito mais.
Shared Data Experience (SDX)
O SDX é uma parte fundamental da Cloudera que oferece tecnologias unificadas de segurança e governança baseadas em metadados. O SDX reduz os riscos e os custos operacionais ao fornecer gerenciamento completo de dados e análises em todas as infraestruturas, em qualquer lugar. A TI pode implantar data lakehouses totalmente protegidos e controlados com mais rapidez, dando a mais usuários acesso a mais dados, sem comprometer essa segurança.
Data Catalog robusto
Encontre, organize e marque dados em qualquer lugar, em todas as infraestruturas, e gere informações relevantes com o Cloudera Data Catalog:
- Compreender, documentar e monitorar dados e seu uso
- Cumpra os regulamentos e as normas para obter dados relevantes
- Implementar medidas organizacionais e técnicas de proteção de dados
- Colaborar e compartilhar dados de forma responsável com informações completas
Cliente
Com o data lakehouse, a varejista global NEW YORKER pode prever as necessidades dos clientes e oferecer uma melhor experiência na loja.




Recursos
Veja mais informações sobre o gerenciamento de dados em qualquer lugar
Radar GigaOm para Data Lakes e Lakehouses
Cloudera indicada líder de mercado para data lakehouses em 2024.