Ensinamos ao mundo o valor do big data com o código aberto, e nossa forte crença no valor do código aberto, dos padrões abertos e dos mercados abertos está impulsionando a próxima onda de inovação.
Inovação com código aberto
Alguns fornecedores consomem a atividade da comunidade de código aberto; outros ajudam a impulsioná-la . A Cloudera é líder em influenciar a evolução da plataforma Hadoop, criando, contribuindo e oferecendo suporte a novos recursos que atendem às suas necessidades de segurança, escala e usabilidade.
Curadoria de padrões abertos
A Cloudera tem um histórico de identificação, curadoria e suporte longo e comprovado com padrões abertos (incluindo Apache HBase, Apache Spark e Apache Kafka) que oferecem a arquitetura convencional de longo prazo sobre a qual novos casos de uso de clientes são criados.
Os mais altos requisitos empresariais
Para garantir a melhor experiência do cliente, a Cloudera investe recursos significativos em testes multidimensionais em cargas de trabalho reais antes dos lançamentos, bem como na capacidade de suporte de toda a plataforma por meio de um amplo envolvimento na comunidade de código aberto.
Nossas contribuições para a comunidade de código aberto garantem que em troca recebamos as últimas inovações
200+
Assentos no comitê do Apache
65
Assentos da PMC em 22 projetos
>35
projetos
Nosso ecossistema de código aberto
O Apache Hadoop é uma plataforma de software de código aberto para armazenamento e processamento distribuído de conjuntos de dados muito grandes em clusters de computador construído a partir de hardware comum. Os serviços Hadoop são fundamentais para armazenamento de dados, processamento de dados, acesso a dados, governança de dados, segurança e operações.
Apache Accumulo
Um valor importante ordenado e distribuído com acesso baseado em células.
Apache Atlas
Conformidade regulatória empresarial ágil por meio de metadados.
Apache Flink
Uma estrutura de processamento de streams em tempo real para aplicações e análises de big data.
Apache Hadoop
Uma estrutura de armazenamento e processamento distribuído para tarefas de processamento de dados em grande escala.
Apache HBase
Um banco de dados não relacional (NoSQL) que roda no HDFS.
Apache Hive
O padrão "de facto" para consultas SQL no Hadoop.
Apache Iceberg
Um formato de tabela aberto para análises em grande escala, oferecendo a confiabilidade e a simplicidade das tabelas SQL.
Apache Impala
O banco de dados MPP analítico e de código aberto para o Apache Hadoop que oferece o tempo mais rápido para receber insights.
Apache Kafka
Um sistema de mensagens rápido, escalável e tolerante a falhas
Gateway do Apache Knox
Um ponto de entrada seguro para clusters Hadoop.
Apache Kudu
Armazenamento para casos de uso que exigem análises rápidas de dados que mudam de forma rápida.
Apache NiFi
Uma plataforma de logística de dados integrados em tempo real e processamento de eventos simples.
Apache Oozie
O modelo para enterprise Hadoop inclui as camadas originais de armazenamento e processamento de dados.
Apache Phoenix
Um mecanismo de banco de dados relacional massivamente paralelo compatível com OLTP para o Hadoop usando o Apache HBase.
Apache Ranger
Segurança abrangente para Enterprise Hadoop.
Apache Solr
Indexação rápida e busca no Hadoop.
Apache Spark
O Spark adiciona computação in-memory para cargas de trabalho de ETL, aprendizado de máquina e ciência de dados ao Hadoop.
Apache Sqoop
Transfere de forma eficiente dados em massa entre o Apache Hadoop e armazenamentos de dados estruturados.
Apache Tez
Uma estrutura para aplicativos de processamento de dados, baseados em YARN, no Hadoop.
Apache YARN
O centro de arquitetura do Enterprise Hadoop.
Apache Zeppelin
Um bloco de notas baseado na web totalmente aberto e que permite análises de dados interativas.
Apache ZooKeeper
Um servidor de código aberto que coordena com segurança processos distribuídos.
HDFS
Um sistema de arquivos distribuído projetado para armazenar e gerenciar grandes quantidades de dados.
Hue
Um SQL Workbench de código aberto para Data Warehouses.