Ensinamos ao mundo o valor do big data com o código aberto, e nossas fortes crenças no valor do open source, dos padrões abertos e dos mercados abertos está impulsionando a próxima onda de inovação.
Inovação de código aberto
Alguns fornecedores consomem a atividade da comunidade de código aberto; outros ajudam a impulsioná-la. A Cloudera lidera a evolução da plataforma de dados, análises e IA criando, contribuindo e dando suporte a recursos novos e diferenciados que atendem aos seus requisitos de segurança, escala e usabilidade.
Curadoria de padrões abertos
A Cloudera tem um longo histórico de identificação, curadoria e suporte comprovado com padrões abertos (incluindo Apache Iceberg, Apache Nifi e Apache Ozone) que oferecem a arquitetura convencional de longo prazo sobre a qual se baseiam casos de uso corporativos já existentes.
As principais demandas empresariais
Para garantir a melhor experiência do cliente, a Cloudera investe recursos significativos em testes multidimensionais em cargas de trabalho reais antes do lançamento, implementa e mantém políticas de segurança com base nas melhores práticas e requisitos regulatórios do setor e oferece suporte à plataforma por meio de amplo envolvimento na comunidade de código aberto.
Cloudera Data Flow
com tecnologia Apache NiFi
O Cloudera Data Flow é um serviço de dados nativo na nuvem com tecnologia Apache NiFi que facilita a distribuição universal de dados, simplificando o processo de movimentação de dados de ponta a ponta.
Cloudera Object Store
com tecnologia Apache Ozone
No data center, o Cloudera Object Store oferece armazenamento de objetos de alta densidade e nativo da nuvem, para armazenamento de dados em escala e eficiência extraordinárias com o Apache Ozone.
Data Lakehouse Aberto da Cloudera
com tecnologia Apache Iceberg
O data lakehouse da Cloudera é construído sobre o Apache Iceberg, o formato de tabela aberta tem o padrão do setor, oferecendo alto desempenho em qualquer escala e integração com o mais amplo ecossistema de mecanismos de computação.
A Cloudera está comprometida com a ética do código aberto, incluindo o sucesso de projetos e comunidades de código aberto.
200+
Assentos no comitê do Apache
50+
Assentos da PMC
>55
Projetos envolvidos
Nosso ecossistema de código aberto
A plataforma Cloudera utiliza um vasto ecossistema de projetos e tecnologias de código aberto que se unem para formar uma verdadeira plataforma híbrida para dados, análises e IA. A Cloudera tem um histórico extenso e comprovado na criação, contribuição e suporte à inovação de código aberto para implementação corporativa.
Apache Accumulo
Um valor importante ordenado e distribuído com acesso baseado em células.
Apache Airflow
Plataforma de gestão de fluxos de trabalho para pipelines de engenharia de dados.
Apache Arrow
Framework de software para desenvolvimento de análises de processamento de dados em formato colunar.
Apache Atlas
Conformidade regulatória empresarial ágil por meio de metadados.
Apache Avro
Chamada de procedimento remoto orientada por linha e estrutura de serialização de dados.
Apache Calcite
Estrutura para criação de bancos de dados e sistemas de gerenciamento de dados.
Apache Flink
Uma estrutura de processamento de streams em tempo real para aplicações e análises de big data.
Apache Hadoop
Uma estrutura de armazenamento e processamento distribuído para tarefas de processamento de dados em grande escala.
Apache HBase
Um banco de dados não relacional (NoSQL) que roda no HDFS.
Apache Hive
O padrão "de facto" para consultas SQL no Hadoop.
Apache Iceberg
Um formato de tabela aberto para análises em grande escala, oferecendo a confiabilidade e a simplicidade das tabelas SQL.
Apache Impala
O banco de dados MPP analítico e de código aberto para o Apache Hadoop que oferece o tempo mais rápido para receber insights.
Apache Kafka
Um sistema de mensagens rápido, escalável e tolerante a falhas
Gateway do Apache Knox
Um ponto de entrada seguro para clusters Hadoop.
Apache Kudu
Armazenamento para casos de uso que exigem análises rápidas de dados que mudam de forma rápida.
Apache Livy
Interface REST para clusters do Spark.
Apache NiFi
Uma plataforma de logística de dados integrados em tempo real e processamento de eventos simples.
Apache Oozie
O modelo para enterprise Hadoop inclui as camadas originais de armazenamento e processamento de dados.
Apache Orc
Formato de armazenamento de dados orientado por colunas otimizado para operações de leitura.
Apache Ozone
Armazenamento de objetos distribuído altamente escalonável com APIs compatíveis com S3.
Apache Parquet
Formato de armazenamento de dados orientado por colunas otimizado para operações WORM.
Apache Phoenix
Um mecanismo de banco de dados relacional massivamente paralelo compatível com OLTP para o Hadoop usando o Apache HBase.
Apache Ranger
Segurança abrangente para Enterprise Hadoop.
Apache Solr
Indexação rápida e busca no Hadoop.
Apache Spark
O Spark adiciona computação in-memory para cargas de trabalho de ETL, IA e ciência de dados ao Hadoop.
Apache Sqoop
Transfere de forma eficiente dados em massa entre o Apache Hadoop e armazenamentos de dados estruturados.
Apache Tez
Uma estrutura para aplicativos de processamento de dados, baseados em YARN, no Hadoop.
Apache YARN
O centro de arquitetura do Enterprise Hadoop.
Apache Zeppelin
Um bloco de notas baseado na web totalmente aberto e que permite análises de dados interativas.
Apache ZooKeeper
Um servidor de código aberto que coordena com segurança processos distribuídos.
Docker
Containerização por meio da virtualização em nível de sistema operacional.
Hue
Um SQL Workbench de código aberto para Data Warehouses.
Tensorflow
Biblioteca de software para machine learning e inteligência artificial.
