Cloudera nomeada líder no The Forrester Wave™: Plataformas de Data Fabric, no 4º trimestre de 2025

Leia o relatório
  • Cloudera Cloudera
  • | Negócios

    Como evitar a construção de paredes de tijolos com suas plataformas de dados e IA

    Jeff Healey Headshot
    Estrutura de construção em madeira

    A maioria das grandes organizações hoje nunca escolheria apenas um fornecedor para executar suas iniciativas de dados e IA. Um único fornecedor de nuvem preferido? Talvez, mas a adoção de multinuvem e ambientes híbridos tem crescido, principalmente porque essas organizações estão se preparando para a próxima e inevitável interrupção da nuvem pública. As empresas precisam de opções flexíveis para onde e quando executam suas cargas de trabalho das maneiras mais otimizadas em termos de custo, por exemplo, quando há uma desaceleração econômica ou quando os orçamentos ficam mais apertados.

    Se você der uma olhada nas arquiteturas de dados e IA das organizações de TI da Fortune 2000, encontrará uma infinidade de tecnologias implementadas pelos fornecedores espalhadas como pontos pelos Quadrantes Mágicos da Gartner e pela Forrester Waves. 

    Quando se está envolvido em fusões e aquisições e são necessários resultados rápidos, é fácil se deixar levar pela propaganda enganosa de certos fornecedores. E apesar das melhores intenções de se manter uma abordagem de ecossistema aberto, essas grandes organizações às vezes deixam de ler as letras miúdas antes de investir pesado em ofertas superestimadas. 

    O resultado? Arquiteturas acidentais com paredes de tijolos — que prendem as organizações a um só fornecedor, o que pode levar a custos mais elevados, flexibilidade limitada e inovação mais lenta.

    Este blog explora as armadilhas mais comuns no lock-in de fornecedor e as perguntas críticas que você deve fazer durante as avaliações de plataformas, com exemplos de como a arquitetura de dados abertos da Cloudera ajuda a contornar essas dificuldades.

    Migrações forçadas e dispendiosas para a nuvem e falta de suporte para data fabric e soberania de dados 

    Sua plataforma de dados e IA é executada onde meus dados se encontram?

    O Cloudera roda em qualquer em que seus dados estiverem para você poder processar e governar dados distribuídos com segurança em ambientes híbridos com a mesma plataforma uniforme. A integração do Trino pela Cloudera leva isso ainda mais longe. Possibilita consultas rápidas e federadas em data warehouses, data lakes e sistemas locais sem necessidade de mover dados. Centralizando o acesso e acelerando insights, a Trino é um facilitador-chave para organizações que constroem tecidos de dados unificados e se preparam para a próxima fronteira: IA agêntica.

    Plataformas de dados e IA exclusivas da nuvem não conseguem lidar com dados locais sem forçar migrações para a nuvem que custam milhões de dólares em reescritas e refatorações, no fim das quais você fica preso a um único fornecedor.

    Sua plataforma possibilita a conexão de dados entre silos, desde sistemas locais até nuvens públicas e todos os locais intermediários?

    É isso que um data fabric faz: possibilitar que os dados sejam acessados e utilizados em qualquer lugar, por qualquer pessoa, com segurança e eficiência. Em reconhecimento aos nossos pontos fortes nessa área, a Cloudera acaba de ser escolhida como líder na Forrester Wave for Data Fabric Platforms 2025

    Fornecedores que não atendem aos requisitos mínimos de gerenciamento de dados para dar suporte a casos de uso de malha de dados não são incluídos no report da Forrester. Observe os fornecedores de plataformas populares não incluídos nesta avaliação — o investimento nessas soluções obrigará sua organização a migrar todos os seus dados para um único sistema.

    Sua plataforma consegue operar em ambientes isolados da internet para oferecer implantações soberanas? 

    A Cloudera oferece IA privada oferecendo suporte a implantações soberanas e totalmente isoladas, nas quais os planos de controle e os dados nunca saem do seu ambiente, um requisito para setores regulamentados, especialmente o setor público. Outras plataformas exigem conexão constante com seu plano de controle, impossibilitando a verdadeira IA privada.

    Catálogos que funcionam somente dentro de um ambiente de dados com funcionalidade limitada

    Seu catálogo de dados funciona em todo o meu conjunto de dados?

    A Cloudera (e particularmente a Cloudera Octopai Data Lineage) oferece linhagem e governança full-stack em todas as suas plataformas de dados. Outras plataformas controlam somente os dados que você migrou para essa plataforma, quebrando as arquiteturas de malha de dados.  Além disso, o Cloudera Octopai Data Lineage oferece linhagem visual pronta para uso com integração total. Trata-se de um diferencial importante em comparação com outros fornecedores que oferecem um endpoint de API, mas nenhuma ferramenta, interface do usuário ou integração.

    Sua plataforma de dados e IA oferece governança completa?

    O Cloudera Shared Data Experience (SDX) tem sido comprovado em produção há anos, oferecendo governança completa para todas as cargas de trabalho. 

    Outros fornecedores deixam a desejar nessa área: um deles anunciou ofertas de catálogo há anos, com recursos como governança baseada em tags chegando ao nível de disponibilidade geral apenas recentemente, três anos após o anúncio inicial, enquanto funcionalidades críticas como controle de acesso baseado em atributos permanecem em versão prévia pública. Operar com um intervalo de dois a três anos entre grandes anúncios e a entrega da produção é a definição de uma máquina de hype.

    Custos ocultos, falta de proteções e um Data Warehouse imaturo

    Vocês oferecem preços transparentes com mecanismos de controle para evitar surpresas desagradáveis na fatura?

    A Cloudera oferece preços transparentes, sem multiplicadores ocultos ou armadilhas de consumo. Outros fornecedores introduzem funcionalidades sem quaisquer mecanismos de controle, surpreendendo os clientes com faturas inesperadas de milhares de dólares, mesmo que apenas por um dia de testes.

    Seu data warehouse pode lidar com a verdadeira demanda corporativa?

    O Cloudera Data Warehouse oferece recursos de data warehouse de nível de produção com alta disponibilidade (HA) e ampliação simplificada.

    Embora outros fornecedores tenham adicionado autoscaling e HA, é importante investigar se essas funções são compatíveis ou separadas. Se for o segundo caso, você será obrigado a escolher uma delas. Outras limitações a serem observadas são o armazenamento regional e o gerenciado pelo fornecedor.

    Streaming de dados limitado com taxação sobre ganhos de desempenho questionáveis

    Sua plataforma de dados e IA consegue lidar com cargas de trabalho intensivas de streaming de dados?

    A Cloudera entrega o Apache Flink, Kafka e NiFi , já comprovados em produção, para cargas de trabalho de streaming complexas. Outros fornecedores não conseguem competir com o Flink, especificamente, e não têm recursos de streaming.

    Vocês cobram por ganhos de desempenho em cargas de trabalho de streaming?

    A Cloudera Streaming não oferece faixas de preço premium. Outros impõem um multiplicador de custo de aproximadamente 3×, mesmo que as cargas de trabalho de streaming frequentemente não apresentem ganho de desempenho. Não é incomum que esses fornecedores cobrem até 80% a mais quando você otimiza a partir de análises internas.

    Sua plataforma oferece Kafka em código verdadeiramente aberto ou uma versão proprietária e não comprovada? 

    A Cloudera utiliza o Apache Kafka, plataforma madura e de código aberto com histórico comprovado. Outros nem sequer utilizam o Apache Kafka. Enviam uma solução proprietária semelhante ao Kafka que ainda está em fase inicial, não foi comprovada em larga escala e tem preços pouco claros.

    Falta de clareza em torno da propriedade da IA (vs. Aluguel de acesso à API) e AI Assistants (vs. Chatbots)

    Com a sua plataforma de dados e IA serei proprietário dos meus modelos de IA, ou vocês simplesmente cobrarão pelo acesso à API?

    A Cloudera AI permite que as empresas possuam e operem seus modelos de IA de forma privada em sua infraestrutura. Outros fornecedores atuam como "intermediários" de APIs públicas, expondo os clientes a interrupções repentinas de serviço e custos ilimitados e cobrando taxas exorbitantes.

    Sua plataforma conta com assistentes de IA confiáveis para melhorar a produtividade?

    Os AI Assistants da Cloudera estão integrados em toda a plataforma desde o primeiro dia com inteligência genuína. Outros fornecedores estão reembalando chatbots básicos de recuperação e resposta como inovação, mas se não conseguem rastrear a linhagem dos dados, impor governança nem raciocinar entre dados estruturados e dados não-estruturados, isso é apenas busca com uma interface melhor.

    Os fornecedores estão aderindo à onda dos termos "aberto" e "unificado" sem a infraestrutura necessária para sustentar essas alegações

    Quão aberta é, de fato, sua plataforma de dados e IA?

    Atualmente a Cloudera oferece compatibilidade ao Apache Iceberg e ao Hudi em vários mecanismos, sem dependência de fornecedor. Outros fornecedores alegam a adoção de uma abordagem aberta, mas a compatibilidade com formatos de tabela geralmente está a vários anos de distância, ou ainda em versão beta, e permanece essencialmente proprietária, prendendo os clientes.

    Qual o nível de compatibilidade que sua plataforma oferece para o Apache Iceberg?

    A Cloudera oferece suporte ao Apache Iceberg com recursos completos de leitura e gravação em toda a plataforma, sem dependência de fornecedor. O Iceberg REST Catalog da Cloudera aprimora ainda mais o compartilhamento de dados ao oferecer uma camada de metadados aberta e universal que permite acesso sem cópia em plataformas, motores e equipes populares. 

    Outros fornecedores alegam abertura, mas seu suporte ao Iceberg ainda está em versão beta. E o formato "unificado" da tabela? Os profissionais não o utilizam em implementações reais. Seu uso significa duplicar dados ou sacrificar o desempenho, pois suas otimizações funcionam somente em formatos proprietários.

    Evite a dependência de fornecedores: escolha uma plataforma de dados e IA (verdadeiramente) aberta, unificada e governada

    A Cloudera é a única empresa de plataforma de dados e IA em que grandes organizações confiam para levar a IA aos seus dados onde quer que se encontrem. Diferentemente de outros fornecedores, a Cloudera oferece uma experiência de nuvem consistente que integra nuvens públicas, data centers e edge, apoiando-se em uma base comprovada de código aberto. Como pioneira em big data, a Cloudera capacita as empresas a aplicar IA e exercer controle sobre 100% dos seus dados, em todas as formas, oferecendo segurança unificada, governança e insights preditivos em tempo real. As maiores organizações do mundo, em todos os setores, confiam na Cloudera para transformar a tomada de decisões e, em última análise, aumentar os resultados financeiros, proteger contra ameaças e salvar vidas.

    Para saber mais sobre como preparar, integrar e analisar dados em escala com segurança com o Cloudera, confira nossas demonstrações de produtos ou inscreva-se em um teste gratuito de 5 dias.

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.