Your browser is out of date

Update your browser to view this website correctly. Update my browser now

×

Visão geral

Armazene, processe e analise com segurança todos os seus dados estruturados e não estruturados em repouso 

A Hortonworks Data Platform (HDP) é uma estrutura de código aberto para armazenamento distribuído e processamento de grandes conjuntos de dados com várias fontes. A HDP moderniza sua infraestrutura de TI e mantém seus dados seguros — na nuvem ou no local—além de impulsionar novos fluxos de receita, melhorar o serviço ao cliente e controlar os custos. 

A HDP agiliza a implementação de aplicativos, o machine learning e as workloads de deep learning, o armazenamento de dados em tempo real e a segurança e governança. É um componente-chave de uma arquitetura de dados moderna para dados em repouso.

 

Por que a HDP?

A versão mais recente da HDP oferece novos recursos para a empresa, permitindo a implantação ágil de aplicativos, novas workloads de machine learning/deep learning, armazenamento de dados em tempo real, segurança e governança. É um componente-chave da arquitetura de dados moderna.

HDP Diagram

Principais benefícios e recursos

Um serviço baseado em contêiner que cria e implementa aplicativos em minutos. A conteinerização executa várias versões de um aplicativo para que você crie rapidamente novos recursos e desenvolva e teste novas versões de serviços sem interromper os antigos. A HDP também aceita aplicativos de terceiros em contêineres Docker e contêineres nativos do YARN. A codificação de apagamento aumenta a eficiência de armazenamento em 50%, permitindo uma replicação de dados eficiente para reduzir o TCO.

A HDP fornece a base para o suporte a GPUs em clusters do Apache Hadoop, aprimorando o desempenho de cálculos necessários para casos de uso de ciências de dados e IA. Ele permite o agrupamento de GPUs para compartilhamento de recursos da GPU com mais cargas de trabalho para maior eficiência de custo. Além disso, trabalha com o isolamento da GPU, que dedica uma GPU a um aplicativo para que nenhum outro aplicativo tenha acesso a ela.

A HDP inclui uma pré-visualização tecnológica do TensorFlow em contêineres que, combinada com o pooling de GPU, facilita o design, a construção e o treinamento de modelos de deep learning.

A HDP oferece a liberdade de implantar cargas de trabalho de big data em ambientes híbridos e com várias nuvens, sem a dependência do fornecedor a uma arquitetura de nuvem específica. Os clientes criam e gerenciam facilmente grupos de big data em qualquer configuração de nuvem.

A HDP é agnóstica à nuvem e automatiza o provisionamento para simplificar as implantações de big data, otimizando o uso dos recursos de nuvem.

Suporte de armazenamento em nuvem para armazenar quantidades infinitas de dados em seu formato nativo, incluindo Microsoft ADLS, WASB, AWS S3 e Google Cloud Storage. O Cloudbreak facilita o provisionamento de clusters na nuvem, implementando a HDP no seu provedor de nuvem preferido

A HDP inclui desempenho de consulta aprimorado para se concentrar em consultas mais rápidas. O Hive LLAP, o mecanismo mais rápido do Apache Hive, é executado em um ambiente de multilocação sem causar concorrência pelo uso de recursos. Essa integração acelera drasticamente as consultas comumente usadas em cenários de Business Intelligence, como consultas de agregação e junção. Além da otimização de consultas, o Hive também cria pools de recursos para alocações de recursos refinados.

A HDP permite transações ACID por padrão, facilitando as atualizações nas tabelas do Hive e cumprindo com os requisitos do GDPR. O Hive, como banco de dados em tempo real, elimina a lacuna de desempenho entre cargas de trabalho de baixa latência e alta taxa de transferência para processar mais dados a um ritmo mais rápido.

A HDP continua fornecendo segurança e governança abrangentes. A segurança da HDP é integrada em camadas e inclui recursos para autenticação, autorização, responsabilidade e proteção de dados. Com a integração de segurança e governança, os profissionais de segurança definem políticas de segurança baseadas em classificação. Além disso, as ferramentas de governança de dados permitem que as organizações apliquem classificação de dados consistente no ecossistema de dados.

Os recursos adicionais permitem que a auditoria de eventos seja mais detalhada e refinada, facilitando a tarefa dos auditores. Auditores e usuários podem ver toda a cadeia de custódia à medida que os dados se movimentam pelo ecossistema. Propagação de tags para que auditores e usuários vejam por onde os dados passam na empresa e retenham o contexto dos dados sensíveis. Políticas baseadas em tempo dão acesso temporário a um determinado usuário.

O Data Hub facilita o gerenciamento, o monitoramento e a orquestração de todos os serviços a partir de um único painel em todos os ambientes.

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.