ClouderaNOW Saiba mais sobre Agentes de IA, Cloud Bursting e Data Fabrics para IA  |  8 de abril

Inscreva-se já
  • Cloudera Cloudera
  • Conduza o desenvolvimento e a implantação da IA enquanto protege todos os estágios do ciclo de vida da IA.

    Impulsionado pelos microsserviços NVIDIA NIM, o serviço Cloudera AI Inference oferece desempenho líder de mercado — proporcionando inferência até 36 vezes mais rápida em GPUs NVIDIA e quase 4 vezes a taxa de transferência em CPUs — simplificando o gerenciamento e a governança de IA de forma contínua em nuvens públicas e privadas.

    Diagrama do serviço de inferência de IA

    Um serviço para todas as necessidades de inferência de IA da sua empresa.

    Implementação com um clique: Transfira o seu modelo do desenvolvimento para a produção de forma rápida, independentemente do  ambiente.

    Um ambiente seguro: tenha segurança robusta de ponta a ponta, cobrindo todas as etapas do ciclo de vida da sua IA.

    Uma plataforma: gerencie todos os seus modelos de forma integrada por meio de uma única plataforma que atende a todas as suas necessidades de IA.

    Suporte em um só lugar: Receba suporte unificado da Cloudera para todas as suas dúvidas sobre hardware e software.

    Principais recursos do serviço de inferência de IA

    Suporte híbrido e multinuvem

    Permitir a implantação em ambientes locais, de nuvem pública e híbridos para atender de forma flexível às diversas necessidades de infraestrutura empresarial.

    Dados detalhados e linhagem do modelo

    Ofereça rastreamento e documentação abrangentes sobre transformações de dados e eventos do ciclo de vida do modelo, aprimorando a reprodutibilidade e a auditabilidade.

    Segurança corporativa

    Implemente medidas de segurança robustas, incluindo autenticação, autorização* e criptografia de dados, para garantir que os dados e os modelos estejam protegidos em trânsito e em repouso.

    Recursos de inferência em tempo real

    Tenha previsões em tempo real com baixa latência e processamento em lote para grandes conjuntos de dados, assegurando flexibilidade no fornecimento de modelos de IA com base em diferentes métricas de desempenho.

    Alta disponibilidade e escalabilidade dinâmica

    Gerencie de maneira eficiente cargas variáveis enquanto garante serviço contínuo com configurações de alta disponibilidade e capacidades de escalonamento dinâmico.

    Integração flexível

    Integre de forma fácil os fluxos de trabalho e aplicativos existentes com as APIs do Open Inference Protocol para modelos tradicionais de ML e uma API compatível com o OpenAI para LLMs.

    Suporte para múltiplas estruturas de IA

    Implante de forma fácil uma ampla variedade de tipos de modelos com a integração de frameworks de ML populares, como TensorFlow, PyTorch, Scikit-learn e Hugging Face Transformers.

    Padrões avançados de implementação

    Implemente de forma segura e incremental novas versões de modelos com estratégias de implantação sofisticadas, como implantações canary e blue-green*, bem como testes A/B*.

    APIs abertas

    Implante, gerencie e monitore modelos e aplicativos online* e facilite a integração com pipelines de CI/CD e outras ferramentas de MLOps graças à conformidade com padrões abertos.

    Monitoramento de negócios

    Monitore de forma contínua as métricas do modelo GenAI, como sentimento, feedback do usuário e desvio, que são cruciais para manter a qualidade e o desempenho do modelo.

    *Recurso em breve disponível. Entre em contato para saber mais.

    Opções de implantação do serviço de AI Inference

    Execute cargas de trabalho de inferência localmente ou na nuvem, sem comprometer o desempenho, a segurança ou o controle.  

    Cloudera na nuvem

    • Flexibilidade multicloud: implante em nuvens públicas e evite bloqueios de ecossistemas.
    • Tempo mais rápido para obter valor: inicie a inferência sem necessidade de configurar a infraestrutura — ideal para experimentações rápidas.
    • Escalabilidade elástica: gerencie tráfego imprevisível com escalonamento automático até zero e microsserviços otimizados para GPU.

    Cloudera on premises

    • Soberania dos dados: Manter o controle total. Mantenha modelos, prompts e ativos totalmente atrás do seu firewall.
    • Pronto para ambientes isolados: projetado para ambientes regulamentados, como o governo, a saúde e os serviços financeiros.
    • TCO previsível e menor: evite surpresas com preços fixos e um TCO reduzido em comparação com APIs em nuvem baseadas em tokens.
    DEMO

    Experimente a implantação de modelos fáceis

    Veja como é fácil implantar grandes modelos de linguagem com as poderosas ferramentas da Cloudera para gerenciar aplicativos de IA em grande escala de forma eficaz.

    Integração do registro de modelos: 
    acesse, armazene, faça versões e gerencie modelos de forma integrada por meio do repositório centralizado Cloudera AI Registry .

    Configuração e implantação fáceis: implante modelos em ambientes de nuvem, configure endpoints e ajuste o dimensionamento automático para eficiência.

    Monitoramento de desempenho:
    solucione problemas e otimize com base em métricas-chave, como latência, rendimento, utilização de recursos e saúde do modelo.

    headshot of Sanjeev Mohan
    O Cloudera AI Inference permite desbloquear todo o potencial dos dados em escala com a expertise em IA da NVIDIA e protegê-los com recursos de segurança de nível empresarial, para que você possa proteger seus dados com confiança e executar workloads no local ou na nuvem, enquanto implanta modelos de IA de forma eficiente com a flexibilidade e a governança necessárias.

    —Sanjeev Mohan, analista principal, SanjMo

    Engaje-se

    Dê o próximo passo

    Explore funcionalidades poderosas e aprofunde-se nos detalhes com recursos e guias que o ajudarão a iniciar. 

    Tour de produto do serviço de inferência de IA

    Ícone de tour do produto

    Tenha uma visão detalhada do serviço de inferência de IA da Cloudera.

    Comece já

    Documentação do serviço AI Inference

    Biblioteca de documentação

    Encontre tudo: desde descrições de funcionalidades até guias úteis de implementação.

    Explore a documentação

    Explore mais produtos

    Cloudera AI


    Acelere a tomada de decisão orientada por dados, da pesquisa à produção, com uma plataforma segura, escalonável e aberta para IA empresarial.

    AI Studios


    Descubra fluxos de trabalho privados de IA generativa e IA agêntica para todos os níveis de habilidade, com agilidade low-code e controle total do código. 

    AI Assistants


    Leve o poder da IA para o seu negócio de forma segura e em grande escala, garantindo que cada informação seja rastreável, explicável e confiável.

    AMPs


    Explore a estrutura fim-a-fim para desenvolver, implementar e monitorar instantaneamente aplicativos de ML prontos para empresas.

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.