Cloudera nomeada líder no The Forrester Wave™: Plataformas de Data Fabric, no 4º trimestre de 2025

Leia o relatório
  • Cloudera Cloudera
  • | Negócios

    Leve modelos de IA até seus dados com o Cloudera AI Inference Service

    Pamela Pan headshot
    Navita Sood Headshot
    panorama urbano

    Entramos em uma nova etapa da adoção de IA: 88% dos projetos corporativos de IA param antes de chegar à produção, não por causa de ideias ruins ou modelos fracos, mas porque a infraestrutura não acompanha. As APIs em nuvem ficam caras rapidamente. A governança é tratada como algo secundário. A latência se acumula. E, para setores regulados, migrar dados sensíveis para um endpoint público simplesmente não é uma opção.

    Fechar a lacuna entre um piloto de IA e a produção em escala total exige levar a inteligência diretamente até a fonte. O Cloudera AI Inference Service oferece às equipes empresariais uma camada segura, de alto desempenho e com boa relação custo-benefício para servir modelos em produção — executada diretamente onde os dados estão. 

    Em vez de enviar seus dados para a nuvem como contexto para os modelos, a Cloudera leva os modelos até você — destravando a inteligência exatamente onde ela é necessária, protegendo-a desde a concepção e permitindo escalá-la com confiança por trás do seu próprio firewall.

    Três razões pelas quais levar a IA até seus dados é importante: privacidade, custo e escolha em escala

    Mantenha os dados privados e protegidos

    A maioria dos serviços de IA exige que você envie dados para a nuvem, criando riscos relacionados à conformidade, ao custo e à latência. A Cloudera adota a abordagem de levar os modelos para onde seus dados já estão. Seja em uma nuvem privada virtual segura (VPC) ou em um ambiente local isolado da rede (air-gapped), totalmente off-line e segregado, essa estratégia de levar o modelo até os dados garante que suas informações permaneçam privadas e sob governança, ao mesmo tempo que viabiliza inferência de alto desempenho para impulsionar a IA em produção.

    Economia previsível no longo prazo

    Executar IA na nuvem 24 horas por dia, 7 dias por semana, leva a despesas crescentes e imprevisíveis. Essas taxas por solicitação criam um orçamento que varia de acordo com o uso, tornando difícil a previsão de longo prazo. Ao transferir a inferência para uma infraestrutura que a organização já possui e controla, as equipes podem contornar essas taxas externas de uso. Quando a IA passa a operar de forma estável em produção, os custos se tornam mais previsíveis, permitindo maior retorno sobre o investimento à medida que as cargas de trabalho crescem.

    Controle e Escolha

    A maioria dos provedores de IA em nuvem direciona os clientes para seu ecossistema proprietário, o que dificulta trocar, estender ou controlar totalmente seus modelos. Com o Cloudera AI Inference Service, você pode implementar uma ampla variedade de recursos de IA, desde LLMs de IA generativa de código aberto, como o Nemotron da NVIDIA, até modelos preditivos tradicionais, sem abrir mão do controle nem da propriedade sobre sua propriedade intelectual. Acelerado pela plataforma de IA da NVIDIA —GPUs NVIDIA Blackwell, NVIDIA Dynamo-Triton e microsserviços NVIDIA NIM para fornecimento de modelos escaláveis e de alto desempenho — o serviço Cloudera AI Inference permite que os usuários inovem livremente, mantendo a infraestrutura de IA flexível, portátil e preparada para o futuro.

    Figura 1: arquitetura do Cloudera AI Inference Service Figura 1: arquitetura do Cloudera AI Inference Service

    Histórias de sucesso: adoção inicial do Cloudera AI Inference Service em ambientes locais

    O Cloudera AI Inference Service está viabilizando novos casos de uso de IA em lugares onde a nuvem não chega: ambientes off-line, infraestrutura soberana e operações críticas em termos de latência. Aqui estão três cenários do mundo real agora viabilizados pelo Cloudera AI Inference Service e já em andamento com os primeiros adotantes.

    Segurança nacional: inteligência isolada da rede que nunca para nem vaza

    Na defesa nacional, velocidade e segurança são inegociáveis. Mas, até pouco tempo atrás, agentes de inteligência passavam milhares de horas examinando manualmente documentos sensíveis e off-line — desacelerados pelo processo, sobrecarregados pelo volume e impossibilitados de usar ferramentas públicas de IA sem correr risco de exposição.

    Agora, com o Cloudera AI Inference Service operando em ambientes isolados da rede, agências de defesa podem implementar assistentes poderosos baseados em LLM que analisam e resumem grandes coleções de documentos em segundos. Esses modelos operam totalmente off-line: sem internet, sem dependência de nuvem, sem vazamento de dados, ajudando analistas a tomar decisões mais rapidamente sem comprometer a segurança.

    Finanças globais: operações instantâneas, zero exposição de dados

    As finanças transfronteiriças operam em dezenas de idiomas. Antes, traduzir documentos como contratos, relatórios de fraude ou atualizações de conformidade significava usar ferramentas externas, o que gerava sérias preocupações com exposição de dados e auditabilidade.

    Hoje, uma das maiores operadoras globais de cartão de crédito está avaliando o Cloudera AI Inference Service e testando a implementação local de modelos multilíngues para traduzir comunicações sensíveis em tempo real em mais de 200 mercados, tudo sob controle interno. Ao executar a inferência em sua própria infraestrutura, essa empresa está acelerando operações internas e tempos de resposta ao cliente, ao mesmo tempo que evita os riscos de conformidade associados a APIs de terceiros.

    Setor público: agentes de IA para cada funcionário

    As agências governamentais estão sob pressão para atender mais pessoas, mais rapidamente — mas os funcionários muitas vezes ainda dependem de portais desatualizados e manuais extensos de políticas públicas. Ferramentas públicas de IA generativa não são uma opção devido às exigências de privacidade e aos custos imprevisíveis.

    As primeiras implementações do Cloudera AI Inference Service estão dando suporte a chatbots de IA locais treinados com documentação interna de agências. Esses agentes ajudam funcionários e cidadãos a lidar com temas complexos com rapidez e confiança, entregando respostas instantâneas e mantendo controle total sobre os dados, os prompts e os resultados.

    Olhando para a frente: o futuro da IA está em todo lugar onde os dados estão

    Ao levar o modelo até onde os dados estão, o Cloudera AI Inference Service está ajudando organizações a ampliar a inteligência em seus próprios termos — com custo previsível e flexibilidade para escolher entre uma ampla variedade de modelos de produção. Seja para atender exigências de segurança em ambientes isolados da rede ou para otimizar operações globais de alto volume, o caminho para uma IA pronta para produção agora está aberto.

    O Cloudera AI é a base confiável para criar, implementar e governar todos os tipos de IA — de IA generativa e IA agêntica até aprendizado de máquina tradicional — em todo o seu patrimônio de dados.

    Tudo pronto para escalar? Não deixe a infraestrutura limitar a estratégia de IA. Visite a página do Cloudera AI Inference Service para ver demonstrações de casos de uso, saiba mais neste webinar ou agende uma demonstração para ver como transformar “IA em qualquer lugar” em realidade.

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.