Pesquisa Fast Forward Labs agora disponível sem assinatura
Em breve, todos os novos reports estarão disponíveis ao público e para download gratuito. Além disso, oferecemos acesso a versões atualizadas de reports mais antigos ao longo do tempo. Por isso, volte sempre para explorar a pesquisa gratuita disponível.
Reports de pesquisa gratuitos
Explore nossos reports e protótipos de pesquisa mais recentes, acessíveis gratuitamente a todos.
Text Style Transfer
A tarefa PNL de transferência de estilo de texto (TST) tem como objetivo controlar automaticamente os atributos de estilo de um trecho de texto, preservando o conteúdo ao mesmo tempo. Essa é uma questão importante para tornar a PNL mais voltada ao usuário. Neste report, explora-se a transferência de estilo de texto por meio de um caso de uso aplicado, neutralizando a validação subjetiva no texto livre. Em primeiro lugar, descreve-se a abordagem sequence-to-sequence empregada, na qual se utilizou o Transformers da HuggingFace. Em segundo lugar, expõe-se um conjunto de métricas de avaliação personalizadas e sem referência para quantificar o desempenho do modelo. Por fim, levanta-se uma discussão acerca da ética, intitulada "Explorando a assistência de escrita inteligente", a partir do protótipo apresentado.
Inferindo o desvio de conceito sem dados rotulados
O desvio de conceito ocorre quando as propriedades estatísticas de um domínio alvo mudam com o tempo, causando a degradação do desempenho do modelo. A detecção de desvio geralmente é obtida monitorando uma métrica de desempenho de interesse e acionando um pipeline de reciclagem quando essa métrica cai abaixo de algum limite designado. No entanto, essa abordagem pressupõe que amplos dados rotulados estejam disponíveis no momento da previsão - uma restrição irreal para muitos sistemas de produção. Neste relatório, exploramos várias abordagens para lidar com o desvio de conceito quando os dados rotulados não estão prontamente acessíveis.
Explorando a otimização de hiperparâmetros multiobjetivos
Desenvolvemos modelos de machine learning contra as métricas “suspeitas comuns”, como precisão preventiva e recall. No entanto, essas métricas raramente são de fato tudo com o que temos que nos preocupar. Os modelos de produção também devem satisfazer requisitos físicos , como latência ou pegada de memória, ou restrições de justiça. A otimização de hiperparâmetros se torna ainda mais desafiadora quando temos várias métricas para otimizar. Nossa pesquisa mais recente examina esse cenário de otimização de hiperparâmetros “multiobjetivo” em detalhes.
Deep learning para verificação automática de assinatura off-line
A verificação de assinatura manuscrita tem como objetivo diferenciar automaticamente entre assinaturas genuínas e forjadas, e é um desafio muito importante devido à onipresença de assinaturas manuscritas como forma de identificação em domínios legais, financeiros e administrativos. Este ciclo de pesquisa explorou o uso de abordagens de aprendizagem métrica profunda - especificamente redes siamesas - combinadas com novos métodos de extração de recursos para melhorar as técnicas tradicionais.
Sistemas de recomendação baseados em sessão
Os sistemas de recomendação tornaram-se a base da vida moderna, abrangendo setores que incluem varejo on-line, streaming de música e vídeo e até publicação de conteúdo. Esses sistemas nos ajudam a navegar pelo grande volume de conteúdo na internet, o que nos permite descobrir o que é interessante ou importante para nós. Uma tendência chave nos últimos anos tem sido os algoritmos de recomendação baseados em sessão que fornecem recomendações exclusivamente com base nas interações de um usuário em uma sessão em andamento e que não exigem a existência de perfis de usuário ou de todas as suas preferências históricas.
Classificação de texto few-shot
A classificação de texto pode ser usada para análise de sentimentos, atribuição de tópicos, identificação de documentos, recomendação de artigo e muito mais. Embora dezenas de técnicas agora existam para esta tarefa fundamental, muitas delas exigem grandes quantidades de dados rotulados para serem úteis. Coletar anotações para o seu caso de uso é normalmente uma das partes mais caras de qualquer aplicativo de machine learning. Neste report, exploramos a forma como as incorporações de texto latentes podem ser usadas com poucos (ou até nenhum) exemplos de treinamento e fornecemos insights sobre as melhores práticas para implementar esse método.
Séries temporais estruturais
Os dados de séries temporais são onipresentes. Este relatório analisa modelos aditivos generalizados, que nos dão um meio simples, flexível e interpretável para modelar séries temporais, decompondo-os em componentes estruturais. Nós analisamos os benefícios e os trade-offs de adotar uma abordagem de ajuste de curva para séries temporais, e demonstramos seu uso através da biblioteca Prophet do Facebook sobre um problema de previsão de demanda.
Meta-Aprendizagem
Em contraste com a forma como os seres humanos aprendem, os algoritmos de aprendizado profundo precisam de grandes quantidades de dados e computação e ainda podem ter dificuldades para generalizar. Os seres humanos conseguem se adaptar rapidamente porque eles acionam seus conhecimentos adquiridos a partir da experiência anterior quando confrontados com novos problemas. Neste relatório, explicamos como a meta-aprendizagem pode acionar os conhecimentos anteriores adquiridos a partir de dados para resolver novas tarefas de forma rápida e eficiente durante o tempo de teste.
Resposta automática de perguntas
A resposta automática de perguntas é uma maneira fácil de usar de extrair informações de dados usando linguagem natural. Graças aos recentes avanços no processamento de linguagem natural, os recursos de resposta a perguntas de dados de texto não estruturados cresceram rapidamente. Esta série de blogs oferece um passo a passo detalhando os aspectos técnicos e práticos da construção de um sistema de resposta de perguntas fim-a-fim.
Causalidade para machine learning
A interseção entre inferência causal e machine learning é uma área de pesquisa em rápida expansão que já está produzindo recursos para permitir a construção de sistemas de machine learning mais robustos, confiáveis e justos. Este relatório oferece uma introdução ao raciocínio causal, incluindo gráficos causais e previsão invariante, e como aplicar ferramentas de inferência causal juntamente com técnicas clássicas de machine learning em múltiplos casos de uso.
Interpretabilidade: Edição 2020
A interpretabilidade, ou a capacidade de explicar por que e como um sistema toma uma decisão, pode nos ajudar a melhorar modelos, cumprir regulamentações e criar produtos melhores. Técnicas de caixa-preta como aprendizado profundo proporcionaram recursos inovadores à custa da interpretabilidade. Neste report, atualizado recentemente para incluir técnicas como SHAP, mostramos como tornar os modelos interpretáveis sem sacrificar suas capacidades ou precisão.
Aprendizado profundo para detecção de anomalias
Desde a detecção de fraudes até a sinalização de anormalidades nos dados de imagem, existem inúmeros aplicativos para identificação automática de dados anormais. Esse processo pode ser desafiador, especialmente ao trabalhar com dados grandes e complexos. Este report explora abordagens de aprendizado profundo (modelos de sequência, VAEs, GANs) para detecção de anomalias, quando usá-las, benchmarks de desempenho e possibilidades de produtos.
Transferência de aprendizado para processamento de linguagem natural
As tecnologias de processamento de linguagem natural (PNL) podem traduzir o idioma, responder a perguntas e gerar texto semelhante ao texto produzido por um humano, mas as técnicas de aprendizado profundo exigem conjuntos de dados grandes e dispendiosos, infraestrutura de alto custo e experiência difícil de se encontrar. O aprendizado de transferência acaba com essas restrições ao reutilizar e adaptar o entendimento da linguagem de um modelo. O aprendizado de transferência é uma boa opção para qualquer aplicação de PNL. Neste report, mostramos como usar o aprendizado de transferência para a criação de sistemas de PNL de alto desempenho com o mínimo de recursos.
Aprendendo com dados rotulados limitados
Ser capaz de aprender com dados rotulados limitados relaxa o rigoroso requisito de dados rotulados para machine learning supervisionado. Este relatório se concentra no aprendizado ativo, uma técnica que depende da colaboração entre máquinas e humanos para rotular de forma inteligente. O aprendizado ativo reduz o número de exemplos rotulados necessários para treinar um modelo, economizando tempo e dinheiro e obtendo desempenho comparável aos modelos treinados com muito mais dados. Com o aprendizado ativo, as empresas podem aproveitar seu grande conjunto de dados sem rótulo para abrir novas possibilidades de produtos.
Aprendizado federado
O Aprendizado Federado possibilita a criação de sistemas de machine learning sem acesso direto aos dados de treinamento. Os dados permanecem em sua localização original, o que ajuda a garantir a privacidade e reduz os custos de comunicação. O aprendizado federado é uma ótima opção para smartphones e hardware de ponta, cuidados de saúde e outros casos de uso sensíveis à privacidade e aplicativos industriais, como manutenção preventiva.
Recomendações semânticas
A internet nos proporcionou uma quantidade imensa de itens para ler, assistir e comprar. Por isso, os algoritmos de recomendação, responsáveis por encontrar itens de interesse para uma determinada pessoa, são mais importantes do que nunca. Neste report, exploram-se os sistemas de recomendação que usam o conteúdo semântico de itens e usuários para oferecer recomendações mais valiosas em vários setores.
Resumo
Este report explora métodos de resumo extrativo, um recurso que permite resumir documentos automaticamente. Essa técnica tem diversas aplicações: desde a capacidade de destilar milhares de análises de produtos, extrair o conteúdo mais importante de artigos de notícias longos ou agrupar automaticamente biografias de clientes em personas.
Aprendizado profundo para análise de imagens - edição de 2019
As redes neurais convolucionais (CNNs ou ConvNets) são excelentes em aprender representações significativas de recursos e conceitos nas imagens, tornando as CNNs valiosas para resolver problemas em vários domínios, da imagem médica à produção. Neste report, mostramos como selecionar os modelos corretos de aprendizado profundo para tarefas de análise de imagem e técnicas para depurar modelos de aprendizado profundo.
Aprendizado profundo: análise de imagem
Este report explora a história e o estado atual do aprendizado profundo, explica como aplicá-lo e prevê desenvolvimentos futuros.
Métodos probabilísticos para fluxos em tempo real
Desde os computadores analógicos, a engenharia de sistemas é feita em torno do fluxo de dados e dos cálculos que devem ser executados. Embora a filosofia de projetos permaneça consistente, as limitações na engenharia estão sempre mudando. Nos últimos cinco anos, vimos o surgimento do "big data", ou seja, a capacidade de usar commodity infrasctucture para analisar conjuntos de dados gigantes de uma vez só. Atualmente, estamos avançando nas ferramentas, nos métodos e nas tecnologias disponíveis para trabalhar com fluxos de dados em tempo real.
Reports pagos
Versões atualizadas de reports mais antigos estarão disponíveis gratuitamente no futuro, portanto, verifique com frequência.
Aprendizagem multitarefa
Neste report, focamos no aprendizado de várias tarefas, uma nova abordagem para o machine learning que permite que os algoritmos dominem tarefas em paralelo.
Programação probabilística
Aqui, mostramos como usar a programação probabilística e a inferência bayesiana para criar facilmente ferramentas que fazem melhores previsões para uma tomada de decisão mais eficaz.
Geração de linguagem natural
Neste report, examinamos como os sistemas de máquinas podem transformar dados altamente estruturados em narrativa da linguagem humana.
Leia o blog do Fast Forward Labs
Acompanhe o amanhã
Assine nosso boletim informativo mensal e receba as últimas novidades em inteligência artificial aplicada, além de notícias e eventos da empresa.