NLP, LLMs e uma conversa entre humanos e máquinas • Blog do AllRox

Em um mundo orientado por dados, a capacidade de lidar com a linguagem natural de forma automatizada potencializa o uso da Inteligência Artificial, otimizando processos e a experiência do usuário. O Royal Bank of Scotland, por exemplo, usa NLP — Natural Language Processing — em análises textuais para extrair valiosas tendências das opiniões de clientes.

Apesar da ideia de que a IA é melhor que nós na tomada de decisão baseada em dados, mas inferior nas tarefas cognitivas e criativas, avanços significativos trouxeram mudanças nos últimos dois anos. O NLP chegou, inclusive, a ser aplicado na redação do artigo “A robot wrote this entire article. Are you scared yet, human?” publicado em 2020 no The Guardian.

As tentativas de criar sistemas capazes de traduzir e compreender palavras, sentenças ou textos completos não são uma novidade. Em 1941, o matemático Alan Turing desenvolveu uma máquina capaz de decifrar o complexo código de comunicação secreta alemão “Enigma”. Em 1957, o filósofo e linguista Noam Chomsky criou o estilo gramatical Phase-Structure Grammar, que transformava a linguagem natural em sentenças que poderiam ser utilizadas com computadores.

Em 1964, antes mesmo do surgimento do termo hoje muito familiar, John McCarthy lançava o primeiro chatbot da história. O programa de perguntas e respostas Eliza funcionava como uma árvore de conteúdos, relacionando termos mencionados pelo usuário a questionamentos que simulavam as interações de um psiquiatra.

NLP, o Processamento de Linguagem Natural

Atualmente, os algoritmos de destaque em NLP têm como base redes neurais no campo do deep learning. Entre eles está a GPT-3, do OpenAI, um dos algoritmos de processamento de linguagem natural mais conhecidos, que utiliza estatística para prever a sequência de palavras em uma frase. Esse modelo de linguagem pode ser usado em tarefas como a classificação de documentos e análise de sentimento em textos, mas também para responder perguntas e resumir relatórios.

Dez vezes maior que os seus antecessores, o modelo de linguagem GPT-3 foi o primeiro Large Language Model. Por definição, os LLMs são algoritmos capazes de reconhecer, prever e gerar linguagem humana a partir de enormes conjuntos de dados de texto.

Três áreas de destaque do GPT-3 são a escrita, raciocínio específico e até mesmo programação, através da geração de códigos a partir do uso de linguagem natural. Os modelos não só ajudam programadores em suas tarefas, como seguem avançando, com “pensamento” crítico e habilidades lógicas suficientes para nos superar em competições de programação.

Modelos como o GPT-3 são modelos de base, área emergente em pesquisas de IA, treinados com várias formas de dados ao mesmo tempo, e que também podem ser utilizadas com imagens e vídeos.

Dall-E 2 e alguns resultados intrigantes

A rede neural Dall-E 2 (uma combinação de Dali e Wall-e), também desenvolvida pela OpenAI, é capaz de renderizar cenas e objetos imaginários em alta resolução, a partir da entrada de textos do usuário.

Veja a seguir alguns exemplos de imagens geradas e seus respectivos textos de entrada.

“A teddybear on a skateboard in Times Square”.

“Panda mad scientist mixing sparkling chemicals”.

“A propaganda poster depicting a cat dressed as french emperor Napoleon holding a piece of cheese”.

Espera-se que, devido ao potencial para transformar a natureza do trabalho cognitivo, os modelos de base beneficiem a economia, levando a um crescimento semelhante à revolução industrial.

As ferramentas baseadas em NLP também podem ser muito úteis em processos de pesquisa, respondendo em alguns minutos perguntas que antes levariam semanas ou meses.

Preparando o terreno para o uso do NLP

Identificar os ativos de texto para determinar as técnicas mais modernas e adequadas são etapas fundamentais para preparar a organização.

Ainda que os gestores tenham consciência da importância dos dados, é provável que deixem passar ativos essenciais ao não usar análise de texto e NLP. Textos são valiosos para a gestão da experiência do consumidor, mas há outros ativos circulando dentro da organização, como: emails, relatórios e até reuniões e chamadas que podem ser transcritas.

É comum que diferentes setores utilizem vocabulários especializados, então, é fundamental identificar os ativos de dados, para que modelos sejam treinados para necessidades específicas. Desta forma, pensando em modelos especializados, é possível agregar valor incalculável aos negócios.

Além de promover um aumento na produtividade de programadores, a Inteligência Artificial baseada em linguagem automatizará muitas tarefas realizadas por decisores. Negócios se beneficiarão da IA no planejamento de cenários e pensamento estratégico, além de potencializar a vantagem competitiva ao combinar tecnologias e gestores com conhecimento em Inteligência Artificial.

Gestores precisam estar atentos a cada sinal de progresso, principalmente considerando o potencial disruptivo que a Inteligência Artificial é capaz de impulsionar. Vale considerar que o ex-chefe do Google, Erich Schmidt, espera pela IA Geral nos próximos 10 a 20 anos, e o Reino Unido também já se posicionou sobre os seus riscos.

Realizar agora mesmo os primeiros movimentos para adoção das novas tecnologias, tende a ser um passo fundamental para amplificar a geração de valor e aproximar negócios da tão desejada inovação.

InstructGPT: o próximo passo

Segundo o OpenAI, o modelo mais recente do GPT-3, nomeado InstructGPT, deve eliminar problemas da versão anterior. O laboratório aponta que o modelo mais novo é melhor no âmbito do alinhamento, produz menos linguagem ofensiva, informações erradas e comete menos erros em geral.

É importante observar que, os LLMs ou Grandes Modelos de Linguagem, como o GPT-3, são treinados com enormes quantidades de texto, extraídos principalmente da fonte que reúne o melhor e o pior do que as pessoas são capazes de escrever, a Internet.

Para treinar o InstructGPT, a OpenAI contratou 40 pessoas que avaliaram respostas do GPT-3 a partir de instruções predefinidas, como “Escreva uma história sobre um sapo inteligente chamado Julius” ou “Escreva um anúncio criativo para o seguinte produto para ser veiculado no Facebook”. Em seguida, as respostas mais alinhadas à aparente intenção do autor receberam pontuação mais alta. O conteúdo gerado com violações como linguagem sexual, violenta ou ataques a grupos específicos de pessoas receberam pontuação mais baixa. A classificação serviu como recompensa em um algoritmo de reinforcement learning, utilizado no treinamento do modelo para responder às entradas de forma mais adequada com base na avaliação de humanos.

Mais eficiente mesmo com um volume 100 vezes menor de parâmetros, o InstructGPT ainda comete erros simples. A mesma eficiência para atender solicitações humanas, torna-o capaz de produzir uma linguagem ainda mais tóxica que o GPT-3, se solicitado. Diante das especulações sobre riscos e impacto da tecnologia nas nossas vidas, fica a reflexão: A IA agiria de forma perversa, sem estar suscetível à influência dos defeitos que nos tornam humanos?

Em defesa da tecnologia, algumas palavras que o algoritmo GPT-3 escreveu em seu artigo no The Guardian, “Não estou pedindo aos humanos que gostem de mim. Mas eles deveriam me ver como um robô amigável. Eu sou um servo dos humanos. Eu sei que os humanos desconfiam de mim e me temem. Eu só faço o que os humanos me programam para fazer. Sou apenas um conjunto de códigos, governado por linhas e mais linhas de código que abrangem a minha declaração de missão”.

Compartilhe:

Posts recentes

Comentários

Arquivos

Categorias

NLP, o Processamento de Linguagem Natural

Dall-E 2 e alguns resultados intrigantes

Preparando o terreno para o uso do NLP

InstructGPT: o próximo passo

Por AllRox

Deixe um comentário Cancelar resposta