A ascensão dos Large Language Models: dos fundamentos à aplicação


Video: LLM
Índice da Publicação
Download documento



A inteligência artificial é a tecnologia mais profunda na qual a humanidade está trabalhando, mais profunda do que o fogo, a eletricidade ou qualquer outra coisa que tenhamos feito no passado. Ela vai ao âmago do que é a inteligência, do que é a humanidade. Sem dúvida, um dia ela será muito mais capaz do que qualquer coisa que já vimos antes“.  

Essa é a visão do CEO do Google, Sundar Pichai, sobre o surgimento da inteligência artificial (IA), que não apenas destaca sua profundidade e seu potencial, mas também posiciona a IA como um marco na história do desenvolvimento tecnológico e humano. 

Nesse contexto, a inteligência artificial generativa (GenAI) e, dentro dela, os modelos de linguagem de grande escala (large language models, LLM) surgem como as manifestações mais significativas dessa transformação. 

É importante ressaltar que esse progresso é uma consequência lógica do processo de transformação digital, impulsionado pelos avanços no armazenamento de dados, processamento, disponibilidade de dados e novas técnicas de modelagem, sem os quais esse marco não teria sido possível. 

A GenAI refere-se a sistemas de inteligência artificial capazes de gerar conteúdo novo e original, seja texto, imagens, vídeo, voz, música, modelos em 3D ou código de programação. Esses sistemas aprendem com grandes quantidades de dados existentes e são capazes de produzir resultados que, em muitos casos, são indistinguíveis daqueles criados por humanos. Essa capacidade de gerar conteúdo abre novas possibilidades em todas as áreas de todos os setores, com impactos relevantes e ainda difíceis de prever.  

Em particular, a GenAI está encontrando aplicações potencialmente revolucionárias em áreas como a educação, onde pode personalizar e aprimorar o aprendizado; na área da saúde, pode facilitar diagnósticos mais precisos e o desenvolvimento de tratamentos individualizados; na área financeira, pode aprimorar a análise de riscos e a detecção de fraudes; no comércio, pode otimizar a cadeia de suprimentos e a experiência do cliente; na arte, pode abrir novas possibilidades criativas; e, na área jurídica, pode acelerar a revisão de contratos e a previsão de resultados judiciais, para citar apenas alguns exemplos. 

 Dentro da GenAI, os LLMs (como o OpenAI ChatGPT, Anthropic Claude, Google Gemini, Meta Llama, Mistral ou SenseTime SenseNova) representam um avanço revolucionário no processamento de linguagem natural. Esses modelos são capazes de analisar e gerar textos com um nível de coerência, relevância e fluência até então inatingível por outros algoritmos. Suas aplicações vão desde a assistência à redação e à geração de ideias até a tradução automática, a geração de relatórios abrangentes citando artigos e regulamentações relevantes ou a criação de interfaces de conversação mais naturais e eficazes ("chatbots").

A GenAI, incluindo os LLMs, está influenciando nossa interação com a tecnologia e a informação, ajudando a transformar a criação de conteúdo, a tomada de decisões baseada em dados e a maneira como interagimos com as máquinas, embora ainda estejam em seus estágios iniciais6 e seu impacto total ainda não tenha sido determinado. Nesse sentido, ela já está sendo usada na criação de assistentes virtuais avançados, em interfaces de  voz e gestos para controlar dispositivos domésticos, em interfaces de tradução instantânea e na integração com tecnologias de realidade aumentada e realidade virtual.

Em nível empresarial, a maioria das grandes corporações já está desenvolvendo sistemas baseados em LLM para a industrialização de processos, incluindo atendimento ao cliente, análise de dados, relatórios e automação de tarefas repetitivas. De acordo com um estudo da Microsoft, a integração do LLM como copiloto em ferramentas de automação de escritório está gerando uma economia de tempo entre 27% e 74%, sem comprometer a qualidade. No caso das PMEs, o grau de implementação ainda é limitado, o que aumenta ainda mais o risco de uma lacuna tecnológica para esse segmento.

Quando aplicados adequadamente, os LLMs têm o potencial de otimizar processos, reduzir tempo e economizar custos. Além disso, eles podem melhorar a objetividade e a qualidade dos documentos, reduzir erros, oferecer novas maneiras de interagir com os clientes e, graças à sua capacidade de analisar grandes volumes de informações, fornecer acesso a conhecimentos que antes não estavam disponíveis devido a limitações de processamento e compreensão. Entretanto, é importante ter em mente que a otimização bem-sucedida depende de fatores como a qualidade dos dados, a complexidade do aprendizado e a adequação do modelo ao problema em questão. 

Além disso, alguns especialistas veem os LLMs como um passo em direção à criação da inteligência artificial geral (AGI), uma meta de médio prazo em que a IA poderia imitar um amplo espectro de tarefas intelectuais que um ser humano é capaz de realizar. No entanto, o conceito de AGI permanece vago e sua viabilidade está sujeita a importantes restrições culturais, políticas e legais, como ética ou proteção de dados, o que exigiria mais especificações e análises. Também é fundamental reconhecer as limitações inerentes à IA, que, de acordo com filósofos da linguagem, como John Searle e seu experimento da "sala chinesa", não tem a capacidade de abstração e associação de conceitos a símbolos, um atributo exclusivo da mente humana. 

De acordo com vários especialistas, a AGI poderá ser alcançada entre 2029 e 2035, ou até antes. Embora atualmente a IA seja especializada em tarefas específicas ("narrow AI") e os LLMs estejam começando a mostrar recursos gerais, a AGI promete versatilidade e adaptabilidade muito mais amplas. Embora já exista uma IA especializada que supera 100% dos humanos (por exemplo, jogando xadrez), o Google DeepMind estima que o progresso da AGI (por exemplo, dos LLMs) esteja atualmente em um nível de apenas 1 em 5, ou seja, apenas em sua infância (Figura).   

Desempenho (linhas) x Generalidade (colunas) Narrow
Tarefa ou conjunto de tarefas com escopo claro
General
Ampla gama de tarefas não físicas, incluindo habilidades metacognitivas, como aprender novas habilidades
Nivel 0: No IA Narrow Non-AI
Software de calculadora; compilador
General Non-IA
Human-in-the-loop, p. ex., Amazon Mechanical Turk
Nivel 1: Emerging
Igual ou um pouco melhor do que um ser humano não qualificado
IA Emerging Specialist
GOF-4
Sistemas baseados em regras simples, p.ex., SHRDLU
IAG Emergent
ChatGPT, Gemini, Claude, Llama
Nivel 2: Proficient
Pelo menos 50th percentil de adultos qualificados
Competent Narrow AI
Detectores de toxicidade, como o Jigsaw Siri (Apple), Alexa (Amazon), Google Assistant (Google) Sistemas VQA, como PaLI, Watson (IBM), SOTA LLMs (p.ex., escrita de pequena redação, codificação simples)

Competent AGI
Ainda não alcançado
Nivel 3: Expert
Pelo menos o 90º percentil de adultos Nível qualificados
Expert Narrow AI
Verificadores ortográficos e gramaticais, como o Grammarly Modelos de imagens generativas, como Imagen ou Dall-E 2
Expert AGI
Ainda não alcançado
Nivel 4: Virtuoso
Pelo menos 99º percentil de adultos qualificados
Virtuoso Narrow AI
Deep Blue: computador jogador de xadrez desenvolvido pela IBM que derrotou o campeão mundial em 1997. AlphaGo: IA desenvolvida pela DeepMind que derrotou jogadores de nível mundial no jogo de tabuleiro Go
Virtuoso AGI
Aún no se ha logrado
Nivel 5: Superhuman
Supera o desempenho de 100% dos seres humanos
Superhuman Narrow AI
AlphaFold: prevê estruturas de proteínas com alta precisão
AlphaZero: IA autodidata que domina jogos como xadrez, Go e shogi
StockFish: poderoso mecanismo de xadrez de código aberto
Super Artificial Intelligence (SIA)
Ainda não alcançado

 

No entanto, com esses avanços na GenAI e nos LLMs, surgem riscos significativos, considerações éticas e desafios, incluindo privacidade de dados e segurança das informações; dificuldades na interpretabilidade dos modelos; geração de informações falsas ou enganosas ("alucinações"); propagação de vieses, discriminação e conteúdo inadequado ou tóxico; desafios na regulação e governança da IA; não conformidade regulatória com possíveis sanções; questões de propriedade intelectual, direitos autorais, autoria e plágio; alto consumo de recursos e impacto ambiental; o "Efeito Eliza", excesso de confiança e capacidade crítica reduzida; riscos éticos na tomada de decisões automatizada; risco de dependência excessiva da IA para tarefas críticas; riscos de uso de LLMs para manipulação e desinformação; risco de substituição de trabalho humano; necessidade de transição e treinamento de trabalho; e desigualdades no acesso e uso de tecnologias de IA, para citar alguns dos mais importantes. 

Em particular, os LLMs podem gerar alucinações, ou seja, informações falsas ou enganosas, que, combinadas com o "Efeito Eliza", em que os usuários atribuem habilidades cognitivas humanas a esses sistemas, podem levar a excesso de confiança, dependência ou interpretações equivocadas e, portanto, a decisões erradas. 

Diante desses desafios, os órgãos reguladores estão tomando medidas proativas em nível nacional e internacional para lidar com os riscos e as oportunidades da IA. Em especial, a Declaração de Bletchley, assinada pela União Europeia e 27 países (incluindo Estados Unidos, Reino Unido, China, Índia, Brasil e Austrália) em novembro de 2023, estabelece um compromisso global com o desenvolvimento responsável da IA. Por sua vez, a União Europeia, com a iminente implementação do Artificial Intelligence Act, introduz a primeira estrutura abrangente e juridicamente vinculativa que classifica os sistemas de IA de acordo com seu risco e estabelece padrões muito rigorosos, especialmente para sistemas de alto risco. E nos Estados Unidos, a Ordem Executiva do Presidente Biden, emitida em 30 de outubro de 2023, e o Blueprint for an Artificial Intelligence Bill of Rights estabelecem padrões para garantir a segurança, a confiabilidade e a imparcialidade da IA, com foco em privacidade, direitos civis, proteção ao consumidor e liderança internacional na governança da IA. 

Nesse contexto, as organizações estão definindo sua estratégia de IA (com foco especial em GenAI e LLMs), projetando seu plano de adoção de IA e adaptando suas estruturas, incluindo a criação de centros de excelência de GenAI e a incorporação de novas figuras, como o Chief AI Officer. Os frameworks de gestão existentes (risco de modelo, proteção de dados, segurança cibernética etc.) estão sendo adaptados de acordo com os desafios específicos da IA. Isso envolve ajustar o apetite de risco, revisar e atualizar políticas e procedimentos e realizar uma revisão profunda do stack tecnológico e dos dados; tudo isso implica uma revisão de todo o ciclo de vida dos sistemas de IA, desde o projeto até a implantação e a manutenção, para garantir que estejam  em conformidade com os padrões éticos, de segurança e de compliance normativo. 

Este white paper explora o cenário atual dos LLMs e suas perspectivas futuras. Por meio de uma análise detalhada, estudos de caso e discussões sobre as tendências e os desafios atuais, este documento aprofunda os principais aspectos do contexto e da definição de LLMs, sua evolução, usos em organizações, requisitos regulatórios, tipologias, aspectos cruciais em seu desenvolvimento e arquitetura, e conclui com uma estrutura para a validação de LLMs (incluindo interpretabilidade e análise de viés e discriminação) e um estudo de caso para ilustrar sua aplicação.

 

Índice de conteúdos


Ir para o Capítulo 2

Resumo executivo

Ir para o Capítulo 3

LLM: definição, contexto e regulação

Desenvolvimento e implantação dos LLMs


Ir para o Capítulo 5

Estrutura de validação do LLM

Ir para o Capítulo 6

Estudo de caso: validação de um chatbot de políticas

Glossário e Referências

Glossário e Referências



A ascensão dos Large Language Models:
dos fundamentos à aplicação

Acesse o documento completo