GPT 4 e seus avanços em relação ao GPT 3

Baculino16 de março de 2023

0 58 7 minutos de leitura

O campo de processamento de linguagem originário testemunhou avanços notáveis ao longo dos anos, com o desenvolvimento de modelos de linguagem de ponta, porquê o GPT-3 e o recente lançamento do GPT-4. Esses modelos revolucionaram a forma porquê interagimos com a linguagem e abriram novas possibilidades de aplicações em vários domínios, incluindo chatbots, assistentes virtuais e geração automatizada de teor.

O que é GPT?

GPT é um protótipo de processamento de linguagem originário (NLP) desenvolvido pela OpenAI que utiliza o protótipo transformador. O Transformer é um tipo de protótipo de Deep Learning, mais publicado por sua capacidade de processar dados sequenciais, porquê texto, atendendo a diferentes partes da sequência de ingressão e usando essas informações para gerar representações do texto com reconhecimento de contexto.

O que torna os transformadores especiais é que eles podem entender o significado do texto, em vez de unicamente reconhecer padrões nas palavras. Eles podem fazer isso “prestando atenção” a diferentes partes do texto e descobrindo quais partes são mais importantes para entender o significado do todo.

Por exemplo, imagine que você está lendo um livro e se depara com a frase “O gato sentou no tapete”. Um transformador seria capaz de entender que esta frase é sobre um gato e uma esteira e que o gato está sentado na esteira. Também seria capaz de usar esse entendimento para gerar novas frases relacionadas à original.

O GPT é pré-treinado em um grande conjunto de dados, que consiste em:

Uma vez que foi treinado em grandes quantidades de texto da Internet e de outras fontes, porquê livros e artigos, ele usa esse conhecimento para gerar um novo texto que parece ter sido escrito por um humano. Por exemplo, você poderia dar ao GPT um prompt porquê “Escreva um raconto sobre um gato e um rato que se tornam amigos”, e isso geraria uma história única com base no que aprendeu com o texto em que foi treinado. Essa tecnologia tem muitas aplicações potenciais, porquê geração automatizada de teor, chatbots e assistentes virtuais.

No universal, o GPT é uma instrumento impressionante que tem o potencial de transformar a forma porquê interagimos com os computadores e tornar nossas interações com eles mais naturais e intuitivas.

Visão universal da arquitetura GPT

A arquitetura GPT consiste em uma série de camadas, incluindo

uma classe de ingressão/incorporação,
- que converte a ingressão (sequência de tokens) em incorporações
múltiplos transformadores/blocos de atenção
- para processar a ingressão e gerar uma representação contextual da ingressão.
uma classe de saída/classificadora.
- que gera uma distribuição de verosimilhança sobre os possíveis próximos tokens na sequência.
O protótipo pode portanto usar essa distribuição de verosimilhança para gerar texto por amostragem a partir dele.