ChatGPT e Proteção de Dados
Álvaro Justen
OAB-RS (online)
18 de abril de 2023
$ whoami
Sigam-me os bons:
## Agenda
- Grandes modelos de linguagem (LLM)
- Aplicações no Direito
- Possíveis problemas
- Dúvidas/discussão
## Machine Learning - aplicações
- Sistemas de recomendação
- Detecção de fraude
- Diagnósticos médicos por imagem
- Transcrição de áudio
- Classificação de imagens
- Assistentes pessoais
## Processamento de Linguagem Natural (PLN/NLP)
- Identificação de entidades nomeadas (NER)
- Classificação
- Análise de sentimento
- Tradução
- Sumarização
- Perguntas e respostas
- Geração de texto
## Grandes modelos de linguagem (LLM)
- Modelos "genéricos"
- Capacidade de "raciocinar"
- Escala gigantesca:
- Treinado com bilhões de palavras
- Milhares de computadores
- "Papagaios estocásticos"
## ChatGPT
- Criado pela OpenAI
- 1 milhão de usuários em 5 dias
- Mais de 100 milhões de usuários
- Interface amigável
- Versão gratuita
- Acessível por API
Bate-papo
Pedido de Acesso - CNPJ
Extração de entidades nomeadas: leis
Liste as leis citadas no texto abaixo:
Extração de entidades nomeadas: órgãos
Liste os órgãos públicos e empresas citados no texto abaixo:
Extração de entidades nomeadas: órgãos (prompt melhorado)
Liste os órgãos públicos e empresas citados no texto abaixo (não inclua leis ou decretos):
Sumarização
Crie um título e um resumo de um parágrafo para o texto abaixo:
Sumarização/resumo: prompt
Sumarização/resumo: resposta
Geração de contratos: prompt
Geração de contratos: resultado
Geração de contratos: resultado [2]
Geração de contratos: resultado [3]
Geração de contratos: resultado [4]
Geração de código
Perguntas contextuais
Perguntas contextuais [2]
Perguntas a textos
Dado o texto abaixo, me responda: quais ilegalidades a Receita Federal comete ao não abrir a base de dados do CNPJ?
Perguntas a textos [2]
Geração de textos: prompt
Geração de textos: resposta
Tradução
Tradução [2]
Riscos de LLM
Alucinação