Dataset	Identificador	Tipo	Total
OAB Bench	`maritaca-ai/oab-bench`	Questões Abertas	210 questões
OAB Exams	`eduagarcia/oab_exams`	Múltipla Escolha	2.210 questões

Nível	Nome técnico	Critérios
1	Recuperação factual direta	Memorização de artigo de lei ou conceito exato
2	Raciocínio lógico-dedutivo	Caso concreto + aplicação de regra clara
3	Hermenêutica jurídica complexa	Interpretação profunda, cruzamento de leis

CURADORIA: LEGISLAÇÃO BASE E ÁREA DE EXPERTISE

Identifica a principal referência normativa associada à questão:

Ex: Constituição Federal, Art. 5º, Código Penal, Art. 121, Lei nº 14.133/2021

Identifica a área do direito relacionada à questão:

{
  "difficulty_question": 2,
  "basic_legislation": "Constituição Federal, Art. 71, III",
  "area_expertise": "Direito Administrativo"
}

#	Operação	Saída
1	Resposta à questão	Texto discursivo ou letra (A–D)
2	Classificação de dificuldade	Valor 1, 2 ou 3
3	Identificação de legislação	Referência normativa principal
4	Identificação da área	Área de expertise jurídica

Métrica	O que mede	Escala
BLEU	Sobreposição de n-gramas (precisão lexical)	0 a 1
ROUGE-1	Sobreposição de unigramas (cobertura vocabular)	0 a 1
ROUGE-2	Sobreposição de bigramas (estrutura local)	0 a 1
ROUGE-L	Maior subsequência comum (estrutura global)	0 a 1
BERTScore F1	Similaridade semântica via embeddings contextuais	0 a 1

Métrica	O que mede
Acurácia	Proporção de respostas corretas sobre o total
Precisão	Quantas vezes o modelo acertou ao escolher uma alternativa
Recall	Quantas questões da classe correta foram identificadas
F1-Score	Média harmônica entre precisão e recall

Atividade 01

Curadoria de Datasets e Inferência Básica com LLMs