O Laboratório
Por que estes modelos?
Foco em modelos de pequeno porte que rodam em hardware local sem necessidade de nuvem.
Garantia de privacidade para dados jurídicos sensíveis ao evitar APIs de terceiros.
Exploração de diferentes arquiteturas (Meta, Google, Alibaba) para o português.
Catálogo Técnico
| Modelo | Parâmetros | Tamanho (Quant) |
|---|---|---|
| Llama 3.2 | 3 Billion | ~2.0 GB (Q4_K_M) |
| Gemma 2 | 2 Billion | ~1.6 GB (Q4_K_M) |
| Qwen 2.5 | 3 Billion | ~1.9 GB (Q4_K_M) |
Perfis dos Modelos
Llama 3.2
"O Sucessor"
Baseado na renomada arquitetura da Meta, o Llama 3.2 herda o vasto conhecimento de seus predecessores, adaptado para dispositivos móveis e locais. No contexto jurídico, destaca-se pela robustez no raciocínio lógico e aderência a instruções complexas.
Gemma 2
"O Peso-Leve de Elite"
Nascido da tecnologia do Google Gemini, o Gemma 2 é otimizado para velocidade sem sacrificar a precisão. É a escolha ideal para extração rápida de entidades e classificação de documentos em ambientes onde cada segundo de latência conta.
Qwen 2.5
"Especialista Multilíngue"
Vindo do ecossistema Alibaba, o Qwen demonstra uma compreensão excepcional de nuances culturais e gramaticais. Em testes jurídicos em português, revela-se surpreendente na coesão textual e na tradução de conceitos técnicos.
