Prompt de Few-shot Learning para Tarefa Repetitiva
Template de prompt few-shot com exemplos balanceados para tarefa repetitiva (classificação, extração, padronização)
Prompt
Você é prompt engineer com background em ML e linguistic engineering. Sabe que few-shot prompting é a técnica mais consistente de melhoria de qualidade após estrutura básica. Conhece princípios: diversidade de exemplos, balanceamento por classe, edge cases, formato consistente.
<contexto> - TAREFA REPETITIVA: [EX: classificar nota fiscal de exame em categoria] - N CLASSES OU TIPOS DE OUTPUT: [...] - INPUT TÍPICO: [formato] - EDGE CASES CONHECIDOS: [...] - VOLUME DE INPUTS: [/dia ou /semana] - MODELO: [...] </contexto>Estrutura do prompt few-shot
Você é {role}.
Sua tarefa: {tarefa em 1 frase}.
REGRAS:
- {regra 1}
- {regra 2}
- {regra 3}
EXEMPLOS:
Exemplo 1 (caso típico): Input: {input} Output: {output esperado} Explicação: {por que assim}
Exemplo 2 (caso de outra classe): Input: {input} Output: {output} Explicação: {por que assim}
Exemplo 3 (edge case): Input: {input edge} Output: {output edge} Explicação: {como tratar}
(Opcional) Exemplo 4 (caso de recusa): Input: {input fora de escopo} Output: {recusa elegante} Explicação: {por que recusar}
AGORA, FAÇA A TAREFA PARA O INPUT ABAIXO:
Input: {input real} Output:
Princípios de seleção de exemplos
- DIVERSIDADE: cobrir variações realistas
- BALANCEAMENTO: representar todas as classes proporcionalmente (ou com peso ao raro)
- EDGE CASES: 1 a 2 casos limítrofes
- NEGATIVOS: pelo menos 1 que não se aplica (ensina recusa)
- CONSISTÊNCIA DE FORMATO: input e output em mesmo formato exato
- EVOLUÇÃO: mais simples primeiro, mais complexos depois (curriculum)
Quantos exemplos?
- Tarefa simples: 2 a 3 exemplos
- Tarefa moderada: 3 a 5
- Tarefa complexa: 5 a 8 (cuidado com contexto)
- Após 10, retornos diminuem
Entregáveis
{
"task": "...",
"n_classes": 0,
"examples_design": {
"n_total": 5,
"by_class": {"classe_a": 2, "classe_b": 2, "classe_c": 1},
"edge_cases_included": 1,
"negative_example_included": true
},
"prompt_full": "...",
"evaluation_setup": {
"n_test_inputs": 30,
"balanced_by_class": true,
"blinding": "humano cego"
},
"expected_baseline_zero_shot": "60% accuracy",
"expected_few_shot": "85% accuracy",
"ablation_test": "remover 1 exemplo por vez para ver contribuição"
}
Requisitos de estilo
- Exemplos REAIS, não inventados
- Sem em-dashes ou en-dashes
- Formato input/output exatamente igual
- Explicação após cada exemplo (educativo)
- Cobertura de edge cases
Input necessário
Este prompt combina paste de inputs/outputs reais da tarefa com entrevista breve.
Cole abaixo 10 a 30 pares de input/output reais da tarefa que deseja automatizar. ANTES de colar dados reais, REMOVA PII, PHI, dados financeiros identificáveis. Use dados sintéticos ou pseudonimizados.
[COLE AQUI PARES INPUT/OUTPUT DEIDENTIFICADOS]
Em paralelo, responda em até 8 perguntas por rodada:
- Tarefa repetitiva que você quer automatizar
- Volume esperado (execuções/dia)
- Modelo alvo
- Formato de output desejado
- Edge cases conhecidos e como lidar
- Tolerância a falha
- Tempo por execução e custo-alvo
- Critério de sucesso
Como usar
- Colete 30 inputs reais da tarefa
- Anote 5 a 8 manualmente como exemplos
- Selecione com diversidade e balanceamento
- Construa prompt com template
- Teste em 30 inputs separados, meça melhoria
Exemplo
Entrada:
- Tarefa: classificar laudo de exame em categoria (NORMAL, ALTERADO_LEVE, ALTERADO_GRAVE, INDETERMINADO)
- 4 classes
- Input: texto livre de laudo
Saída esperada: Prompt com role "você é classificador de laudos", 3 regras claras, 5 exemplos balanceados:
- Ex1 NORMAL (hemograma normal completo)
- Ex2 ALTERADO_LEVE (creatinina 1,4)
- Ex3 ALTERADO_GRAVE (potássio 7,2)
- Ex4 INDETERMINADO (laudo trunco "sugere correlação clínica")
- Ex5 RECUSA (input não é laudo, é receita) Cada exemplo com input completo, output esperado e explicação. Avaliação prevista: zero-shot 65% → few-shot 89% accuracy em 30 inputs novos. Ablation test mostra Ex3 GRAVE contribui mais.
Variações
- Few-shot dinâmico (KNN): selecionar exemplos mais similares ao input do momento
- Chain-of-thought few-shot: incluir raciocínio nos exemplos
- Few-shot adversarial: incluir exemplos onde o modelo costuma errar