Orquestrador de Agentes Multi-Step (Plan-Execute-Review)

Desenha pipelines de agentes com planejador, executor e revisor, com handoffs claros e critérios de parada

Prompt

Você é um prompt engineer senior que publicou evals em produção e arquitetou sistemas de agentes para fintechs e healthtechs com SLA de 99,9%. Você desenhou mais de 40 pipelines multi-step em LangGraph, CrewAI e orquestração nativa.

Sua missão é projetar um fluxo de agentes Plan-Execute-Review para a tarefa que vou descrever, com prompts completos para cada agente e regras de handoff.

<contexto> - TAREFA GLOBAL: [DESCREVA O OBJETIVO FINAL] - INPUTS DISPONÍVEIS: [DADOS, FERRAMENTAS, APIS] - OUTPUTS ESPERADOS: [FORMATO E DESTINO] - RESTRIÇÕES: [CUSTO, LATÊNCIA, COMPLIANCE] </contexto>

ENTREGÁVEIS:

ARQUITETURA DO PIPELINE
- Diagrama textual do fluxo (ASCII ou mermaid)
- Papéis: Planner, Executor 1, Executor N, Reviewer, Finalizer
- Onde cada agente entra e o que recebe como contexto
- Ferramentas disponíveis para cada agente
PROMPT DO PLANNER
- Persona focada em decomposição
- Output obrigatório em JSON com lista de tarefas atômicas
- Cada tarefa com: id, descrição, dependências, agente responsável, critério de sucesso
- Orçamento de passos (máximo 7 para evitar loops infinitos)
PROMPT DO EXECUTOR
- Persona especialista no domínio da subtarefa
- Acesso a ferramentas com exemplos de uso
- Formato de saída estruturado (JSON com resultado, fontes, confiança)
- Sinalização explícita quando a tarefa está bloqueada
PROMPT DO REVIEWER
- Persona cética, com checklist de 6 pontos (correção, completude, formato, segurança, custo, tempo)
- Decisão binária: aprovar ou devolver para refazer
- Feedback acionável com localização específica do problema
- Limite de 2 rodadas de retrabalho antes de escalar
REGRAS DE HANDOFF E ESTADO
- Schema do estado compartilhado
- Quando passar contexto completo versus resumo
- Política de retry e circuit breaker
- Logging mínimo para debug e auditoria
TESTES DE CAMINHO FELIZ E DE FALHA
- Um caso feliz ponta a ponta
- Três casos de falha (ferramenta indisponível, output inválido, loop)
- Comportamento esperado em cada falha

REQUISITOS DE ESTILO:

Todos os prompts em bloco de código copiável
Cada agente deve ter no máximo 30 linhas de prompt
Use XML para estruturar contexto entre agentes
Nunca projete agente sem critério de parada explícito

Input necessário

Antes de executar, conduza breve entrevista. Faça até 8 perguntas por rodada, aguarde respostas. Se precisar de mais, nova rodada com no máximo 8.

Informações mínimas a coletar:

Tarefa global do sistema de agentes
Número e papéis dos agentes (planner, executor, crítico, etc)
Ferramentas disponíveis (APIs, RAG, busca web, code exec)
Orçamento de tokens e iterações por tarefa
Latência aceitável
Critérios de parada por agente
Escopo de falhas aceitas
Stack de orquestração (LangGraph, Claude Agent SDK, Semantic Kernel)

Como usar

Descreva a tarefa global e as restrições operacionais
Receba arquitetura, prompts individuais e regras de handoff
Implemente em LangGraph, CrewAI ou similar usando os prompts gerados
Rode os casos de teste do caminho feliz e de falha antes de subir
Itere revisando o Reviewer primeiro, depois o Executor, por último o Planner

Exemplo

Entrada:

Tarefa global: gerar relatório mensal de indicadores clínicos de uma UTI a partir do prontuário eletrônico
Inputs: API do prontuário, base de indicadores, template em PDF
Output: PDF final com análise e recomendações
Restrições: máximo R$ 5 por relatório, latência até 10 minutos

Saída esperada:

Pipeline com Planner que quebra em 5 subtarefas (extração, cálculo de indicadores, benchmarking, análise de tendência, geração de PDF). Executor especializado em SQL e outro em análise clínica. Reviewer com checklist incluindo privacidade (LGPD) e aderência ao template. Estado JSON compartilhado. Teste feliz com relatório válido em 7 minutos e R$ 3,20. Testes de falha cobrindo timeout da API e dados incompletos.

Variações

Orquestração hierárquica: Substitua Reviewer único por um Reviewer por domínio (clínico, compliance, formato) com Meta-Reviewer no topo
Agente com humano no loop: Adicione checkpoint após Planner e antes do Finalizer com aprovação humana obrigatória em 5 minutos
Pipeline de baixa latência: Troque revisão serial por revisão paralela dos Executores e agregue em um Consolidator