B2B

600 Mil Questões por Mês: o Volume Vivo que Calibra a Régua

Os alunos das 8 IES parceiras respondem 600 mil questões por mês em condição real de prova. É esse volume que separa medir de opinar.

Por Dr. Matheus Ferreira, CRM-SP 206.304

Atualizado em 02 de julho de 2026

Publicado em 02 de julho de 202612 min de leitura

Os alunos das 8 IES parceiras do SPR Med respondem, juntos, 600 mil questões por mês em condição real de prova. Esse volume alimenta um banco de 266.177 questões tagueadas na Matriz Pedagógica 7D e já ultrapassou 3 milhões de respostas registradas, a base estatística que permite ao motor M.A.E.S.T.R.O estimar dificuldade real de cada item pelo modelo de Rasch (TRI 1PL) e não por opinião de banca. É esse volume vivo, atualizado mês a mês, que separa medir proficiência de simplesmente opinar sobre ela.

Para coordenadores de curso, NDE e diretores acadêmicos que respondem por indicadores de qualidade junto ao MEC, a distinção entre calibração estatística e calibração por opinião deixou de ser uma nuance técnica. Ela é o que determina se o diagnóstico de proficiência da sua instituição de ensino tem valor preditivo real diante do ENAMED, ou se é apenas mais um simulado com aparência de rigor.

Por Que a Calibração TRI Exige Volume Vivo de Respostas?

A Teoria de Resposta ao Item (TRI), modelo de Rasch 1PL adotado pelo INEP para calibrar o ENAMED, exige volume amostral robusto para estimar com precisão o parâmetro de dificuldade (b) de cada questão. Sem esse volume, a dificuldade de um item é uma estimativa frágil, sujeita a distorção por características isoladas da turma que respondeu. Com 3 milhões ou mais de respostas acumuladas e 600 mil novas respostas por mês, o SPR Med recalibra continuamente cada item do banco de 266.177 questões, mantendo a régua atualizada e sensível a mudanças de padrão nas edições recentes do INEP.

O contraste é direto. Um banco de questões "calibrado por opinião" atribui dificuldade a partir do julgamento de um professor ou de uma banca, sem base amostral. Duas questões sobre HAS (Hipertensão Arterial Sistêmica, tema #2 no radar de predição SPR Med, presente em 87% de probabilidade e confirmado com 1 questão no REVALIDA 2026.1) podem parecer igualmente difíceis a um docente experiente, mas gerar taxas de acerto muito diferentes entre alunos reais. Só o volume de respostas revela essa diferença e permite ajustar o parâmetro b com confiabilidade estatística.

Modelo de calibração	Base de dados	Método	Sensibilidade a mudanças de prova
Calibração por opinião de banca	Nenhuma base amostral sistemática	Julgamento qualitativo de docentes	Baixa, dependente de percepção individual
Calibração TRI com volume vivo (SPR Med)	3 milhões+ de respostas, 600 mil/mês	Rasch 1PL, retreino periódico, validação contra b oficial do INEP	Alta, recalibra a cada ciclo de simulado

Essa validação não é teórica. No confronto direto entre o banco SPR Med e as 100 questões reais do REVALIDA 2026.1, foram encontrados equivalentes diretos (mesmo caso clínico ou mesma conduta) para 74 delas, sendo 3 quase idênticas, 27 do mesmo caso clínico e 173 pares de mesmo conceito entre as 1.942 questões inéditas comparadas. A metodologia combinou juiz de IA com pontuação de 0 a 100, embeddings para proximidade semântica e sobreposição textual, com termos e condutas em comum grifados par a par. Não é coincidência: é blueprint. Ambos os exames, REVALIDA e ENAMED, são ancorados na mesma Matriz de Referência Comum definida pela Portaria INEP 478/2025, com as mesmas 15 competências, 21 domínios e 7 áreas de formação.

Qual o Impacto Regulatório de uma Calibração Frágil?

Cursos com calibração frágil de proficiência chegam à prova real sem saber onde estão. O ENAMED 2025 revelou que 107 dos 351 cursos avaliados receberam conceito 1 ou 2, sanções que incluem suspensão de vestibular, redução de vagas e supervisão direta do MEC (Fonte: INEP, 2025). Em março de 2026, as Portarias 72, 73 e 74 da Seres/MEC colocaram 99 cursos sob supervisão, sendo 8 com suspensão total de ingresso, 13 com corte de 50% das vagas, 33 com corte de 25% e 45 impedidos de ampliar vagas. Esses números não decorrem de má-fé institucional, mas de gestão sem instrumento de medição confiável.

A régua de conceito do ENAMED segue faixas objetivas de proficiência: conceito 1 corresponde a até 39,9% de proficientes, conceito 2 vai de 40% a 59,9%, conceito 3 de 60% a 74,9%, conceito 4 de 75% a 89,9% e conceito 5 exige 90% ou mais. Com a MP 1.370/2026 transformando o ENAMED em exame semestral e criando a segunda etapa como gate individual de registro no CRM para quem ingressou a partir de 19 de junho de 2026, a urgência deixou de ser apenas institucional. Para as turmas atuais, o risco imediato é a supervisão do curso; para as turmas futuras, é o próprio exercício da profissão.

Conceito ENAMED	Faixa de proficientes	Consequência regulatória
1	Até 39,9%	Suspensão de vestibular, supervisão MEC
2	40% a 59,9%	Redução de vagas, supervisão MEC
3	60% a 74,9%	Sem sanção direta, mas sem distinção
4	75% a 89,9%	Reconhecimento de qualidade
5	90% ou mais	Excelência (84% dos conceitos 5 em 2025 eram cursos públicos)

Sem um instrumento calibrado por volume vivo de respostas, a instituição de ensino descobre em qual faixa está apenas quando o resultado oficial do INEP é publicado, momento em que já não há tempo hábil para correção de rota dentro do ciclo avaliativo.

Como Funciona o Ciclo que Transforma Resposta em Predição de Prova?

Cada resposta registrada pelos alunos das IES parceiras entra em um ciclo fechado de refinamento estatístico: responde-se a questão, o motor M.A.E.S.T.R.O recalcula o parâmetro de dificuldade daquele item à luz do padrão agregado de acertos e erros, e a régua de proficiência de toda a instituição é ajustada. Esse ciclo não é estático nem depende de revisão manual periódica; ele opera de forma contínua, com retreino do modelo a cada novo lote de respostas, o que garante que a estimativa de dificuldade reflita o comportamento real da população de estudantes de medicina, não uma suposição isolada.

A validação desse ciclo contra a realidade é o que dá substância à predição de temas do SPR Med. O modelo Empirical Bayes, treinado sobre 17 edições de exames do INEP (ENARE 2021-2026 e REVALIDA-INEP 2020-2026), acerta entre 80% e 90% dos temas no top 10 em backtest out-of-sample, por edição. No REVALIDA 2026.1, esse desempenho se confirmou na prática: dos 72 temas que efetivamente caíram na prova, todos os 72 já estavam mapeados no radar de 365 temas do SPR Med, uma cobertura de 100%. Entre os 20 temas mais prováveis apontados antes da prova, 15 caíram de fato, somando 28 questões da prova real.

Ciclo de calibração / M.A.E.S.T.R.O

Do simulado ao refinamento: como o volume de respostas recalibra a régua

Resposta do aluno

Cada questão respondida em simulado alimenta o banco vivo. Base atual: 266.177 questões tagueadas em 7 dimensões.

Recalcula o parâmetro b

Motor M.A.E.S.T.R.O aplica TRI/Rasch 1PL sobre o novo lote de respostas, ajustando a dificuldade empírica de cada item.

Régua de proficiência

Nota Final na escala INEP e Classificação de Proficiência são atualizadas com novo Nível de Confiança.

Predição refinada

Modelo Empirical Bayes reordena o radar de temas, gerando simulados mais precisos na rodada seguinte.

01 → 02 → 03 → 04 → retorna a 01 a cada novo lote de respostas

Cobertura REVALIDA 2026.1

72/72

temas da prova real já mapeados no radar de 365 temas

Acerto no top 20

15/20

temas previstos caíram de fato, somando 28 questões

Backtest top 10

80 a 90%

acerto por edição, sobre base de 17 edições de exames

Vale a distinção metodológica: predizer temas prováveis (80% a 80 a 90% de acerto no top 10) é uma tarefa estatisticamente diferente de predizer o conceito final de um curso (94% de acurácia). São dois modelos com propósitos distintos dentro da mesma infraestrutura, um orientado ao conteúdo que cairá na prova, outro à performance agregada da instituição na escala INEP.

Tema previsto	Posição no radar SPR Med	Probabilidade estimada	Questões confirmadas na prova
Trauma e Emergência	#1	91%	4
HAS	#2	87%	1
Infecções do trato genital	#4	86%	3
Lesões precursoras	#5	82%	2
APS	#9	76%	1
Hérnias da parede abdominal	#11	75%	1
Contracepção	#12	72%	2
Avaliação perioperatória	#13	70%	2
Infecções Respiratórias Baixas	#14	68%	2
Saúde do Trabalhador	#15	67%	1
Doenças Virais	#16	67%	2

A aderência de blueprint entre o banco SPR Med e o REVALIDA 2026.1 reforça a consistência do modelo em todas as dimensões da Matriz de Referência Comum: 89% nas 7 áreas de formação, 86% nas 15 competências, 77% nos 21 domínios, 93% no eixo cognitivo, 95% no nível cognitivo e 91% nos cenários SUS. Essa aderência não é fruto de sorte estatística isolada em uma única edição; é o resultado direto de um banco tagueado na mesma matriz oficial e calibrado por volume real de respostas.

Qual o Impacto Prático desse Volume nos Resultados das IES Parceiras?

O caso da UNIMAR ilustra a distância entre diagnóstico frágil e diagnóstico calibrado. A instituição recebeu conceito 2 no ENAMED 2025, uma das faixas que aciona supervisão do MEC. Com a adoção da metodologia SPR Med, sob condução da Profa. Fernanda Serva e do Dr. Carlos Bueno, a projeção interna para a edição de setembro de 2026 passou para a faixa de conceito 4 a 5, o equivalente a sair de menos de 60% de proficientes para mais de 75%. Essa evolução não decorre de um simulado isolado, mas do ciclo contínuo de resposta, recalibração e ajuste de prescrição pedagógica ao longo dos meses.

O Grupo Integrado apresenta um padrão semelhante em escala maior. Partindo de aproximadamente 50% de proficientes, a instituição, com mais de 250 alunos monitorados e 92% de engajamento no uso da plataforma, sob liderança do Dr. Heber Amilcar Martins, alcançou 100% de proficientes, resultado que sustentou inclusive a decisão de expansão da metodologia para a unidade de Macapá. Em ambos os casos, o fator comum não foi um golpe de sorte em uma edição específica de simulado, mas o acúmulo de volume de respostas reais que permitiu identificar, com precisão, em quais competências e domínios os alunos ainda apresentavam lacunas.

Esse tipo de resultado só é possível porque a metodologia SPR Med foi construída por médicos, com entendimento clínico e pedagógico do que compõe cada item da Matriz de Referência Comum, e não apenas por engenheiros de dados aplicando um modelo genérico de calibração a um banco de questões desconectado da prática clínica real.

Qual o Papel da Régua Calibrada na Preparação para o ENAMED de Setembro de 2026?

A segunda janela do ENAMED 2026 ocorre em 13 de setembro, e a régua calibrada por volume vivo de respostas é o instrumento que permite à instituição de ensino saber, com meses de antecedência, se sua turma está na faixa de risco (conceito 1 ou 2) ou na faixa de excelência (conceito 4 ou 5). Sem esse instrumento, o coordenador de curso e o NDE ficam reduzidos a hipóteses qualitativas sobre o desempenho da turma, exatamente o oposto do que a gestão acadêmica baseada em indicadores de qualidade exige diante do MEC.

O modelo preditivo de temas do SPR Med já demonstrou robustez em edições anteriores do REVALIDA e do ENARE, com aderência de 100% no radar de temas do REVALIDA 2026.1 e acerto de 80% a 90% no top 10 em backtest sobre 17 edições distintas. Para o ENAMED de setembro, o mesmo motor M.A.E.S.T.R.O aplica a Nota Final na escala INEP, a Classificação de Proficiência e o Nível de Confiança de cada aluno e de cada turma, com predição de conceito de curso com 94% de acurácia, um indicador que permite ao PDI (Plano de Desenvolvimento Institucional) da faculdade incorporar metas realistas e mensuráveis, não projeções otimistas sem lastro estatístico.

À medida que o ciclo avaliativo do ENAMED se consolida como exame semestral, com a segunda etapa funcionando como gate de registro no CRM para as novas turmas, a expectativa é que o volume de dados públicos disponíveis para calibração cresça, mas nenhuma instituição isolada terá acesso a volume comparável ao que o SPR Med já acumula pela agregação das 8 IES parceiras. Esse volume é o ativo estratégico que permite antecipar padrões de prova antes que se tornem públicos pelo INEP, e ajustar a prescrição pedagógica com meses, não semanas, de antecedência.

Converse com o Time de Consultoria Acadêmica do SPR Med

Instituições de ensino que ainda dependem de calibração por opinião de banca correm o risco de descobrir sua faixa de conceito apenas quando o resultado oficial do INEP é publicado, momento em que a janela de correção de rota já se fechou. Agende uma demonstração da plataforma SPR Med e veja como o volume vivo de 600 mil questões respondidas por mês, calibrado pelo motor M.A.E.S.T.R.O, transforma diagnóstico em prescrição pedagógica acionável antes da próxima edição do ENAMED.

Perguntas frequentes

O que significa calibração TRI com volume vivo de respostas?

Significa estimar o parâmetro de dificuldade de cada questão (b) usando o modelo de Rasch 1PL sobre uma base ampla e crescente de respostas reais, não sobre julgamento subjetivo de uma banca. O SPR Med recalibra continuamente seu banco de 266.177 questões com base em mais de 3 milhões de respostas acumuladas e 600 mil novas respostas por mês das 8 IES parceiras.

Qual a diferença entre predição de temas e predição de conceito?

São modelos estatísticos distintos dentro da mesma infraestrutura. A predição de temas (Empirical Bayes, 17 edições do INEP) estima quais assuntos têm maior probabilidade de cair na prova, com acerto de 80% a 90% no top 10 por edição. A predição de conceito usa o motor M.A.E.S.T.R.O para estimar a Nota Final na escala INEP e a classificação de proficiência do curso, com 94% de acurácia. Não devem ser confundidas.

O banco SPR Med teve acesso prévio às questões do REVALIDA ou do ENAMED?

Não. O que existe é aderência de blueprint: ambos os exames são ancorados na mesma Matriz de Referência Comum (Portaria INEP 478/2025), e o banco SPR Med é tagueado na mesma matriz com calibração estatística real. A coincidência entre 74 das 100 questões do REVALIDA 2026.1 e o banco SPR Med decorre de mapeamento sistemático de competências, domínios e temas prováveis, não de acesso a conteúdo de prova.

Como esse volume de dados ajuda um curso com conceito 1 ou 2 no ENAMED?

Permite identificar, com precisão estatística e meses de antecedência, em quais competências e domínios os alunos apresentam maior lacuna de proficiência, viabilizando prescrição pedagógica direcionada. O caso da UNIMAR, que saiu de conceito 2 no ENAMED 2025 para projeção de 4 a 5 em setembro de 2026, ilustra esse potencial de correção de rota dentro de um único ciclo avaliativo.

Por que instituições isoladas não conseguem replicar esse volume de calibração?

Porque o volume de 600 mil respostas por mês resulta da agregação de dados de 8 IES parceiras operando na mesma plataforma. Uma única instituição de ensino, mesmo aplicando simulados internos com frequência, dificilmente atinge a escala amostral necessária para calibração TRI robusta e validação contínua contra edições reais do INEP.

Como o ENAMED semestral, criado pela MP 1.370/2026, muda a urgência da calibração?

Com o exame passando a ser aplicado duas vezes por ano e a segunda etapa (fim do 6º ano) funcionando como gate individual de registro no CRM para quem ingressou a partir de 19 de junho de 2026, a instituição de ensino perde a margem de um ciclo anual único para corrigir rota. A calibração contínua por volume vivo de respostas passa a ser condição para acompanhar o ritmo semestral de avaliação.

Escrito por

Dr. Matheus Ferreira

CEO e Co-Fundador do SPR Med · CRM-SP 206.304

Médico, MBA em HealthTech (FIAP) e Gestão em Saúde (FGV). Publicado em Scientific Reports (Nature Portfolio). Liderou conteúdo médico para mais de 145.000 alunos antes de fundar o SPR Med.

Próximo passo

Quer conversar com os fundadores?

45 minutos com Dr. Matheus Ferreira e Dr. Vinícius Côgo Destefani. Sem compromisso comercial.

Agende uma demonstração