74 de 100: o Teste de Fogo do Banco SPR Med no REVALIDA 2026.1
74 das 100 questões do REVALIDA 2026.1 já tinham equivalente no banco SPR Med. O relatório completo do confronto questão a questão.
Das 100 questões aplicadas no REVALIDA 2026.1, 74 tinham equivalente direto no banco proprietário SPR Med, seja pelo mesmo caso clínico, seja pela mesma conduta esperada, já testado em simulado com alunos das instituições parceiras ao longo do ano. O confronto foi feito questão a questão, uma a uma, cruzando as 100 questões reais da prova com as 1.942 questões inéditas aplicadas nos 22 simulados do ano. O resultado não é sorte: é a consequência de tagueamento fiel à Matriz de Referência Comum (Portaria INEP 478/2025) e de um modelo preditivo calibrado em 17 edições de exames do INEP.
Este artigo é o relatório executivo desse confronto, na versão que coordenadores de curso, membros de NDE e diretores acadêmicos precisam para decidir o que fazer com esse dado, dentro da própria instituição, antes do ENAMED de 13 de setembro de 2026.
O Que Significa 74 de 100 na Prática da Gestão Acadêmica
O número 74 não descreve acerto de gabarito, descreve equivalência estrutural entre o que a instituição já treinou e o que o INEP efetivamente cobrou. Cada uma das 100 questões do REVALIDA 2026.1 foi comparada, de forma individual, com as 1.942 questões inéditas do banco SPR Med usadas nos 22 simulados aplicados no ciclo. Dessa comparação, emergiram 203 pares fortes distribuídos em três graus de proximidade: 3 pares quase idênticos (mesma vinheta clínica, mesmos valores laboratoriais, mesma pergunta final), 27 pares de mesmo caso clínico (cenário clínico equivalente, com variação de desfecho ou de pergunta) e 173 pares de mesmo conceito (competência e domínio idênticos, texto-base diferente).
Ao consolidar esses três graus em equivalência direta por questão, chega-se às 74 questões da prova real que possuíam um espelho reconhecível no banco. Esse é o número que interessa à coordenação: não quantas questões o aluno acertaria isoladamente, mas quantas vezes o conteúdo cobrado pelo INEP já havia sido apresentado, discutido e corrigido em ambiente de simulado ao longo do ano letivo.
A leitura correta desse dado exige um guard-rail conceitual. Não se trata de acesso à prova, vazamento ou cópia de conteúdo. O REVALIDA e o ENAMED são exames do INEP ancorados na mesma Matriz de Referência Comum (Portaria INEP 478/2025), com as mesmas 15 competências, 21 domínios, 7 áreas de formação, 6 cenários e 3 eixos. Um banco de questões tagueado com fidelidade a essa matriz e calibrado por dados históricos tende, estatisticamente, a convergir com o que a prova cobra. A frase que resume esse fenômeno é direta: não é coincidência, é blueprint.
Como Foi Medida a Equivalência: a Metodologia por Trás do Número
A validação combinou três camadas técnicas independentes, aplicadas par a par entre as 100 questões reais e as 1.942 questões inéditas dos simulados: juiz de inteligência artificial com pontuação de 0 a 100, embeddings para proximidade semântica e verificação de sobreposição textual, com termos e condutas em comum grifados diretamente em cada par de questões. Essa tripla checagem evita que uma coincidência superficial de palavras seja confundida com equivalência real de caso clínico ou de conduta esperada.
O juiz de IA avalia cada par de questões atribuindo uma pontuação de similaridade estrutural: mesma competência avaliada, mesmo raciocínio clínico exigido, mesmo tipo de decisão terapêutica ou diagnóstica. Os embeddings, por sua vez, medem proximidade semântica no espaço vetorial do texto, capturando reformulações de enunciado que mantêm o mesmo núcleo clínico. Já a sobreposição textual identifica, de forma explícita, quais termos técnicos, sinais, sintomas, exames complementares e condutas aparecem replicados entre a questão do simulado e a questão da prova real.
Essa metodologia foi aplicada sobre uma base robusta: o banco SPR Med reúne 266.177 questões tagueadas na Matriz Pedagógica 7D, com mais de 3 milhões de respostas registradas e um volume mensal de 600 mil questões respondidas pelas 8 instituições de ensino parceiras. É dentro desse universo que os 22 simulados do ano, com suas 1.942 questões inéditas, foram selecionados e comparados individualmente às 100 questões da prova real.
O motor de predição de temas por trás desse processo é o M.A.E.S.T.R.O, sistema proprietário que utiliza Empirical Bayes sobre uma base histórica de 17 edições de exames do INEP, somando ENARE 2021 a 2026 e REVALIDA-INEP 2020 a 2026. Em backtest out-of-sample, esse modelo acerta entre 80% e 90% dos temas mais prováveis dentro do top 10, por edição analisada, e entre 55% e 70% dentro do top 20, considerando as 17 edições da base histórica.
É importante que a coordenação distinga dois números que não devem ser confundidos: a predição de temas (80 a 90% de acerto no top 10) mede a capacidade do modelo de antecipar quais assuntos vão cair na prova. Já a predição de conceito, com 94% de acurácia, é uma métrica distinta, usada para estimar o resultado institucional do curso na escala INEP, a partir do desempenho simulado dos alunos. Neste artigo, o foco é a predição de temas e a validação de equivalência de questões, não a predição de conceito.
Leia tambémComo Saber se o Simulado da Sua IES Antecipa a Prova Real: 5 Critérios →
A Tabela Predição × Prova: os 11 Temas que Confirmaram o Radar
Antes do REVALIDA 2026.1, o M.A.E.S.T.R.O havia ranqueado 365 temas por probabilidade de incidência na prova, com base no histórico de 17 edições. Ao confrontar essa lista com os temas efetivamente cobrados, o resultado foi de 100%: os 72 temas que caíram na prova já estavam mapeados dentro do radar de 365 temas monitorados pelo modelo. Nenhum tema surpresa, nenhum assunto fora do escopo previsto.
Dentro desse universo, o desempenho nos temas de maior probabilidade foi particularmente relevante para a gestão de currículo: 15 dos 20 temas classificados como mais prováveis efetivamente caíram na prova, respondendo por 28 das 100 questões aplicadas. A tabela a seguir detalha os 11 temas de maior destaque no cruzamento entre ranking de probabilidade e questões reais.
| Tema | Posição no ranking | Probabilidade estimada | Questões na prova real |
|---|---|---|---|
| Trauma e Emergência | 1 | 91% | 4 |
| Hipertensão Arterial Sistêmica | 2 | 87% | 1 |
| Infecções do trato genital | 4 | 86% | 3 |
| Lesões precursoras | 5 | 82% | 2 |
| Atenção Primária à Saúde | 9 | 76% | 1 |
| Hérnias da parede abdominal | 11 | 75% | 1 |
| Contracepção | 12 | 72% | 2 |
| Avaliação perioperatória | 13 | 70% | 2 |
| Infecções Respiratórias Baixas | 14 | 68% | 2 |
| Saúde do Trabalhador | 15 | 67% | 1 |
| Doenças Virais | 16 | 67% | 2 |
Esses 11 temas, sozinhos, concentraram 21 das 100 questões da prova, o equivalente a mais de um quinto do exame inteiro. Para uma coordenação de curso, esse dado tem implicação direta sobre priorização de carga horária, sobre distribuição de simulados ao longo do calendário letivo e sobre alocação do corpo docente em revisões direcionadas nos meses que antecedem a aplicação do ENAMED.
O Que é Aderência de Blueprint e Por Que Ela Explica o Resultado
Aderência de blueprint é o grau de correspondência estrutural entre o banco de questões de uma instituição e a matriz oficial de referência do exame, medido dimensão a dimensão. No caso do banco SPR Med frente ao REVALIDA 2026.1, essa aderência foi calculada em seis dimensões da Matriz de Referência Comum (Portaria INEP 478/2025), com resultados que variam conforme o nível de granularidade de cada dimensão.
| Dimensão da matriz | Aderência do banco SPR Med |
|---|---|
| 7 áreas de formação | 89% |
| 15 competências | 86% |
| 21 domínios | 77% |
| Eixo cognitivo | 93% |
| Nível cognitivo | 95% |
| Cenários SUS | 91% |
O padrão observado nessa tabela é consistente com a lógica de granularidade da matriz: quanto mais específica a dimensão (21 domínios), maior a variabilidade natural, e quanto mais estrutural a dimensão (eixo cognitivo, nível cognitivo, cenários SUS), maior a aderência. Isso significa que o banco SPR Med acerta com muita precisão o tipo de raciocínio exigido (eixo e nível cognitivo) e o cenário de prática (SUS), que são justamente as dimensões que definem a complexidade e o contexto da decisão clínica cobrada na prova. É essa aderência de blueprint, e não qualquer acesso privilegiado a conteúdo, que explica por que 74 das 100 questões da prova real encontraram equivalente no banco.
Para o NDE e para a coordenação de curso, esse dado tem uma implicação de governança curricular: revisar o PDI e os planos de ensino com base na aderência real de blueprint é mais eficaz do que revisar com base em intuição docente ou em bibliografia tradicional desconectada da matriz do INEP.
Dois Pares Lado a Lado: Como a Equivalência Aparece na Prática Clínica
A tabela e os percentuais ganham concretude quando observados em casos específicos. Dois pares, um em Clínica Médica e outro em Cirurgia, ilustram como a equivalência de conduta se manifesta na prática, sem que isso implique repetição literal de enunciado.
No primeiro par, de Clínica Médica, a questão do REVALIDA 2026.1 apresentava um paciente em uso concomitante de lítio e de um diurético tiazídico, evoluindo com sinais clínicos e laboratoriais compatíveis com intoxicação por lítio. A pergunta cobrava a conduta correta diante desse quadro, e a resposta esperada envolvia o reconhecimento da interação farmacológica entre tiazídicos e lítio, com a suspensão do diurético como medida central de manejo. No banco SPR Med, uma questão do mesmo grupo de simulados apresentava vinheta clínica equivalente: paciente em uso crônico de lítio, introdução recente de tiazídico, quadro de intoxicação por lítio em evolução, com a mesma competência avaliada e a mesma conduta esperada de suspensão do fármaco precipitante. O grifo de sobreposição textual identificou os termos "lítio", "tiazídico" e "suspensão" presentes em ambos os enunciados, além da mesma sequência de raciocínio clínico exigida.
No segundo par, de Cirurgia, a questão real descrevia um paciente vítima de trauma abdominal fechado, hemodinamicamente instável, submetido a FAST (Focused Assessment with Sonography for Trauma) com resultado positivo para líquido livre em cavidade, cobrando a conduta subsequente. A resposta esperada apontava para laparotomia exploradora como conduta indicada diante da instabilidade hemodinâmica associada a FAST positivo. No simulado SPR Med, uma questão da mesma área apresentava cenário clínico próximo: trauma abdominal fechado, instabilidade hemodinâmica, FAST positivo, com a mesma pergunta final sobre a conduta cirúrgica indicada e a mesma resposta esperada de laparotomia. Novamente, a análise de sobreposição textual confirmou os termos e a sequência de decisão clínica em comum entre os dois enunciados.
Esses dois pares ilustram, na prática, o que os 203 pares fortes representam de forma agregada: não repetição de prova, mas convergência estrutural entre casos clínicos e condutas que a matriz do INEP elege como centrais para avaliar competência médica, e que um banco bem tagueado tende a reproduzir de forma recorrente ao longo dos ciclos avaliativos.
Leia tambémREVALIDA 2026.1: Análise Completa da Prova por Área e Tema →
Por Que Isso Importa Para o ENAMED de 13 de Setembro
O REVALIDA e o ENAMED compartilham a mesma matriz de referência e, a partir da MP 1.370/2026, a mesma arquitetura regulatória de fundo: a 2ª etapa do ENAMED substitui o teórico do REVALIDA e passa a ser exame semestral aplicado pelo MEC/INEP. A validação obtida no REVALIDA 2026.1, portanto, não é um exercício isolado de retrospectiva, é evidência direta de que o mesmo motor de predição e o mesmo banco tagueado tendem a produzir aderência equivalente na próxima aplicação do ENAMED, marcada para 13 de setembro de 2026.
Para instituições de ensino que já enfrentaram conceito 1 ou 2 no ENAMED 2025, ou que estão sob supervisão do MEC nos termos das Portarias 72, 73 e 74 de 17 de março de 2026 (que atingiram 99 cursos, sendo 8 com suspensão de ingresso, 13 com corte de 50% das vagas, 33 com corte de 25% e 45 impedidos de ampliar oferta), esse tipo de validação deixa de ser um diferencial de marketing e passa a ser um insumo de gestão de risco regulatório. Antecipar 100% dos temas que efetivamente caem na prova, dentro de um radar de 365 temas monitorados, é o tipo de evidência que sustenta decisões de currículo, de docência e de investimento em simulado com prazo curto até setembro.
Leia tambémENAMED de 13 de Setembro de 2026: Os Temas Mais Prováveis →
O Que Isso Significa Para a Coordenação de Curso, Não Para o Estudante Individual
A leitura institucional desse dado é diferente da leitura individual de um estudante que se prepara para uma prova. Para a coordenação de curso, para o NDE e para a direção acadêmica, os 74 de 100 e a aderência de blueprint em seis dimensões representam três frentes de decisão concretas: priorização curricular, alocação docente e gestão de risco regulatório.
Na priorização curricular, os 11 temas da tabela de predição × prova indicam onde concentrar carga horária de revisão e onde ajustar o cronograma de simulados entre agora e setembro. Trauma e Emergência, no topo do ranking com 91% de probabidade e 4 questões confirmadas, exemplifica um tema que qualquer plano de contingência pré-ENAMED deveria tratar como prioridade máxima, não como item entre outros.
Na alocação docente, a aderência de blueprint por dimensão (89% em áreas, 86% em competências, 77% em domínios, 93% em eixo cognitivo, 95% em nível cognitivo e 91% em cenários SUS) orienta onde o corpo docente precisa reforçar a elaboração de questões próprias, especialmente na dimensão de domínios, que apresenta a maior variabilidade e, por isso, exige atenção redobrada do NDE na revisão de bancos internos de avaliação.
Na gestão de risco regulatório, o caso da UNIMAR ilustra o potencial de virada em um ciclo avaliativo: após conceito 2 no ENAMED 2025, a instituição, sob orientação da Profa. Fernanda Serva e do Dr. Carlos Bueno, projeta conceito entre 4 e 5 para a aplicação de setembro de 2026. Já o Grupo Integrado, com mais de 250 alunos sob acompanhamento do Dr. Heber Amilcar Martins, saiu de aproximadamente 50% de proficientes para 100% de proficientes, com engajamento de 92% dos alunos nos simulados, resultado que sustentou inclusive a decisão de expansão da rede para Macapá. Esses dois cases demonstram que a aderência de blueprint e a predição de temas, quando incorporadas à rotina de gestão acadêmica, se traduzem em métricas de proficiência auditáveis pelo próprio INEP no ciclo seguinte.
Leia também99 Cursos de Medicina Sob Supervisão: O Que Mudou com as Portarias 72, 73 e 74 →
Contexto Regulatório: Por Que a Margem de Erro Diminuiu
O ENAMED 2025 reuniu 89.024 participantes e 39.258 concluintes, dos quais 67% foram classificados como proficientes, deixando aproximadamente 13 mil egressos abaixo do corte de proficiência. Esse resultado se traduziu em 107 cursos com conceito 1 ou 2 entre os 351 avaliados, e apenas 49 com conceito 5, dos quais 84% são instituições públicas. A escala de conceito, vale lembrar, segue faixas objetivas de proficientes: conceito 1 corresponde a até 39,9% de proficientes, conceito 2 de 40% a 59,9%, conceito 3 de 60% a 74,9%, conceito 4 de 75% a 89,9% e conceito 5 a partir de 90%.
Com a MP 1.370/2026, essa régua ganhou dentes regulatórios adicionais: o ENAMED passou a ser aplicado em duas etapas, a primeira ao final do 4º ano, com caráter diagnóstico e obrigatório como componente curricular, sem habilitar o egresso, e a segunda ao final do 6º ano, funcionando como gate de proficiência para o exercício da medicina e para o registro no CRM, exigível a quem ingressar a partir de 19 de junho de 2026. Desempenho insatisfatório na segunda etapa aciona supervisão do curso pelo MEC, regra que já vale para todos os cursos, independentemente da data de ingresso dos alunos. Com a prova tornando-se semestral, o intervalo entre ciclos de correção curricular encurta, o que torna a antecipação de temas e a aderência de blueprint ainda mais decisivas para a governança acadêmica.
Leia tambémA Nova Régua da Formação Médica →
Próximos Passos Para Coordenações e NDEs Antes de Setembro
Diante desse cenário, a decisão que cabe à coordenação de curso não é reagir à prova depois da aplicação, é auditar, antes de setembro, se o banco de questões utilizado internamente possui aderência de blueprint mensurável nas seis dimensões da Matriz de Referência Comum e se o calendário de simulados está alinhado ao radar de temas mais prováveis. Instituições que ainda tratam simulado como exercício genérico de revisão, sem tagueamento fiel à matriz do INEP e sem modelo preditivo calibrado por edições históricas, tendem a operar às cegas justamente no momento em que a régua regulatória ficou mais rígida.
O relatório completo do confronto questão a questão entre o REVALIDA 2026.1 e o banco SPR Med, incluindo o dossiê par a par com os grifos de sobreposição textual, está disponível para instituições que desejam avaliar a aderência de seu próprio curso frente à mesma matriz. Agende uma demonstração da plataforma SPR Med e solicite o dossiê completo da sua IES, com a análise de aderência de blueprint aplicada ao currículo e ao banco de questões já em uso na sua instituição.
Perguntas frequentes
O que significa dizer que 74 das 100 questões do REVALIDA 2026.1 tinham equivalente no banco SPR Med?
Significa que, ao comparar individualmente as 100 questões reais da prova com as 1.942 questões inéditas dos 22 simulados aplicados no ano, 74 delas apresentaram correspondência direta de caso clínico ou de conduta esperada com alguma questão do banco SPR Med. Essa correspondência foi medida por juiz de IA, embeddings de proximidade semântica e sobreposição textual, e não implica acesso prévio ao conteúdo da prova.
Qual é a diferença entre predição de temas e predição de conceito?
A predição de temas mede a capacidade do modelo M.A.E.S.T.R.O de antecipar quais assuntos vão cair na prova, com acerto de 80% a 90% no top 10 por edição, em backtest sobre 17 edições históricas do INEP. Já a predição de conceito, com 94% de acurácia, estima o resultado institucional do curso na escala de 1 a 5 do INEP, a partir do desempenho dos alunos em simulado. São métricas distintas e não devem ser confundidas.
Como a aderência de blueprint em seis dimensões ajuda a coordenação de curso?
A aderência de blueprint mostra em quais dimensões da Matriz de Referência Comum (áreas, competências, domínios, eixo cognitivo, nível cognitivo e cenários SUS) o banco de questões da instituição está mais ou menos alinhado ao que o INEP efetivamente cobra. Isso orienta decisões concretas de priorização curricular, de alocação docente e de revisão de bancos internos de avaliação, com base em dado mensurável, não em intuição.
O resultado do REVALIDA 2026.1 tem relação direta com o ENAMED de setembro de 2026?
Sim, porque REVALIDA e ENAMED compartilham a mesma Matriz de Referência Comum (Portaria INEP 478/2025) e, a partir da MP 1.370/2026, a 2ª etapa do ENAMED passa a substituir o teórico do REVALIDA. A validação de aderência obtida em uma aplicação tende a se manter relevante para a aplicação seguinte, na medida em que o motor de predição e o banco de questões seguem calibrados pela mesma matriz e pelo mesmo histórico de edições do INEP.
Minha instituição está sob supervisão do MEC. Esse tipo de dado ajuda a sair dessa condição?
Instituições sob as Portarias 72, 73 e 74 de 17 de março de 2026 precisam demonstrar evolução mensurável de proficiência nos ciclos seguintes de avaliação. Casos como o da UNIMAR, que projeta sair de conceito 2 para a faixa de 4 a 5, e do Grupo Integrado, que elevou o percentual de proficientes de aproximadamente 50% para 100%, mostram que a combinação de banco tagueado, predição de temas e acompanhamento de mentoria em escala pode sustentar essa evolução dentro de um ciclo avaliativo.
Onde posso ver a análise completa, área por área, da prova do REVALIDA 2026.1?
A análise detalhada por área e por tema está disponível no artigo Leia tambémREVALIDA 2026.1: Análise Completa da Prova por Área e Tema →, que aprofunda a distribuição de questões por especialidade e complementa os dados apresentados neste relatório executivo.
Médico, MBA em HealthTech (FIAP) e Gestão em Saúde (FGV). Publicado em Scientific Reports (Nature Portfolio). Liderou conteúdo médico para mais de 145.000 alunos antes de fundar o SPR Med.
Quer conversar com os fundadores?
45 minutos com Dr. Matheus Ferreira e Dr. Vinícius Côgo Destefani. Sem compromisso comercial.
Agende uma demonstraçãoArtigos Relacionados
120 a 150 Professores Formados: a Transferência de Capacidade em 3 Anos
A adoção não cria dependência: em 3 anos, a metodologia fica institucionalizada, com 120 a 150 professores formados. O plano de autonomia.
600 Mil Questões por Mês: o Volume Vivo que Calibra a Régua
Os alunos das 8 IES parceiras respondem 600 mil questões por mês em condição real de prova. É esse volume que separa medir de opinar.
99 Cursos de Medicina Sob Supervisão: O Que Mudou com as Portarias 72, 73 e 74
As Portarias 72, 73 e 74 (mar/2026) colocaram 99 cursos sob supervisão: suspensão de ingresso, cortes de 25% e 50% das vagas e proibição de ampliar. O mapa das medidas.