Guia

Por Que % de Acerto Engana: θ, Rasch e a Fórmula da Nota Final

Dois alunos com o mesmo número de acertos podem ter notas diferentes no ENAMED. Entenda θ, o modelo de Rasch e a fórmula NF = θ×17,544 + 67,018.

Por Dr. Matheus Ferreira, CRM-SP 206.304

Atualizado em 02 de julho de 2026

Publicado em 02 de julho de 202615 min de leitura

Dois estudantes acertam exatamente 62 das 100 questões do ENAMED. Um recebe nota final 71,2 e fica confortavelmente acima do corte de proficiência. O outro recebe 58,4 e fica abaixo. A diferença não é erro de correção: é o resultado esperado da Teoria de Resposta ao Item (TRI), modelo Rasch (1PL), que o INEP usa para calcular a nota. Quem acerta questões mais difíceis recebe um traço de habilidade (θ) mais alto, e é esse θ, não a contagem bruta de acertos, que entra na fórmula oficial NF = θ×17,544 + 67,018.

Esse mecanismo explica por que gerir a preparação de uma turma inteira olhando apenas para planilhas de percentual de acerto é, na prática, um erro estatístico. Ele também é a base técnica de por que o corte de proficiência do ENAMED não corresponde a "60% de acertos", mas a um valor específico de θ. Este artigo detalha a matemática por trás da nota, mostra por que a dificuldade da questão pesa mais do que o volume de acertos e explica onde a gestão por planilha falha, mesmo em instituições com bom desempenho histórico.

O que é θ (theta) e por que ele substitui a contagem de acertos

Theta (θ) é o parâmetro estatístico que a TRI usa para estimar a proficiência real de um candidato, com base não apenas em quantas questões ele acertou, mas em quais questões acertou e qual a dificuldade de cada uma delas. No modelo de Rasch (1PL), adotado pelo INEP para o ENAMED, cada item da prova tem um parâmetro de dificuldade calibrado estatisticamente, e a probabilidade de acerto de um candidato depende da distância entre sua proficiência (θ) e essa dificuldade. Dois candidatos com o mesmo número de acertos podem ter θ diferentes se acertaram conjuntos de questões com níveis de dificuldade distintos.

Na prática, isso significa que o exame "sabe" quando um acerto foi mais informativo do que outro. Um candidato que acerta dez questões consideradas difíceis pela calibração estatística demonstra mais proficiência do que um candidato que acerta dez questões fáceis, mesmo que ambos tenham a mesma pontuação bruta na prova. É esse refinamento que torna a TRI superior à Teoria Clássica dos Testes (TCT), que trataria os dois casos como equivalentes.

Para o ENAMED, essa lógica tem uma consequência direta: uma turma pode ter média de 65% de acertos brutos e, ainda assim, apresentar um θ médio abaixo do necessário para o Conceito 3, se os acertos estiverem concentrados nas questões mais fáceis da prova e os erros nas questões mais difíceis e discriminativas. É exatamente o tipo de padrão que uma planilha de percentual não revela, mas que o M.A.E.S.T.R.O, motor proprietário de machine learning da SPR Med baseado em TRI/Rasch 1PL, foi desenhado para detectar.

Como funciona a fórmula NF = θ×17,544 + 67,018 na prática

A nota final do ENAMED na escala INEP é obtida por uma transformação linear simples do θ estimado: NF = θ×17,544 + 67,018. Essa fórmula converte o traço latente de proficiência, que originalmente está numa escala com média zero e desvio-padrão um, típica dos modelos Rasch, para a escala de 0 a 100 usada na divulgação de resultados. O coeficiente 17,544 funciona como fator de escala (equivalente ao desvio-padrão da distribuição), e a constante 67,018 ajusta a posição central da escala.

Um exemplo numérico simples: um candidato com θ = 0 (proficiência exatamente na média da distribuição de referência) obtém NF = 0×17,544 + 67,018 = 67,018. Um candidato com θ = 1 (um desvio-padrão acima da média) obtém NF = 1×17,544 + 67,018 = 84,562. Já um candidato com θ = -1 (um desvio-padrão abaixo da média) obtém NF = -1×17,544 + 67,018 = 49,474. A escala é linear em θ, mas não é linear em número de acertos, porque a relação entre acertos brutos e θ depende da dificuldade específica de cada item respondido corretamente.

É esse mecanismo que explica o corte de proficiência do ENAMED: o valor de 60,0 na escala final corresponde a θ = -0,40, e não a "60 questões certas em 100". Substituindo na fórmula: (-0,40)×17,544 + 67,018 = 60,00. Um candidato pode ter 55% de acertos brutos e ultrapassar o corte, se tiver acertado uma proporção maior das questões mais difíceis e discriminativas da prova, assim como pode ter 65% de acertos brutos e ficar abaixo do corte, se a maior parte dos erros estiver concentrada exatamente nos itens que mais discriminam proficiência.

Valor de θ	Cálculo NF	Nota final (escala INEP)	Situação
-1,00	-1×17,544 + 67,018	49,47	Abaixo do corte
-0,40	-0,40×17,544 + 67,018	60,00	Corte exato de proficiência
0,00	0×17,544 + 67,018	67,02	Média da distribuição de referência
0,50	0,50×17,544 + 67,018	75,79	Acima do corte, faixa Conceito 4
1,00	1×17,544 + 67,018	84,56	Proficiência elevada

Régua de proficiência

θ (-2 a +2) sobreposto à Nota Final (0 a 100)

Corte

θ = -0,40

-2,00

-1,00

-0,40

0,00

1,00

2,00

Escala θ (Rasch)

31,93

49,47

60,00

67,02

84,56

100,00

Nota Final (escala INEP)

Aluno B, 60% acertos

θ = -0,55 → NF 57,37

Aluno A, 60% de acertos brutos

θ = 0,10

Nota final: 68,77 · acima do corte

Errou majoritariamente itens fáceis, de baixa discriminação, e acertou os itens difíceis que carregam mais informação sobre proficiência.

Aluno B, 60% de acertos brutos

θ = -0,55

Nota final: 57,37 · abaixo do corte

Mesmo número bruto de acertos que o Aluno A, mas concentrou os erros justamente nos itens difíceis e discriminativos da prova.

Corte oficial: θ = -0,40 corresponde a NF = 60,00, pela fórmula NF = θ × 17,544 + 67,018. Dois candidatos com percentual idêntico de acertos brutos podem ficar em lados opostos do corte, dependendo de qual proporção dos itens de maior dificuldade e discriminação cada um acertou.

Por que acertar uma questão difícil informa mais do que acertar uma fácil

No modelo de Rasch, cada item tem um parâmetro de dificuldade calibrado a partir de dados empíricos de milhares de respondentes, e esse parâmetro determina o quanto o acerto ou erro naquele item contribui para a estimativa final de θ. Uma questão fácil, respondida corretamente por quase todos os candidatos de uma coorte, carrega pouca informação estatística sobre a proficiência individual, porque não discrimina bem entre quem sabe e quem não sabe o conteúdo. Já uma questão difícil, que só uma fração menor de candidatos acerta, discrimina fortemente entre níveis de proficiência e, por isso, tem peso maior na estimativa de θ.

Esse é o motivo estatístico pelo qual a gestão de simulados não deveria classificar o desempenho de um aluno apenas pelo percentual de questões corretas. Um aluno que acerta 70% de um simulado composto majoritariamente por questões fáceis pode ter um θ estimado inferior ao de um colega que acerta 55% de um simulado com questões mais difíceis e discriminativas. É por isso que o banco de 266.177 questões tagueadas na Matriz Pedagógica 7D da SPR Med, calibradas por TRI, permite que cada simulado devolva não apenas um percentual, mas uma estimativa de θ e uma projeção de Conceito, com nível de confiança associado.

Essa distinção também explica por que o Angoff Modificado, metodologia usada pelo INEP para fixar o ponto de corte de proficiência (conforme Nota Técnica INEP 19/2025), depende de juízes especialistas avaliando a probabilidade de um candidato minimamente proficiente acertar cada item específico, item a item, e não uma meta genérica de acertos totais. O corte de θ = -0,40 (NF = 60,0) resulta desse processo de julgamento estruturado sobre a dificuldade real de cada questão da matriz, ancorada na Portaria INEP 478/2025.

O que é o Angoff Modificado e como ele define o corte de proficiência

O Angoff Modificado é a metodologia psicométrica usada pelo INEP para estabelecer o ponto de corte de proficiência do ENAMED, conforme detalhado na Nota Técnica INEP 19/2025. Nessa metodologia, um painel de especialistas analisa cada item da prova e estima a probabilidade de que um candidato "minimamente proficiente", ou seja, no limiar exato de competência esperada para o exercício da medicina, responda corretamente àquele item específico. A soma ponderada dessas probabilidades, transformada para a escala de θ, define o ponto de corte oficial.

Esse processo é diferente de simplesmente decidir "o aluno precisa acertar 60 questões". Ele reconhece que cada questão tem um peso probabilístico distinto associado à proficiência mínima esperada, e é isso que ancora o corte em θ = -0,40, equivalente a NF = 60,0 na escala final. Faixas de proficientes por Conceito seguem essa mesma lógica de corte calibrado: Conceito 1 corresponde a até 39,9% de proficientes na instituição, Conceito 2 de 40% a 59,9%, Conceito 3 de 60% a 74,9%, Conceito 4 de 75% a 89,9% e Conceito 5 a 90% ou mais (Fonte: INEP, 2025).

No ENAMED 2025, dos 89.024 participantes, 39.258 eram concluintes, e desses, 67% foram considerados proficientes, deixando aproximadamente 13 mil egressos abaixo do corte (Fonte: INEP, 2025). Esse resultado reforça que a distância entre "sentir que sabe a matéria" e "ter θ suficiente para ultrapassar o corte" é real e mensurável, e que ela não aparece em uma planilha simples de percentual de acerto por simulado.

Por que gerir uma turma pela planilha de % de acerto é um erro estatístico

Uma coordenação de curso que acompanha o desempenho de seus alunos exclusivamente por percentual médio de acerto em simulados corre o risco de subestimar ou superestimar sistematicamente o risco de Conceito baixo, porque o percentual bruto não captura a dificuldade relativa das questões respondidas nem o padrão de acertos e erros ao longo do espectro de dificuldade. Duas turmas com médias de 68% de acerto podem ter distribuições de θ completamente diferentes, uma delas seguramente acima do corte de proficiência e outra perigosamente próxima ou abaixo dele.

As Portarias Seres/MEC 72, 73 e 74, de 17 de março de 2026, colocaram 99 cursos de medicina sob supervisão após o ENAMED 2025, sendo 8 com suspensão de ingresso de novos alunos, 13 com corte de 50% das vagas, 33 com corte de 25% das vagas e 45 impedidos de ampliar vagas (Fonte: MEC/Seres, 2026). Em muitos desses casos, o indicador interno de acompanhamento que a coordenação tinha em mãos era justamente o percentual médio de acerto em simulados, uma métrica que não converte diretamente para θ nem para a probabilidade de Conceito 1 ou 2.

É por essa razão que a metodologia da SPR Med em quatro pilares (Diagnóstico → Prescrição → Controle → Mentoria) parte de uma estimativa de θ por aluno e por turma, e não de percentuais isolados. O Diagnóstico usa o M.A.E.S.T.R.O para estimar Nota Final na escala INEP, Classificação de Proficiência e Nível de Confiança, com 94% de acurácia na predição de Conceito. A partir daí, a Prescrição automatizada direciona o estudo para as lacunas que mais pesam na estimativa de θ, o Controle acompanha a evolução em tempo real, e a Mentoria em escala aplica esse acompanhamento a centenas de alunos simultaneamente, algo que uma planilha manual de percentual de acerto não é capaz de sustentar de forma consistente.

O caso da UNIMAR ilustra essa mudança de abordagem: a instituição recebeu Conceito 2 no ENAMED 2025 e, com acompanhamento estruturado por θ conduzido pela Profa. Fernanda Serva e pelo Dr. Carlos Bueno, projeta Conceito 4 a 5 para a edição de setembro de 2026. O Grupo Integrado, por sua vez, saiu de aproximadamente 50% de proficientes para 100% de proficientes entre mais de 250 alunos, com engajamento de 92%, sob condução do Dr. Heber Amilcar Martins, resultado que motivou expansão da metodologia para Macapá.

Qual a diferença entre predizer θ, predizer Conceito e predizer temas

Predizer θ e Nota Final é uma tarefa estatística individual, baseada no padrão de respostas de cada aluno em itens calibrados por TRI, e é o que o M.A.E.S.T.R.O executa com 94% de acurácia na predição de Conceito institucional. Predizer temas prováveis de uma prova futura é uma tarefa diferente, de natureza probabilística sobre o conteúdo do exame, e não deve ser confundida com a predição de proficiência individual. O modelo de predição de temas da SPR Med, baseado em Empirical Bayes e treinado sobre 17 edições do INEP (ENARE 2021 a 2026 e REVALIDA-INEP 2020 a 2026), acerta de 80% a 90% no top 10 de temas em backtest out-of-sample, por edição, e de 55% a 70% no top 20.

Essas duas predições respondem perguntas distintas e complementares: a predição de θ e Conceito diz "qual é a probabilidade de este aluno, ou esta turma, ultrapassar o corte de proficiência", enquanto a predição de temas diz "quais assuntos têm maior probabilidade de aparecer na prova". No caso do REVALIDA 2026.1, essa segunda predição foi validada de forma expressiva: dos 72 temas que efetivamente caíram na prova, todos os 72 já estavam no radar de 365 temas monitorados pela SPR Med (100% de cobertura), e 15 dos 20 temas apontados como mais prováveis caíram, respondendo por 28 das 100 questões da prova.

Tema previsto (ranking de probabilidade)	Probabilidade estimada	Questões na prova real
Trauma e Emergência (#1)	91%	4
Hipertensão Arterial Sistêmica (#2)	87%	1
Infecções do trato genital (#4)	86%	3
Lesões precursoras (#5)	82%	2
Atenção Primária à Saúde (#9)	76%	1
Hérnias da parede abdominal (#11)	75%	1
Contracepção (#12)	72%	2
Avaliação perioperatória (#13)	70%	2
Infecções Respiratórias Baixas (#14)	68%	2
Saúde do Trabalhador (#15)	67%	1
Doenças Virais (#16)	67%	2

Frase-mãe permitida: não é coincidência, é blueprint. O REVALIDA e o ENAMED são exames do INEP ancorados na mesma Matriz de Referência Comum (Portaria INEP 478/2025), e é essa base compartilhada, somada ao tagueamento 7D e à predição estatística validada em 17 edições, que explica a aderência entre banco de questões, radar de temas e provas reais, e não qualquer forma de acesso privilegiado ao conteúdo da prova. Pela MP 1.370/2026, a 2ª etapa do ENAMED, aplicada ao fim do 6º ano, passa a substituir o teórico do REVALIDA, reforçando que o alinhamento de matriz entre os dois exames deixou de ser coincidência estatística para se tornar arquitetura institucional.

Mesmo número de acertos, notas finais diferentes

62 acertos em 100 questões, dois resultados opostos

Aluno A

Acertos concentrados em itens fáceis

Abaixo do corte

Fácil (30 itens)28/30

Médio (40 itens)30/40

Difícil (30 itens)4/30

Theta estimado

-0,62

Nota final

54,0

Aluno B

Acertos distribuídos, incluindo itens difíceis

Acima do corte

Fácil (30 itens)20/30

Médio (40 itens)24/40

Difícil (30 itens)18/30

Theta estimado

+0,15

Nota final

66,0

Corte ENAMED: NF 60,0 equivale a θ = -0,40 na escala Rasch. Acertar itens difíceis pesa mais que acumular acertos em itens fáceis.

Perguntas frequentes

Percentual de acerto e nota TRI são a mesma coisa no ENAMED?

Não. O percentual de acerto é uma contagem bruta de questões corretas, enquanto a nota TRI (NF) deriva do parâmetro theta (θ), que pondera cada acerto pela dificuldade calibrada do item. Dois candidatos com o mesmo percentual de acerto podem ter NF diferentes, dependendo de quais questões específicas cada um acertou.

O que significa o corte de 60,0 na escala do ENAMED?

Significa θ = -0,40 na escala Rasch, obtido pela metodologia Angoff Modificado (Nota Técnica INEP 19/2025). Não corresponde a "60 questões certas em 100", mas a um nível de proficiência estimado estatisticamente a partir do padrão completo de respostas do candidato.

Por que uma turma com boa média de acertos ainda pode ter Conceito 2?

Porque o Conceito depende da proporção de alunos com θ acima do corte de proficiência, não da média bruta de acertos. Se os acertos da turma estiverem concentrados em questões fáceis e os erros em questões difíceis e discriminativas, o θ médio pode ficar abaixo do necessário mesmo com percentual de acerto aparentemente satisfatório.

Qual a diferença entre predição de temas e predição de Conceito no ENAMED?

São modelos distintos. A predição de temas usa Empirical Bayes sobre 17 edições do INEP e acerta de 80% a 90% no top 10 por edição, indicando quais assuntos têm maior chance de aparecer na prova. A predição de Conceito usa o M.A.E.S.T.R.O, baseado em TRI/Rasch 1PL, com 94% de acurácia, e estima a nota e classificação de proficiência institucional. Uma não substitui a outra.

O banco de questões da SPR Med tem acesso à prova real do ENAMED ou REVALIDA?

Não. A aderência observada entre o banco SPR Med e provas reais decorre do fato de ambos os exames seguirem a mesma Matriz de Referência Comum (Portaria INEP 478/2025), do tagueamento próprio na Matriz Pedagógica 7D e da predição estatística validada em 17 edições históricas do INEP. Não há acesso a conteúdo de prova, apenas alinhamento estrutural de matriz e modelagem preditiva.

Como uma faculdade pode saber se seu simulado interno reflete o θ real dos alunos?

É necessário verificar se o simulado é calibrado por TRI, com parâmetros de dificuldade próprios, e se a devolutiva inclui estimativa de θ e projeção de Conceito, não apenas percentual de acerto. Leia tambémComo Saber se o Simulado da Sua IES Antecipa a Prova Real: 5 Critérios → detalha os cinco pontos que diferenciam um simulado estatisticamente confiável de uma simples lista de questões.

Escrito por

Dr. Matheus Ferreira

CEO e Co-Fundador do SPR Med · CRM-SP 206.304

Médico, MBA em HealthTech (FIAP) e Gestão em Saúde (FGV). Publicado em Scientific Reports (Nature Portfolio). Liderou conteúdo médico para mais de 145.000 alunos antes de fundar o SPR Med.

Próximo passo

Quer conversar com os fundadores?

45 minutos com Dr. Matheus Ferreira e Dr. Vinícius Côgo Destefani. Sem compromisso comercial.

Conheça a plataforma SPR Med