문항 반응 이론 (IRT)

문항 반응 이론 (IRT: Item Response Theory)은 어떤 측정 도구가 아이디어랑 일치해야 한다는 것을 말한다.
문항 반응 이론 (IRT)
Paula Villasante

작성 및 확인 심리학자 Paula Villasante.

마지막 업데이트: 27 12월, 2022

문항 반응 이론 (IRT: Item Response Theory)은 어떤 측정 도구가 아이디어랑 일치해야 한다는 것을 말한다.

심리적 개입의 가장 중요한 과제 중 하나는 평가이다. 이 평가는 종종 테스트 결과에 의해 결정된다.  이점에서 문항 반응 이론은 종종 테스트 결과에 의해 결정된다. 이 점에서 문항 반응 이론은 고전 검사 이론을 보완하는 시험 측정 이론이다.

고전 검사 이론과 문항 반응 이론

고전 검사 이론(CTT)과 문항 반응 이론(IRT)은 동일한 테스트를  평가할 수 있다. 각 항목별로 관련성이나 점수를 정할 수 있다.

따라서 테스트를 치르는 사람마다 다른 결과를 얻을 수 있다. 그러나 문항 반응 이론이 더 보정된 값으로 이어진다는 점을 언급해야 한다.

그러나 그것은 종종 더 많은 비용이 들고 전문가의 참여를 필요로 한다.

이 두 개의 테스트 이론은 동일한 목표를 갖고 있다. 가능한 최소한의 오차를 가지고 측정하고자 하는 것을 측정하는 도구를 만들기 때문이다. 이것은 정신감정학이 어느 정도의 신뢰성과 타당성을 요구하기 때문이다.

시험이 동일한 수준의 전문성을 가진 두 명의 테스트 응시자의 성능을  더 잘 복제할 수록 또는 다른 경우에 동일한  응시자의 성능이 더 안정적이다. 반면에 타당성은 실증적 증거와 이론이 시험 점수의 해석을 뒷받침하는 정도를 말한다.

문항 반응 이론 테스트2

고전 검사 이론의 한계와 문항 반응 이론

비록 매우 가치가 있었지만 고전 검사 이론에는 약간의 한계가 있다. CTT에서 도구의 측정은 불변성이 아니다. 예를 들어, 심리학자가 각각 다른 테스트를 통해 세 명의 사람의 지능을 평가할 것이라고 상상해보라. 이 경우 당신은 결과를 비교하지 못한다. 왜 그럴까?

왜냐하면 각각의 테스트는 자체적인 스케일이 있기 때문이다. 따라서 예를 들어 사람들의 그룹의 지능을 비교하기 위해서 여러분은 다른 척도에서 점수를 바꿀 필요가 있을 것이다.

한편, IRT는 동일한 척도로 다른 도구를 사용할 때 그 결과를 비교할 수 있게 해준다. 또한 고전적인 시험 이론의 또 다른 한계는  그것을 결정하기 위해 사용하는 사람에 관한 시험 속성의 불변성이 없다는 것이다. IRT는 그러한 측면을 개선할 수 있다.

문항 반응 이론의 가정

이러한 한계를 해결하기 위해 문항 반응 이론(IRT)은 고전 검사 이론(CTT)보다 강력하고 제한적인 가정을 해야 한다.

첫 번째 가정

문항 반응 이론의 가장 중요한 가정은 어떤 측정 도구가 아이디어와 일치해야 한다는 것을 말해준다. 즉, 항목의 가변값과 일치할 확률 사이에는 기능적 관계가 있어야 한다. 이 기능을 문항 특성곡선(ICC)이라고 한다.

그러므로 우리는 IRT가 이 새로운 아이디어로 CTT를 향상시킨다고 말할 수 있다. 예를 들어, 지능 테스트 동안 가장 똑똑한 사람들만이 가장 어려운 질문에 대답할 수 있었다. 반면에 만약 시험을 보는 모든 사람들이 어떤 항목에 대해 같은 대답을 한다면 그 항목은 그 과목의 전문성 수준을 결정할 수 없을 것이다.

두 번째 가정

두 번째 가정은 대부분의 모델은 항목이 단일 차원의 일부라고 가정한다. 다시 말하면, 그들은 1차원적이라는 것이다. 따라서 이러한 유형의 모델을 사용하기 전에 데이터가 이 일차원성을 준수하는지 확인해야 한다. 불행히도 심리학자들이 자주 사용하는 많은 도구들은 다차원적인 자료를 수집한다.

문항 반응 이론 테스트3

세 번째 가정

항목 응답 이론의 세 번째 가정은 지역적 독립이다. 즉, 이러한 모델을 이용하기 위해서는 아이템이 서로 독립적이어야 한다. 따라서 한 항목에 대한 답변은 다른 항목에 대한 응답에 영향을 미칠 수 없다. 따라서 비정상이 충족되면 국지적 독립도 실현된다. 이는 측정된 치수와 관련된 항목 또는 공유된 분산에 상호의존성이 없는 경우에만 가능하다. 따라서 두 가정 모두 관련이 있다.

무뇨즈(2010년)는 정신분석학과 시험해석의 분야에서 진보의 중요성을 지적했다. 그러므로 논리적으로 해야 할 일은 이 방향으로 한 걸음 더 나아가기 시작하는 것이다. 왜냐하면 문항 반응 이론(IRT)에 따라 분석된 테스트가 현재 측정되고 있는 방법에 대한 우려스러운 결과를 보여기 때문이다.

이 글은 어떤가요?
성격 테스트는 어떤 유형이 있을까? 5개 테스트의 비교와 대조
Wonderful Mind
읽어보세요 Wonderful Mind
성격 테스트는 어떤 유형이 있을까? 5개 테스트의 비교와 대조

성격 테스트는 심리적인 연습에서 가장 널리 사용되는 도구 중 하나이다. 성격은 확실히 측정하기 어렵고, 사람이라는 존재를 독특하게 만드는 역할이 있지만, 성격 테스트는 생각보다 더 유용하다. 우선 어떤 테스트 무엇을 측정하는지, 어떤 방법을 사용하는지 알아야 한다...



  • Cuesta, M. y Muñiz, J. (1999). Robustness of item response logistic models to violations of the unidimensionality assumption. Psicothema, Vol. 11, 175-182
  • Muñiz, J. (1997) Introducción a la teoría de respuesta a los ítems. Madrid: Pirámide.
  • Muñiz, J. (2000). Teoría Clásica de los Tests. Madrid: Pirámide.
  • Muñiz Fernández, J. (2010). Las teorías de los tests: teoría clásica y teoría de respuesta a los ítems. Papeles del Psicólogo: Revista del Colegio Oficial de Psicólogos.

'원더풀 마인드' 콘텐츠는 오직 교육 및 정보 제공을 목적으로 하며 어떠한 경우든 전문가의 진단, 치료 또는 권고를 대신할 수 없습니다. 의문 가는 점이 있다면 반드시 전문가와 상담하시기 바랍니다.