Elementlarning javob nazariyasi

Zamonaviy (nazariyasi Berilgan javob nazariyasi) – (baʼzan rus tilida – zamonaviy test nazariyasi, topshiriqlarga javoblar nazariyasi, pedagogik testlarni modellashtirish va parametrlashtirish nazariyasi) turli xil vazifalarga mavzularning toʻgʻri javob berish ehtimolini baholashga imkon beruvchi usullar toʻplami. qiyinchilik. U soʻrovnomadagi yomon (axborot boʻlmagan) savollardan xalos boʻlish, yashirin konstruktsiyalarning bir-biri bilan va kuzatilgan oʻzgaruvchilar bilan aloqasini baholash, respondentlarga topshiriqlarni taqdim etishni optimallashtirish va boshqalar uchun ishlatiladi. Rus tilida „Item Response Theory“ nomi tarjima qilingan. turli yoʻllar bilan. YU. Neumann va V. Xlebnikov uni „Pedagogik testlarni modellashtirish va parametrlashtirish nazariyasi“ (TMPT) deb nomlashni taklif qiladi ^{[Neyman Yu. M., Xlebnikov V. A. Vedenie v teoriyu modellashtirish va parametrizatsii pedagogik testov. -M.: Prometey, −169 s. “Arxivirovannaya nusxa”. 2017-yil 4-iyunda asl nusxadan arxivlangan. Qaraldi: 2017-yil 3-iyun. 1]} . V. Avanesov – „Test topshiriqlarining yashirin parametrlarini va test topshiruvchilarning tayyorgarlik darajasini baholashning matematik-statistik nazariyasi“ ^[1] . Biroq, tarjimaning eng muvaffaqiyatli usullaridan biri bu „zamonaviy test nazariyasi“ dir, chunki uning modellari test topshiriqlarini yoki testning oʻzini emas, balki respondentlar va topshiriqlarning oʻzaro taʼsiri natijasini (va koʻplab zamonaviy modellar ham jarayonni tasvirlaydi) tasvirladi.

Psixometriyada zamonaviy test nazariyasi (IRT) testlar, anketalar va shunga oʻxshash oʻlchov vositalarini loyihalash, tahlil qilish va baholash uchun paradigma hisoblanadi. Ushbu test nazariyasi element javoblarining taxminiyligi va umumiy bilim sifati oʻrtasida bogʻliqlik mavjudligini koʻrsatadi. Vazifalar va respondentlarning maqsadli parametrlarini baholash uchun turli statistik modellar qoʻllanadi . Tarozilarni tuzish va anketa javoblarini baholashning oddiy muqobillaridan farqli oʻlaroq, zamonaviy test nazariyasi har bir savol bir xil darajada qiyin deb hisoblamaydi. Bu IRTni, masalan, Likertning masshtablashdagi „barcha ob’ektlar bir-birining replikatsiyasi sifatida qabul qilinadi yoki boshqacha qilib aytganda: ob’ektlar bir-birini almashtiruvchi hisoblanadi“ ^[2] farazidan farq qiladi. Bundan farqli oʻlaroq, zamonaviy sinov nazariyasi har bir elementning parametrlarini (bu elementning ICC (buyumning xarakteristikasi egri chizigʻini) belgilaydi) modelni kalibrlashda kiritilishi kerak boʻlgan maʼlumot sifatida koʻrib chiqadi.

Shunday qilib, IRT har bir respondentning har bir test topshirigʻiga javob berish ehtimolini modellashtiradi. Zamonaviy test nazariyasining asosiy xususiyati va uning asosiy taʼrifi respondentlar va vazifalar parametrlarini ajratish gʻoyasidir. Yaʼni, topshiriqga toʻgʻri javob berish ehtimoli respondent va topshiriqning yashirin parametrlarining oʻzaro taʼsiri natijasidir. Ularning oʻzaro taʼsirining oʻziga xos usuli tadqiqotchining taxminlari bilan belgilanadi va maʼlum bir matematik funktsiya tenglamasiga – zamonaviy test nazariyasi modeliga tarjima qilinadi.

Zamonaviy test nazariyasi modellari tasdiqlovchi omillar tahlili, umumlashtirilgan chiziqli aralash effektlar modellari, statistik fizikadan tarmoq modellari (Markov maydonlari va Ising modeli) va tanlangan maʼlumotlar fanining usullari (modelga asoslangan hamkorlikda filtrlash usullari va cheklangan Boltzmann mashinalari) bilan chambarchas bogʻliq. Zamonaviy IRT modellari yangi axborot manbalarini modellashtirish imkonini beradi (masalan, javob vaqtlari, elementlarni echishga urinishlar); turli yashirin oʻzgaruvchilar oʻrtasidagi murakkab chiziqli boʻlmagan (masalan, shift) munosabatlar; ochiq javoblar uchun ball beruvchi model baholovchi effektlari (va yakuniy qobiliyat ballarining baholovchiga nisbatan oʻzgarmasligiga imkon beradi); kompozit va koʻp oʻlchovli konstruktsiyalarni modellashtirish; vaqt oʻtishi bilan yashirin oʻzgaruvchi darajasidagi model oʻzgarishi; reyting modelini klassifikatorga aylantiradigan diskret qobiliyat ballaridan foydalaning va hokazo. Bugungi kunda IRT hisoblash xulq-atvori fanining eng ilgʻor va nazariy asoslangan yoʻnalishlaridan biridir.

Hikoya

IRTni yaratish uchun umumiy manba shaklning logistik funktsiyasi deb ataladigan narsa edi $y={\frac {e^{x}}{1+e^{x}}}$ , biologiya fanida 1844 yildan beri maʼlum. Oʻshandan beri u biologiyada oʻsimlik massasining oʻsishini yoki organizmlarning oʻsishini modellashtirish uchun keng qoʻllanila boshlandi. Psixologik va pedagogik oʻlchov modeli sifatida u 20-asrning 50-yillaridan boshlab qoʻllanila boshlandi. IRT modellarini ishlab chiqishning kelib chiqishi test topshiriqlarining rasmiy xususiyatlarini vizualizatsiya qilish istagi, klassik test nazariyasining koʻplab kamchiliklarini bartaraf etishga urinishlar, oʻlchovlarning aniqligini oshirish va nihoyat, moslashtirish orqali boshqarish jarayonini optimallashtirish istagida yotadi. kompyuter yordamida talabaning tayyorgarligi darajasini aniqlash uchun test ^[1] .

IRTning nazariya sifatidagi dastlabki ishi 1950-1960-yillarda paydo boʻlgan. Bular Educational Testing Service^[en] aʼzolari edi: Фредерик Лорд^[en] daniyalik matematik Георг Раш^[en] va avstriyalik sotsiolog Pol Lazarsfeld . IRT taraqqiyotiga yordam bergan asosiy shaxslar Бенджамин Дрейк^[en] va Дэвид Андрич^[en] dir.

IRTni yaratishning dastlabki shartlaridan biri Alfred Binet va Teodor Saymonning tadqiqot ishlarining natijalari edi ^[3], bu mualliflarning turli yoshdagi bolalarga qanday qilib, majoziy maʼnoda, qanday qilib topshirganligini aniqlash istagini aks ettirdi. ish." Keyin koordinata tekisligiga nuqtalarni qoʻyib, yoshi (yillarda) x oʻqi boʻylab va har bir yosh guruhidagi sub’ektlarning toʻgʻri javoblar nisbati ordinata oʻqi boʻylab chizilgan, natijada olingan nuqtalar Har bir guruh uchun oʻrtacha, keyinchalik xarakterli deb ataladigan egri chiziqqa oʻxshardi.

1936 yilda M. V. Richardson keng koʻlamli empirik tadqiqot oʻtkazdi, 803 ta topshiriq boʻyicha 1200 talabadan soʻrov oʻtkazdi, uning davomida talabalar test natijalariga qarab har biri yuz kishidan iborat 12 guruhga boʻlingan. U birinchi boʻlib test topshiriqlarining egri chizigʻining oʻzgaruvchanligiga eʼtibor qaratdi va tiklik oʻlchovini vazifaning farqlash qobiliyatini taxminiy baholash sifatida koʻrib chiqishni taklif qildi ^[4] . MVt Richardson, koʻrinishidan, birinchi boʻlib ishlab chiqilgan test topshiriqlarining rasmiy xususiyatlarini grafik koʻrsatish uchun oʻrtacha balldan foydalanish samaradorligini tushundi ^[5] .

Xususan, IRTning maqsadi baholashlar qanchalik yaxshi bajarilishini va individual baholash elementlari qanchalik yaxshi ishlashini tahlil qilish uchun asos yaratishdir. Zamonaviy test nazariyasining eng keng tarqalgan qoʻllanilishi taʼlimda boʻlib, psixometrlar undan imtihonlarni ishlab chiqish va loyihalash, imtihonlar uchun savollar banklarini yuritish va imtihonlarning keyingi versiyalari uchun savollarni solishtirish uchun foydalanadilar ^[6] . Ushbu sohada, sinov natijalari boʻyicha qabul qilingan qarorlarning yuqori ulushi tufayli, oʻlchov vositalarining sifatini argumentatsiya qilish ishlab chiquvchi mas’uliyatining oʻta muhim elementi va uning asbobining raqobatdosh ustunligi boʻlib, zamonaviy sinov nazariyasi modellari egallaydi. bu bahsning asosiy joylaridan biri.

Elementga javob berish funktsiyasi IRF

IRF maʼlum bir qobiliyat darajasiga ega boʻlgan odamning biror narsaga toʻgʻri javob berish ehtimolini beradi.

Uch parametrli logistika modeli

1-rasm: 3PL IRF namunasi.

Zamonaviy test nazariyasining uch parametrli logistik modeli (3PL) dixotomiyali i topshirigʻiga (odatda bir nechta taklif qilinganlardan bitta javobni tanlagan savol) toʻgʻri javob berish ehtimolini belgilaydi:

p_{i}({\theta })=c_{i}+{\frac {1-c_{i}}{1+e^{-a_{i}({\theta }-b_{i})}}}

Qayerda ${\theta }$ odatda normal taqsimotga amal qiladi (marginallashtirilgan modellarda). Model kalibrlangandan soʻng, har bir respondentning natijalarni foydalanuvchilarga etkazish qobiliyati baholanadi. $a_{i}$ , $b_{i}$ Va $c_{i}$ – bu vazifa parametrlari. Vazifa parametrlari vazifaga javob berish funksiyasi shaklini belgilaydi. 1-rasmda 3PL modelidan model ishining xarakteristikasi egri chizigʻi koʻrsatilgan.

Vazifa parametrlarini standart logistika funktsiyasi shaklini oʻzgartirish sifatida talqin qilish mumkin:

P(t)={\frac {1}{1+e^{-t}}}.

Test topshiriqlarini tavsiflovchi parametrlar:

b – qiyinchilik. Bu qiymat savolning qanchalik oson yoki qiyinligini koʻrsatadi. $p(b)=(1+c)/2$ – funksiyaning burilish nuqtasida masalani yechish ehtimoli.
a – diskriminativlik. Bu qiymat ushbu savolning oʻquvchilarni qobiliyat darajasi boʻyicha qanchalik samarali ajratishi mumkinligini koʻrsatadi (qoida tariqasida, vazifalarning yuqori diskriminativligi maqsadga muvofiqdir – bu zaif respondentlar vazifani hal qilmasligini koʻrsatadi, lekin kuchlilar bajaradi).
c – psevdo-tasodifiy taxmin qilish ehtimoli. Bu qiymat sub’ektlarning berilgan variantlardan tasodifiy tanlab toʻgʻri javob olishlari ehtimolini koʻrsatadi. $p(-\infty )=c$ – asimptotik minimum. Biroq, 3PL modeli 3PL modeli parametrlarining klassik fkventist bahosi yoki boshqa vazifa parametrlari boʻyicha cheklovlar yoʻqligi bilan nomaʼlum.

IRT modellari

IRT modellarini ikkita oilaga boʻlish mumkin: bir oʻlchovli va koʻp oʻlchovli. Bir oʻlchovli modellar oʻlchovning yagona qiymatini (imkoniyatini) talab qiladi ${\theta }$ . Koʻp oʻzgaruvchan IRT modellaridagi javoblar respondentlarni tavsiflovchi bir nechta yashirin oʻzgaruvchilarga bogʻliq deb taxmin qilinadi.

IRT modellarini element ballari boʻyicha ham tasniflash mumkin. Koʻpincha, vazifalar dixotomiyadir (mumkin ballar 0 (hamma narsa notoʻgʻri) yoki 1 (hamma narsa toʻgʻri)). Modellarning boshqa klassi politomli topshiriqlarga nisbatan qoʻllanadi, bunda har bir javob topshiriqning qisman toʻgʻriligini aks ettiradi ^[7] . Buning keng tarqalgan misoli Likert shkalasi javoblari boʻlgan elementlardir, masalan, „0 dan 4“ gacha.

Funktsiyalarning analitik spetsifikatsiyasiga kiritilgan parametrlar soni mantiqiy funktsiyalar oilalarini sinflarga boʻlish uchun asosdir.

Logistika funktsiyalari orasida ^[8] :

1) G. Rashning bir parametrli modeli (Georg Rash)— $P_{i}(\theta )={\frac {e^{(\theta -b_{i})}}{1+e^{(\theta -b_{i})}}}$ , Qayerda $\theta$ Va $b_{i}$ – mos ravishda respondentlarning parametrlari va i vazifa;

Baʼzan koʻrsatkich belgisi ostida 1,702 koeffitsienti kiritiladi, bu Rasch modelini A modeliga moslashtirish uchun ishlatiladi. Fergusson, bu yerda topshiriqga toʻgʻri javob berish ehtimoli normal taqsimotning integrali (normal taqsimotning yigʻilgan ehtimollik zichligi formulasi) bilan ifodalanadi, bu sizga standart normalning yaxshi oʻrganilgan integral funktsiyasidan foydalanishga imkon beradi. logistik egri chiziqlar oʻrniga taqsimlash.

2-rasm: Modeldagi (1PL) element xarakteristikasi egri chiziqlari (ICC)

Rasch modeli „1 parametrik logistik latent xususiyat modeli“ (1PL) deb ataladi va A. Fergusson – „1 Parametrik Normal Ogive Modeli“ (1PNO). Rasch modeli respondentning vazifani bitta parametr funktsiyasi sifatida hal qilish ehtimolini tavsiflaganligi sababli (farq $\theta _{j}-b_{i}$ ; baʼzi talqinlarda – vazifa faqat bitta parametrga ega boʻlganligi sababli $b_{i}$ ), u zamonaviy test nazariyasining bir parametrli modeli deb ataladi.

Ikki toʻplamning oʻzaro taʼsiri ${\theta _{j}}$ Va $b_{i}$ „birlashgan qoʻshilish“ xususiyatiga ega boʻlgan maʼlumotlarni shakllantiradi. Rasch modelidan toʻgʻri foydalanish respondentlar qaysi vazifalarga javob berishlari va respondentlar ularga javob beradigan vazifalar parametrlarining toʻliq mustaqilligiga erishishga imkon beradi. Rasch modeli yordamida oʻlchovlarning bu xususiyati maxsus ob’ektivlik deb ataladi.

3-rasm: 1PL modelidagi mavzu xarakteristikasi egri chiziqlari (PCC).

4-rasm: Ikki parametrli 2PL modelidagi ICC.

5-rasm: uch parametrli 3PL modelidagi ICC.

Shaklda. 2-rasmda vazifalarning qiyinchiliklari −2, 0 va +2 logitlar boʻlgan uchta xarakterli egri chiziq koʻrsatilgan (birinchisi eng oson, ikkinchisi oʻrtacha, uchinchisi eng qiyin). Berilgan bogʻliqliklardan koʻrinib turibdiki, sub’ektning th tayyorgarlik darajasi qanchalik yuqori boʻlsa, muayyan vazifani bajarishda muvaffaqiyatga erishish ehtimoli shunchalik yuqori boʻladi. Masalan, bilan mavzu uchun ${\theta _{j}}=0$ birinchi vazifaga toʻgʻri javob berish ehtimoli birga yaqin, ikkinchisi 0,5, uchinchisi esa deyarli nolga teng. Eʼtibor bering, qaerda nuqtalarda ${\theta _{j}}=b$ toʻgʻri javob ehtimoli 0,5 ga teng. Yaʼni, agar topshiriqning qiyinligi sub’ektning tayyorgarlik darajasiga teng boʻlsa, u bu vazifani teng ehtimollik bilan engishi yoki muvaffaqiyatsiz boʻlishi mumkin.

Shaklda. 3-rasmda sub’ektlarning uchta xarakterli egri chizigʻi koʻrsatilgan – „Shaxsning xarakteristikasi egri chizigʻi“ (PCC). Tayyorlik darajasi −2 logit (eng zaif), 0 logit (oʻrtacha) va +2 logit (eng kuchli mavzu) boʻlgan uchta fan uchun grafiklar koʻrsatilgan.

Yuqoridagi bogʻliqliklardan koʻrinib turibdiki, tayyorgarlik darajasi qanchalik yuqori boʻlsa, topshiriqga toʻgʻri javob berish ehtimoli shunchalik yuqori boʻladi. Masalan, qiyinligi b = 0 boʻlgan vazifa birinchi mavzu uchun (q=-2) amalda mumkin emas, ikkinchisi (q = 0) 0,5 ga teng, uchinchisi (q=+2) uchun vazifani bajarish ehtimoli bor. vazifani osongina engishi mumkin, chunki u uchun muvaffaqiyat ehtimoli deyarli birga teng.

2) А. Бирнбаума^[en] ikki parametrli modeli : $P_{i}(\theta )={\frac {e^{a_{i}(\theta -b_{i})}}{1+e^{a_{i}(\theta -b_{i})}}}$

Agar test turli xil farqlash qobiliyatiga ega boʻlgan vazifalarni oʻz ichiga olgan boʻlsa ( $a_{i}$ ), keyin bir parametrli 1PL modeli bunday maʼlumotlarni tasvirlay olmaydi. Ushbu qiyinchilikni bartaraf etish uchun A.Birnbaum yana bir parametrni kiritdi – $a_{i}$ (moddani diskriminatsiya parametri), diskriminativlik parametri.

Parametr $a_{i}$ i-vazifaning xarakterli egri chizigʻining qiyaligini (tikligini) aniqlaydi. Xarakterli egri chiziqlarga misollar shaklda koʻrsatilgan. 4. Koʻproq ekanligi aniq $a_{i}$ egri chiziq qanchalik tik boʻlsa va vazifani farqlash qobiliyati shunchalik yuqori boʻladi.

3) A.Birnbaumning uch parametrli modeli: $P_{i}(\theta )=c_{i}+(1-c_{i}){\frac {e^{a_{i}(\theta -b_{i})}}{1+e^{a_{i}(\theta -b_{i})}}}$

Qayerda $c_{i}$ i-topshiriqga toʻgʻri javob berish ehtimolini tavsiflovchi topshiriqning uchinchi parametridir.

Empirik maʼlumotlarga yanada yaxshiroq moslashish uchun A. Birnbaum uchinchi parametrni kiritdi $c_{i}$ – taxminiy parametr. Shaklda. 5-rasmda qiyinchilik bilan uchta vazifa uchun xarakterli egri chiziqlar misollari koʻrsatilgan $b_{i}$ = 1, diskriminatsion parametr $a_{i}$ = 1 va turli taxmin parametrlari $c_{i}$ = 0, $c_{i}$ = 0,25, $c_{i}$ = 0,5. Yuqoridagi grafiklardan koʻrinib turibdiki, taxminiy parametrning mavjudligi ICC ning proportsional siqilishiga olib keladi. $c_{i}$ 1 ga.

4) A.Birnbaumning toʻrt parametrli modeli: $P_{i}(\theta )=c_{i}+(d_{i}-c_{i}){\frac {e^{a_{i}(\theta -b_{i})}}{1+e^{a_{i}(\theta -b_{i})}}}$

Qayerda $d_{i}$ i-topshiriqga javob berishda xatolik ehtimolini tavsiflovchi vazifaning toʻrtinchi parametridir. Ushbu modelda xarakterli egri chiziq 3PL modeliga oʻxshash siqiladi, lekin undan emas $c_{i}$ 1 ga va dan $c_{i}$ oldin $d_{i}$ .

Shunday qilib, 2PL modeli 1PL modelining turli xil diskriminativ parametrlarga ega boʻlgan vazifalarga umumlashtirilishi va 3PL modeli 2PL modelining turli taxmin parametrlariga ega boʻlgan vazifalar holatiga umumlashtirishdir va shu bilan birga, u, oʻz navbatida, 4PL modelining alohida holati.

Monotonik boʻlmagan xarakterli egri chiziqli vazifalarni tavsiflovchi „5PL“ modellari ham mavjud – bu maʼlum bir qobiliyat darajasiga qadar vazifani hal qilish ehtimolining oshishini, keyin esa uning pasayishini aks ettiradi.

Rasch modeli

Rasch oilasi modellarining oʻziga xos xususiyati (shu jumladan politom modellar) vazifalarning xarakterli egri chiziqlarining parallelligidir (ular kesishmaydi), 2-rasmga qarang. 3. Bu shuni anglatadiki, osonroq vazifani hal qilish ehtimoli har doim qiyinroq boʻlganidan past boʻladi – bu qobiliyatning butun uzluksizligi boʻyicha vazifalar ierarxiyasini yaratadi va uni sifat jihatidan talqin qilishga imkon beradi.

6-rasm: Uch parametrli modeldagi kesishgan ICClar.

Ikki va uch parametrli modellar uchun butunlay boshqacha rasm kuzatiladi. Bu 4-rasmda aniq koʻrinadi. Bilan topshiriq $a_{i}$ th ning ijobiy qiymatlari mintaqasida = 0,5 taqdim etilgan uchta vazifaning eng qiyini, yaʼni bu vazifaga toʻgʻri javob berish ehtimoli eng past. q ning manfiy qiymatlari mintaqasida xuddi shu vazifa endi eng oson – unga toʻgʻri javob berish ehtimoli eng katta. Maʼlum boʻlishicha, zaif oʻquvchilar uchun bu eng oson, kuchli talabalar uchun esa eng qiyin. Shunday qilib, Rasch modellaridan farqli oʻlaroq, 2PL-dagi vazifalar ierarxiyasi qobiliyatning butun uzluksizligi boʻyicha emas, balki xarakterli egri chiziqlarning bir kesishmasidan (har qanday) ikkinchisiga oʻtadi, shundan soʻng vazifalarning yangi ierarxiyasi boshlanadi, bu esa ularni tahlil qilishdan mahrum qiladi. barcha amaliy mulohazalar ierarxiyasi.

Xuddi shunday rasm uch parametrli model uchun ham kuzatiladi. 5-rasmda kesishmaydigan xarakterli egri chiziqlarning kamdan-kam holatlari koʻrsatilgan, chunki ular uchun bir xil parametrlar tanlangan. $b_{i}$ =1 va $a_{i}$ =1, yaʼni uchta vazifa ham bir xil qiyinchilik va bir xil diskriminativlik parametriga ega.

6-rasmda yana bir misol koʻrsatilgan. Bu yerda parametr bilan vazifa $c_{i}$ =0 qiyinchilik oʻzgartirildi $b_{i}$ = −1, bu darhol xarakterli egri chiziqlarning kesishishiga sabab boʻldi. Bilan topshiriq $c_{i}$ =0 mintaqada th < -2 eng qiyin. Mintaqada -1,5 < th < -1 bu vazifa topshiriqdan koʻra osonroqdir $c_{i}$ =0,25 va undan ortiq qiyin vazifalar bilan $c_{i}$ =0,5. Mintaqada th > −1 vazifa bilan $c_{i}$ =0 eng oson. Amalda ICC ning bunday kesishishi har doim 2PL va 3PL modellarida sodir boʻladi.

Biroq, faqat xarakterli egri chiziqlarning parallelligi oʻziga xos ob’ektivlik xususiyatiga olib kelishi mumkin, yaʼni. , faqat Rasch modellari respondentlar parametrlari va vazifalarning bir-biridan mustaqilligini taʼminlashga qodir. Biroq, bu 2PL va undan yuqori modellarda oʻziga xos psixometrik muammolarni hal qilish mumkin emas degani emas.

Zamonaviy test nazariyasining asosiy taxminlari

1) Respondentlar va vazifalarning yashirin/yashirin parametrlari mavjud (ular bevosita kuzatilmaydi). Masalan, razvedka testida bu test topshiruvchining aql darajasi va topshiriqning qiyinchilik darajasi (Rasch modellarida).

2) koʻrsatkichlar mavjud boʻlib, ularning namoyon boʻlish ehtimoli yashirin parametrlar bilan belgilanadi. Biroq, parametrlardan farqli oʻlaroq, koʻrsatkichlar kuzatish uchun mavjud. Koʻrsatkich qiymatlariga asoslanib, yashirin parametrlarning qiymatlarini baholash mumkin.

3) Eskirgan formula: baholanayotgan yashirin oʻzgaruvchi bir oʻlchovli boʻlishi kerak (shkala faqat bitta oʻzgaruvchini oʻlchashi kerak). Agar bir oʻlchovlilik sharti bajarilmasa, u holda testni qayta ishlash kerak. Bir oʻlchovlilikni buzadigan barcha elementlar oʻlchovdan olib tashlanishi yoki ishga tushirish uchun oʻzgartirilishi kerak, chunki u model taxminlarini buzadi va parametr baholarining talqinini ifloslantiradi.

Zamonaviy shakllanish: Vazifalar respondentlarning parametrlaridan mahalliy darajada mustaqil boʻlishi kerak. Bu shuni anglatadiki, respondentlar parametrlarini nazorat qilishda elementlarga javoblar oʻrtasida kovariatsiya yoʻq. Boshqacha qilib aytganda, agar siz maʼlum bir qobiliyat darajasiga ega boʻlgan barcha respondentlarni tanlasangiz (masalan, 1 logitga teng va buni qobiliyatning har bir mumkin boʻlgan qiymati uchun qilsangiz), unda ularning topshiriqlarga javoblari mutlaqo tasodifiydir. Bunday holda, vazifalarni bogʻlaydigan barcha maʼlumotlar respondentlarning qobiliyat darajasi boʻlib, u model tomonidan chiqariladi va qoldiqlar oʻrtasida kovariatsiya yoʻq (topshiriqlarning mahalliy miqyosda respondentlar parametrlariga bogʻliqligi). Ushbu formula topshiriqlarning mahalliy bogʻliqligini (testning bir oʻlchovsizligi) bartaraf etish usullarining koʻproq umumiyligini taʼminlaydi, chunki u modelga respondentlarning qoʻshimcha parametrlarini kiritishga imkon beradi (modelni bifaktor yoki testlet modeliga aylantirish), respondentlar va testletlarning oʻzaro taʼsiri (mahalliy qaramlikni koʻrsatadigan vazifalar guruhlari). Bunday holda, respondentlarning qoʻshimcha parametrlari bifaktorli modellardan oʻziga xos omillar sifatida ishlaydi va mahalliy qaramlikni „singdiradi“. Ularning nazorati bilan ushbu parametrlar sonini koʻpaytirish orqali respondentlarning parametrlari boʻyicha mahalliy mustaqillikka erishish mumkin. Shu bilan birga, bu taxmin zamonaviy test nazariyasini atalmish nazariyaga integratsiya qilish imkonini beradi. shartli kovariatsiya nazariyasi, uning barcha sinflari ushbu taxmin bilan tavsiflanadi: $Cov(Y_{i},Y_{j}|\theta )=0$ har qanday uchun $i\neq j$ , Qayerda $Y$ – topshiriqlarga javoblar. Shartli kovariatsiya nazariyasi yashirin sinf tahlili, kognitiv diagnostika modellari, tasdiqlovchi omillar tahlili, Bayes tarmoqlari va yashirin oʻzgaruvchilarni modellashtirishning boshqa usullarini oʻz ichiga oladi.

Zamonaviy va klassik test nazariyalarini solishtirish ^[9]

	Klassik test nazariyasi (CTT)	IRT (Rasch modellari)
1	Test topshiriqlarining qiyinligini baholash test topshiruvchilarning maʼlum bir namunasining tayyorgarlik darajasiga bogʻliq	Test topshiriqlarining qiyinligini baholash test natijalari olingan sub’ektlar kontingentiga nisbatan oʻzgarmasdir.
2	Test topshiruvchilarning tayyorgarlik darajasini baholash (birlamchi ballar) maʼlum bir testning qiyinchilik darajasiga bogʻliq.	Sinov sub’ektlarining tayyorgarlik darajasini baholash ular olingan natijalar boʻyicha test topshiriqlariga nisbatan oʻzgarmasdir.
3	Oʻlchov xatosi barcha sub’ektlar uchun doimiy qiymatdir. Ishni oʻlchash xatosi baholanmaydi	Oʻlchov xatosi har bir mavzu va har bir vazifa uchun alohida baholanadi. Bundan tashqari, xato bilvosita emas, balki toʻgʻridan-toʻgʻri hisoblanadi
4	Ishonchlilikni baholash usullari sezilarli cheklovlarni talab qiladi va buzilgan natijalarni keltirib chiqaradi.	Sinov ob’ektlarini oʻlchashning ishonchliligini va test topshiriqlarini baholashning ishonchliligini alohida baholash mumkin.
5	Asosiy ball shkalasi tartibli. Xom ballarni CTT ga oʻtkazmaslik shkala darajasini oshiradi	Logit shkalasi intervalli boʻlib, bu mavzular va vazifalarni tartiblashdan mos ravishda tayyorgarlik darajasi va qiyinchilik darajasini oʻlchashga oʻtishga imkon beradi.
6	Sinov ob’ektlarining ballari va test topshirigʻidagi qiyinchiliklarning normal taqsimlanishi muhim rol oʻynaydi	Parametrlarni normal taqsimlash talab qilinmaydi
7	Turli xil oʻzgarishlarni amalga oshiradigan sub’ektlarning ballari oʻrtasidagi yozishmalarni oʻrnatish usullari qiyin taxminlarni talab qiladi.	Turli xil variantlarning koʻrsatkichlarini tekislash tartibini bajarish va bitta metrik shkalada masshtablashni amalga oshirish mumkin. Vazifa banklarini yaratish mumkin
8	Kompyuterga moslashtirilgan test uchun mos emas	Kompyuterga moslashtirilgan testning butun nazariyasi IRTga asoslangan
9	Tahlil faqat ob’ektlarning qiyinligini va sub’ektlarning oʻlchovlarini baholashga qaratilgan	Qoʻshimcha omillarning sub’ektlarning vazifalari va chora-tadbirlari parametrlarini baholashga taʼsirini tahlil qilish mumkin.
10	Vazifalarga ogʻirliklarni sunʼiy ravishda belgilash sub’ektlarning tayyorgarlik darajasi toʻgʻrisidagi maʼlumotlarning buzilishiga olib kelishi mumkin.	Sinov ob’ektining ogʻirligi (axborot hissasi) boshqa elementlarning xususiyatlaridan qatʼi nazar, alohida hisoblanishi mumkin.

Yana qarang

Psixologik testning ishonchliligi
Psixologik test
yangi ixtirolar^[en]
turli xil texnikalar^[en]
Inson salomatligi texnikasi^[en]
Psixometriya
Ijtimoiy qurulma^[en]
Standartlashtirilgan test

Eslatmalar

↑ ^1,0 ^1,1 Avanesov V. S. Primenenie testovix form v Rasch Measurement // Pedagogicheskie izmereniya, 2005, № 4. -S.3-20. „Архивированная копия“. 2017-yil 4-iyunda asl nusxadan arxivlangan. Qaraldi: 2017-yil 3-iyun.
↑ A. van Alphen, R. Halfens, A. Hasman and T. Imbos. (1994). Likert or Rasch? Nothing is more applicable than good theory. Journal of Advanced Nursing. 20, 196—201
↑ Binet A., Simon T. H. The Development of Intelligence in Young Children. Vineland, NJ: The Training School, 1916.
↑ Richardson Marion W. The Relation Between the Difficulty and the Difference Validity of a Test / Psychometrika, 1936, 1: 2, 33-49.
↑ Richardson M. W. Notes on the Rationale of Item Analysis./Psychometrika, 1936,1: 169-76.
↑ Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of Item Response Theory. Newbury Park, CA: Sage Press.
↑ Ostini, Remo; Nering, Michael L. (2005). Polytomous Item Response Theory Models. Quantitative Applications in the Social Sciences. 144. SAGE. ISBN 978-0-7619-3068-6.
↑ „Архивированная копия“. 2017-yil 16-iyunda asl nusxadan arxivlangan. Qaraldi: 2017-yil 3-iyun.
↑ Kardanova Ye. Yu. Preimuщestva sovremennoy teorii testirovaniya po sravneniyu s klassicheskoy teoriey testirovaniya. Voprosi testirovaniya v obrazovanii. 2004, № 10

Manbala

- Embretson, Susan E.; Reise, Steven P.. Item Response Theory for Psychologists. Psychology Press, 2000. ISBN 978-0-8058-2819-1.
- Baker, Frank (2001). The Basics of Item Response Theory. ERIC Clearinghouse on Assessment and Evaluation, University of Maryland, College Park, MD.
- Item Response Theory: Parameter Estimation Techniques, 2nd, Andoza:Нп3, 2004. ISBN 978-0-8247-5825-7.
- Handbook of Modern Item Response Theory. Springer, 1996. ISBN 978-0-387-94661-0.
- de Boeck, Paul; Wilson, Mark. Explanatory Item Response Models: A Generalized Linear and Nonlinear Approach. Springer, 2004. ISBN 978-0-387-40275-8.
- Fox, Jean-Paul. Bayesian Item Response Modeling: Theory and Applications. Springer, 2010. ISBN 978-1-4419-0741-7.
- Крокер, Линда; Джеймс, Алгина. Введение в классическую и современную теорию тестов. ВЫСШЕЕ ОБРАЗОВАНИЕ СЕГОДНЯ, 2010. ISBN 978-5-98704-437-5.

„MARTLARGA RESPONSE TEORİYASI TARIXI (1982 yilgacha)“, en: Chikagodagi Illinoys universiteti
Elementga javob berish nazariyasi boʻyicha oddiy qoʻllanma (PDF)
Psixometrik dasturiy taʼminot yuklab olish
flexMIRT IRT dasturi (Wayback Machine saytida 2016-03-05 sanasida arxivlangan) Arxivnaya kopiya
IRT darsligi
IRT darsligi boʻyicha tez-tez soʻraladigan savollar
IRTga kirish (Wayback Machine saytida 2024-02-05 sanasida arxivlangan)
Taʼlim va psixologik testlar uchun standartlar
IRT Command Language (ICL) kompyuter dasturi
IRT dasturlari SSI, Inc.
en:Assessment Systems Corporation dan IRT dasturlari
Yashirin xususiyatlarni tahlil qilish va IRT modellari
Rash tahlili (Wayback Machine saytida 2009-08-25 sanasida arxivlangan)
Winsteps-dan Rasch tahlil dasturlari
Bepul IRT dasturiy taʼminot
R da IRT dan foydalanish uchun paketlar
Lertap 5 da IRT / EIRT-ni qoʻllab-quvvatlash (Wayback Machine saytida 2016-03-04 sanasida arxivlangan) Arxivnaya kopiya
ShinyItemAnalysis (2017) IRT bilan onlayn ishlash uchun ilova
IRT modeli parametrlarini baholash muammolari
Taʼlim yutuqlarini tekshirishda IRTni qoʻllash

Manba xatosi: <ref> tags exist for a group named "Neyman Yu. M., Xlebnikov V. A. Vedenie v teoriyu modellashtirish va parametrizatsii pedagogik testov. -M.: Prometey, −169 s. “Arxivirovannaya nusxa”. 2017-yil 4-iyunda asl nusxadan arxivlangan. Qaraldi: 2017-yil 3-iyun.", but no corresponding <references group="Neyman Yu. M., Xlebnikov V. A. Vedenie v teoriyu modellashtirish va parametrizatsii pedagogik testov. -M.: Prometey, −169 s. “Arxivirovannaya nusxa”. 2017-yil 4-iyunda asl nusxadan arxivlangan. Qaraldi: 2017-yil 3-iyun."/> tag was found

[uss.dvfu.ru-2] 1,0 ^1,1 Avanesov V. S. Primenenie testovix form v Rasch Measurement // Pedagogicheskie izmereniya, 2005, № 4. -S.3-20. „Архивированная копия“. 2017-yil 4-iyunda asl nusxadan arxivlangan. Qaraldi: 2017-yil 3-iyun.

[3] A. van Alphen, R. Halfens, A. Hasman and T. Imbos. (1994). Likert or Rasch? Nothing is more applicable than good theory. Journal of Advanced Nursing. 20, 196—201

[4] Binet A., Simon T. H. The Development of Intelligence in Young Children. Vineland, NJ: The Training School, 1916.

[5] Richardson Marion W. The Relation Between the Difficulty and the Difference Validity of a Test / Psychometrika, 1936, 1: 2, 33-49.

[6] Richardson M. W. Notes on the Rationale of Item Analysis./Psychometrika, 1936,1: 169-76.

[7] Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of Item Response Theory. Newbury Park, CA: Sage Press.

[8] Ostini, Remo; Nering, Michael L. (2005). Polytomous Item Response Theory Models. Quantitative Applications in the Social Sciences. 144. SAGE. ISBN 978-0-7619-3068-6.

[9] „Архивированная копия“. 2017-yil 16-iyunda asl nusxadan arxivlangan. Qaraldi: 2017-yil 3-iyun.

[10] Kardanova Ye. Yu. Preimuщestva sovremennoy teorii testirovaniya po sravneniyu s klassicheskoy teoriey testirovaniya. Voprosi testirovaniya v obrazovanii. 2004, № 10

[Neyman Yu. M., Xlebnikov V. A. Vedenie v teoriyu modellashtirish va parametrizatsii pedagogik testov. -M.: Prometey, −169 s. “Arxivirovannaya nusxa”. 2017-yil 4-iyunda asl nusxadan arxivlangan. Qaraldi: 2017-yil 3-iyun. 1]

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]