Новини освіти і науки:

Тлумачний словник
Авто
Автоматизація
Архітектура
Астрономія
Аудит
Біологія
Будівництво
Бухгалтерія
Винахідництво
Виробництво
Військова справа
Генетика
Географія
Геологія
Господарство
Держава
Дім
Екологія
Економетрика
Економіка
Електроніка
Журналістика та ЗМІ
Зв'язок
Іноземні мови
Інформатика
Історія
Комп'ютери
Креслення
Кулінарія
Культура
Лексикологія
Література
Логіка
Маркетинг
Математика
Машинобудування
Медицина
Менеджмент
Метали і Зварювання
Механіка
Мистецтво
Музика
Населення
Освіта
Охорона безпеки життя
Охорона Праці
Педагогіка
Політика
Право
Програмування
Промисловість
Психологія
Радіо
Регилия
Соціологія
Спорт
Стандартизація
Технології
Торгівля
Туризм
Фізика
Фізіологія
Філософія
Фінанси
Хімія
Юриспунденкция

Методики визначення надiйностi психологiчних тестiв

Тема 5: Психометричні основи психодіагностики.

1. Психометрика. Психометричні вимоги до методики:

А) Репрезентативність

Б) Надійнсть

В) Валідність

Г) Достовірність.

2. Стандартизація тестових методик. Етапи стандартизації.

3. Визначення норм тесту.

Психометрика – технологічна дисципліна, що містить наукове обґрунтування і опис методів виміру психологічних властивостей, а також методів конструювання тестів. Психометрика встановлює вимоги, що висуваються до психологічного інструментарію, а саме – репрезентативність, надійність, валідність, достовірність.

Репрезентативність– характеризує властивість вибірки стандартизації, що відображає характеристики генеральної сукупності; репрезентативність тестових норм – на кого тест розрахований.

Генеральна сукупність – категорія обстежуваних певної вікової, статевої, соціально чи професійної приналежності;

Вибірка стандартизації – множина обстежуваних, на якій визначаються діагностичні норми і проводиться стандартизація діагностичних шкал;

Надійність – точність, стабільність результатів тестових досліджень до різних перешкод, випадкових факторів (умов тестування, втомленість, впрацьовування, обізнаність з тестуванням); надійність визначається: повторним тестуванням - ретестова надійність, паралельних форм – еквівалентна надійність, розщеплення – узгодженість частин тесту).

Потрiбно визнати, що мабуть жодна з iснуючих психодiагностичних процедур не є iдеальною з точки зору її надiйностi. Показники надiйностi тесту можуть iстотно змiнюватись у випадках незначних варiацiй умов проведення тестування, змiни характеру тестових завдань, а також залежно вiд ступеня трудностi завдань для пiддослiдного.

На характеристики надiйностi, що визначаються емпiричним шляхом, суттевий вплив становить характер вибiрки, що використовується для перевiрки тесту на цi показники. Особливе значення тут має дiапазон розбiжностi в оцiнках, тобто в рангових мiсцях пiддослiдних або iх груп у загальнiй вибiрцi.

Рiзноманiтнiсть характеристик та показникiв надiйностi тесту так само велика, як i кiлькiсть умов, що можуть впливати на результат тесту. Проте, найбiльш широке практичнє використання знаходить кiлька методiв визначення надiйностi, а саме ретестова надiйнiсть, надiйнiсть паралельних форм тесту, надiйнiсть частин тесту, надiйнiсть за внутрiшньою узгодженiстю.

Ретестова надiйнiсть - це засiб визначення надiйностi психодiагностичної методики, коли показники точностi та сталостi результатiв визначаються емпiрично шляхом повторного дослiдження. Надiйнiсть у цьому випадку встановлюється як мiра збiгання результатiв першого i повторного обстеженнь або як ступiнь збереження рангових мiсць обстежених у вибiрцi при ретестi. Коефiцiент надiйностi (rt) дорiвнюе коефiцiенту кореляцiї мiж даними таких обстежень.

(Якщо у дослiджуваному тестi для вимiрювання певної психологiчної властивостi використовується iнтервальна шкала, то при визначеннi можна скористуватись коефiцiентом кореляцiї Пiрсона. Для порядкових шкал у якостi мiри сталостi результату дослiджень можна застосувати коефiцiент ранговоi кореляцiї Спiрмена або Кенделла.

При визначеннi показника ретестовоi надiйностi особливе значення має вибiр iнтервалу ретесту, тобто часу, що проходить мiж першим та другим дослiдом. Цiлком природним є те, що зi збiльшенням цього iнтервалу показники кореляцiї мiж даними дослiджень мають тенденцiю до зниження. Пiсля значного промiжку часу при ретестi ймовiрнiсть виникнення стороннiх факторiв суттево зростає. Можуть виявитись наслiдки цiлком закономiрних вiкових змiн психологiчних властивостей, що вимiрюються за допомогою тесту, можуть статися певнi непередбачуванi подii, що вплинуть на стан i особливостi розвитку дослiджуваних психологiчних якостей. З цiєi причини при визначеннi ретестовоi надiйностi намагаються встановлювати не дуже довгi iнтервали часу (до кiлькох мiсяцiв). При визначеннi надiйностi методик, що використовуються для обстеження дiтей молодшого вiку, такi iнтервали мають бути ще меншими через те, що у цьому віці вiковi змiни бiльшостi психологiчних властивостей здiйснюються бiльш iнтернсивно.

Поряд з явною простотою ретестовоi надiйностi як засобу аналiзу сталостi показникiв тесту цей спосiб, все ж таки має суттевi недолiки:при повторному використаннi одних i тих самих завдань, особливо в умовах вiдносно короткого iнтервалу ретесту, у пiддослiдних можливе формування навичок роботи з даною психодiагностичною методикою, а отже буде спостерiгатись полiпшення результату повторного обстеження. Ступiнь пiдвищення якостi роботи залежатиме вiд iндивiдуальної мiри швидкостi формування навички у пiддослiдних.

Вище зазначенi особливостi та недолiки методу розрахунку надiйностi шляхом ретесту дають пiдстави вважати цей пiдхiд придатним лише для обмеженого кола методик, для яких можливе багаторазове використання одного i того ж комплексу завдань. До таких методик можна вiднести сенсомоторнi проби, тести швидкостi, а також ті, що вiдрiзняються великою кiлькiстю тестових завдань (наприклад, Мiнесотський багатофакторний опитувальник особистостi).

Надiйнiсть паралельних форм.Спроба компенсувати частину недолiкiв методу визначення надiйностi шляхом ретесту привела до розробки засобу визначення надiйностi паралельних форм. При цьому використовується така процедура. Однi i тi самi пiддослiднi iз вибірки визначення надiйностi дослiджуються за допомогою основного варiанта тесту, а потiм, через певний заданий промiжок ретесту, - з використанням допомiжного набору завдань, яким може стати паралельна чи сумiсна форма тесту.

Пiд такою формою звичайно розумiють близький до первинного за критерiями надiйностi та валiдностi, а також iншим психодiагностичним характеристикам варiант тесту. Такий варiант розробляеться з метою еквiвалентної замiни первинного тесту.

Оцiнюваним показником надiйностi паралельних форм є коефiцiент кореляцiї мiж результатами первинного i повторного дослiдження. У цьому випадку коефiцiент кореляцiї вiдбиває як мiру стабiльностi результату тесту на протязi вiдповiдного часу (власне надiйнiсть), так i мiру збігання результатiв обох форм тесту. Якщо двi форми використовуються безпосередньо одна за другою, то коефiцiєнт якраз i визначає мiру збiгання результату паралельних форм тесту.

Найбiльш вiдомi та широко вживанi у вiтчизнянiй психологiчнiй дiагностицi методики, що мають паралельнi форми, - опитувальник особистостi EPI Х.Айзенка, тест TSI Р.Амтхауера, ШТРР та iн.

Суттєвим недолiком методу визначення надiйності за допомогою паралельних форм є те, що кiлькiсть тестiв, якi мають одну чи кiлька таких форм обмежена.

Досить простим та поширеним засобом пiдвищення достеменностi результатiв повторного обстеження за допомогою методик, що не мають паралельних форм є розщеплення сукупностi завдань на парнi та непарнi за порядковим номером. Зрозумiло, що такий подiл завдань тесту на частини можливий для методик, котрi побудованi за принципом шкали. Тобто, кожне з наступних завдань на якусь бiльш-менш сталу величину труднiше за попередне. Тодi парнi та непарнi завдання будуть вiдносно врiвноваженi з огляду вiрогiдностi iх правильного виконання у вибiрцi. До речi, питання суб'єктивної трудностi наборiв тестових завдань є важливим з огляду конструювання, адаптацiї та перевiрки психодiагностичних якостей психологiчних тестiв.

Потрiбно зазначити, що метод розщеплення майже повнiстю непридатний для опитувальникiв особистостi.

Але цей метод має теж ряд недолiків. До таких належить неможливiсть встановити надiйнiсть результатiв тесту вiдносно промiжку часу.

Отже, дослiднику, який iнтерпретує емпiричнi данi, слiд мати чiтку уяву про мiру точностi та ймовiрнi межi реального результату, який досягається конкретною вимрювальною процедурою.

Валідність (вiд англ. - дiйсний, маючий силу, придатний) – міра відповідності між тим, що тесту приписується і тим, що він дійсно вимірює. У спрощеному й узагальненому формулюваннi валiднiсть - це "поняття, яке вказує на те, що тест вимiрює i наскiльки добре вiн це робить" (А.Анастази, 1982). У стандартних вимогах до педагогічних та психодiагностичних тестiв (Standarts...,1974) валiднiсть визначається як сукупнiсть вiдомостей про те, вiдносно яких груп психологiчних властивостей особистостi можуть виноситись квалiфiкацiйнi судження, а також вiдомостi про мiру обґрунтованості останнiх на пiдставi тестових оцiнок або якихось iнших засобiв оцiнювання.

У сучаснiй психологiчнiй дiагностицi валiднiсть розглядається як обов'язкова та найбiльш важлива частина iнформацii, що вмiщує в собі вiдомостi про мiру узгодженостi даних тесту з iншими даними, що вiдображають особливостi обстежуваної особистостi (теоретичнi сподiвання, експертнi оцiнки, показники iнших тестiв, психологічний змiст яких вже є з'ясованим тощо). У сукупнiсть вiдомостей про валiднiсть включаються i судження про обгрунтованiсть та достатнiсть передбачення розвитку психiчної якостi, характеристики особистостi, сфери поведiнки.

Приклад. Загальна iнформацiя, що має вiдношення до назви тесту часто недостатня для судження про сферу його використання. Це лише назва, "iм'я" конкретної процедури дослiдження. Далеко не кожне таке iм'я вiдповiдає сутi методики, її cправжньому призначенню з огляду на дослiджувану психологiчну характеристику. Можна навести приклад широко вiдомої у рiзних галузях прикладної психологiї коректурної проби. Сфера дослiджуваних психологiчних характеристик тут базується на визначеннi стiйкостi та концентрацiї уваги, психомоторної рухливостi. Коректурна проба за своiми показниками добре узгоджується з результатами iнших методик, котрi нацiленi на такi ж самi показники (наприклад Таблицями Шульте, методикою Горбова-Платонова та iн.). Таким чином, коректурна проба має високу валiднiсть насамперед для показникiв уваги та рухливостi.

Поряд із цим, на результати виконання коректурної проби впливає i багато iнших факторiв. Серед них можна навести: нейродинамiчнi особливостi - психофiзiологiчнi та темпераментнi властивостi, показники короткочасної та оперативної пам'ятi, толерантнiсть до монотонiї, навички читання, гострота зору, загальна психiчна працездатнiсть, функцiональний стан психiчних процесiв тощо. Перелiченi фактори можуть вимiрюватись за допомогою коректурної проби, але ця методика не є специфiчною для них. Валiднiсть при такiй спрямованості дослiдження буде невисокою або сумнiвною.

У дефiнiцiю валiдностi входить значна кiлькiсть самої рiзнобiчної iнформацiї про тест. Рiзнi категорiї вiдомостей про тест утворюють спецiальнi види валідності:

- змістовно-пізнавальна – по призначенню (показник впевненості у пізнавальній ємкості тесту, точності),

- практична (наскільки цінним є на практиці),

- безпосередня (без використання математичної статистики),

- похідна (зіставляння із якимось зовнішнім критерієм, н-д, успішність),

- зовнішня (очевидна для неспеціалістів),

- внутрішня (конструктна, відповідність базовому теоретичному конструкту);

- прогностична (можливість прогнозувати розвиток особистості).

Критерiй валiдизацii - це показник психiчної властивостi, що вимiрюється тестом, але отриманий не на основi оцiнок тесту, що валідізується, а будь-яким iншим шляхом. Критерiєм валiдизацiї може бути якась незалежна вiд тесту мiра, котра прямо чи побiчно вiдображає психiчну особливiсть, якостi особистостi, прояви поведiнки, успiшнiсть дiяльностi тощо.

У практичнiй психологiчнiй дiагностицi в якостi критерiю валiдизацii найчастiше використовують такi види iнформацiї:

- об'єктивнi соцiально-демографiчнi та бiографiчнi данi (фах, термiн роботи, освiта, належнiсть до тих чи iнших соцiальних та етнiчних груп населення, факти прийняття чи звiльнення з роботи, ув'язнення тощо);

- показники успiшностi навчання, академiчнi оцiнки, характеристики педагогiв та батькiв, в яких вiдображенi досягнення у навчаннi, контрольне вивчення оволодiння навчальним матерiалом, результати iспитiв тощо;

- виробничi показники в окремих видах професiйної дiяльностi, характеристики ставлення до роботи, показники трудової дисциплiни тощо;

- виконання реальної критерiальної дiяльностi (малювання, моделювання, музика, складання оповiдань, робота з кресленями, виготовлення об'ектiв тощо);

- медичний дiагноз, а також будь-якi iншi висновки про стан здоров'я з боку фахiвцiв, результати консультацiй хворих;

- данi iнших методик та тестiв, валiднiсть яких вважаеться з'ясованою;

- данi груповоi експертної оцiнки рис особистостi;

- данi самоаналiзу пiддослiдних.

Сукупнiсть рiзновидiв критерiїв може бути роздiлена на вiдносно об'єктивнi (незалежнi вiд суб'єктивних оцiнок та мiркувань людей) та суб'єктивнi критерiї. До таких головним чином належать академiчнi оцiнки та експертнi судження педагогiв, лiкарiв, спiвробiтникiв, керiвникiв виробництва, психологiв). Найчастiше експерт проводить оцiнювання певної властивостi пiддослiдного за допомогою спецiально розробленої шкали. Об'єктивiзацiя експертних суджень здiйснюеться за рахунок усереднення заключень у вибiрцi експертiв.

На практицi нараховується чотири найбiльш розповсюдженi методи проведення експертної валiдизацiї, а саме :

1. Колективна оцiнка - експерти разом оцiнюють об'єкт за допомогою спецiальної шкали. Пiдбiр градацiй оцiночніх шкал найчастiше вiдповiдає принципу звичностi оцiнок для експертiв. Так, для вчителiв найбiльш зручним є оцiнювання за п'ятибальною шкалою. Умовою колективної оцiнки є розробка компромiсного рiшення щодо дослiджуваного об'єкта, але при такому способi оцiнювання результати дуже залежать вiд окремих особистостей, що впливають на групове рiшення, та вiд якостей групової взаємодiї експертiв.

2. Середньоврiвноважена оцiнка - кожний з досліджуваних оцiнюється групою експертiв, жодному з яких не вiдомi судження про якостi об'єкта, якi виносяться iншими експертами. Пiсля закiнчення роботи експертiв пiдсумки усереднюються.

3. Метод ранжування - група експертiв разом (або незалежно один вiд одного) розподiляють якостi досліджуваного у кiлька класифiкацiйних пiдгруп за принципом зростання чи зниження прояву. Замiсть групування можуть складатись ранговi списки. Кiнцевi судження можуть встановлюватися шляхом компромiсу або середньоврiвноважено.

4. Метод парних порiвнянь - призначений для полегшення роботи експертiв, якi часто зустрiчаються зi складнiстю iдентифiкацiї прояву дослiджуваної ознаки та оцiнки її прояву згiдно з градацiямі шкали. Особливо зростають цi труднощi у випадках оцiнки малодиференцiйованих ознак (наприклад, чи є людина "доброю", "розумною", "щасливою" тощо) або при браку досвiду оцiнювання iншої людини у експертiв, вiдносно незначному часу спiлкування з оцiнюваною людиною. При парному порiвняннi завдання експертiв полягає у послiдовному порiвняннi пар об'єтiв за альтернативними ознаками (наприклад, "рухливий-спокiйний", "веселий-сумний" i таке iнше).

Читайте також:

<== попередня сторінка	\|	наступна сторінка ==>
Оцінка проективних методик.	\|	Валiднiсть змiсту

Не знайшли потрібну інформацію? Скористайтесь пошуком google:

Генерація сторінки за: 0.019 сек.