критерий качества теста используемый при измерении какого либо сложного психического феномена

валидность теста

(от англ. valid – пригодный) – критерий качества теста, используемый при выяснении степени достоверности измерения того психического свойства, качества, явления, которое хотят измерить с помощью данного теста. Различают несколько видов в.т.: в.т. конструктивная, в.т. по критерию, в.т. по содержанию, прогностическая в.т. и др. Валидность лучших тестов, выраженная коэффициентами корреляции (линейными, ранговыми и др.) составляет 0,3-0,8. К сожалению, есть случаи, когда тесты применяются без проверки их на в. В результате оказывается, что они бесполезны или даже вредны. В. т. – это показатель степени его эффективности. Она, естественно, меняется в зависимости от контингента людей, которые подвергаются тестированию, и характера их будущей деятельности. Один и тот же тест может быть высоковалидным для одной ситуации, бесполезным для другой и вредным для третьей.

* * *
(от англ. valid – действительный, пригодный, действенный) – один из основных (наряду с надежностью, репрезентативностью, объективностью, достоверностью и эффективностью) критериев оценки тестовых результатов. Понятие В. т. отражает идею обязательной практической (применительно к науке, эмпирической) проверки качества измерения. Если раньше понятие «В. т.» чаще др. ассоциировалось с понятием «качество теста», то в последние годы все больше обозначается роль интерпретации тестовых результатов. Таким образом, В. т. – это, прежде всего, адекватность интерпретации тестовых результатов по отношению к цели тестирования. В контексте прикладной задачи В. т. представляет собой не столько критерий качества теста, сколько показатель меры соответствия теста цели тестирования. В. т. – критерий его доброкачественности, действительной оценки с его помощью того свойства, для определения которого тест создан. Напр., В. т. к. Томаса определяется тем, насколько результаты тестирования соответствуют реальному выбору человеком каждой из 5 стратегий поведения в проблемных ситуациях общения.

Полезное

Смотреть что такое «валидность теста» в других словарях:

валидность теста — (от англ. valid действительный, пригодный, действенный) один из основных (наряду с надежностью, репрезентативностью, объективностью, достоверностью и эффективностью) критериев оценки тестовых результатов. Понятие В. отражает прагматическую идею… … Большая психологическая энциклопедия

Валидность Теста — действительная способность теста измерять ту психологическую характеристику, для диагностики которой он заявлен. Количественно валидность теста может выражаться через корреляции результатов, полученных с его помощью, с другими показателями,… … Психологический словарь

Валидность теста — – адекватность и действенность теста, важнейший критерий его доброкачественности, характеризующий точность измерения исследуемого свойства, а также насколько тест отражает то, что он должен оценивать, насколько отдельные составляющие его пробы… … Словарь-справочник по социальной работе

валидность теста — testo validumas statusas T sritis Kūno kultūra ir sportas apibrėžtis Svarbiausias kokybinis testo požymis, rodantis tiriamosios savybės matavimų tikslumą, testavimo rodiklių atitikimą norimai ypatybei, vyksmui įvertinti. atitikmenys: angl. test… … Sporto terminų žodynas

ВАЛИДНОСТЬ ТЕСТА — ВАЛИДНОСТЬ (от лат. validus – крепкий, здоровый) ТЕСТА. Адекватность и действенность теста. Критерий доброкачественности теста, характеризующий точность измерения исследуемого свойства, характеристики, а также позволяющий оценить, насколько… … Новый словарь методических терминов и понятий (теория и практика обучения языкам)

Валидность теста — (отангл. valid действительный, пригодный, действенный) 1) адекватность и действенность теста важнейший критерий его доброкачественности, характеризующий точность измерения исследуемого свойства, а также насколько тест отражает то, что он должен… … Словарь-справочник по педагогической психологии

Валидность теста — (отангл. valid действительный, пригодный, действенный) 1) адекватность и действенность теста важнейший критерий его доброкачественности, характеризующий точность измерения исследуемого свойства, а также насколько тест отражает то, что он должен… … Словарь по педагогической психологии

валидность теста по критерию — критерий качества теста, с помощью которого можно судить об интересующем нас аспекте психики индивида в настоящем и будущем. Для его определения необходимо сопоставить результаты тестирования с уровнем развития измеряемого признака, качества… … Энциклопедический словарь по психологии и педагогике

валидность теста по содержанию — критерий качества теста, используемый при вывяснении соответствия его области измеряемых психических явлений. В.т.к. показывает, насколько полно тест охватывает исследуемое множество измеряемых параметров. Если, например, нужно проверить с… … Энциклопедический словарь по психологии и педагогике

валидность теста конструктивная — критерий качества теста, используемый при измерении какого либо сложного психического феномена, имеющего иерархическую структуру, измерить который из за этого одним актом тестирования невозможно. Так, психодиагностика интеллекта невозможна без… … Энциклопедический словарь по психологии и педагогике

Источник

Валидность теста

Валидность теста (от англ. valid – пригодный) – критерий качества теста, используемый при выяснении степени достоверности измерения того психического свойства, качества, явления, которое хотят измерить с помощью данного теста.

Различают несколько видов валидность теста:

Валидность лучших тестов, выраженная коэффициентами корреляции (линейными, ранговыми и др.) составляет 0,3-0,8. К сожалению, есть случаи, когда тесты применяются без проверки их на в. В результате оказывается, что они бесполезны или даже вредны. Валидность теста – это показатель степени его эффективности. Она, естественно, меняется в зависимости от контингента людей, которые подвергаются тестированию, и характера их будущей деятельности. Один и тот же тест может быть высоковалидным для одной ситуации, бесполезным для другой и вредным для третьей.

Валидность теста конструктная

критерий качества теста, используемый при измерении какого-либо сложного психического феномена, имеющего иерархическую структуру, измерить который из-за этого одним актом тестирования невозможно. Так, психодиагностика интеллекта невозможна без предварительного определения понятия «интеллект», его структуры. Степень соответсвия нашего предварительного понимания и определения интеллекта реальной возможности конкретного теста, степень соответствия структуры интеллеткта структуре теста и есть в.т.к. Она нацелена на определение точности измерения сложных, устойчивых типов поведения, качеств личности, психических явлений.

Валидность теста по критерию

критерий качества теста, с помощью которого можно судить об интересующем нас аспекте психики индивида в настоящем и будущем. Для его определения необходимо сопоставить результаты тестирования с уровнем развития измеряемого признака, качества личности на практике. Например, для теста на технические способности основным критерием их определения будет выступать техническая деятельность конкретных специалистов, оценка их технических способностей с помощью экспертов, хорошо знающих испытуемых на протяжении достаточно продолжительного времени в интересующем нас аспекте. Оценка должна даваться по шкале порядковой, интервальной или отношений. В лучших тестах в. по критерию, измеренная коэффициентом корреляции, составляет от 0,3 до 0,8. Применение теста оправдано, если валидность по критерию оставляет 0,2-0,25.

Валидность теста по содержанию

критерий качества теста, используемый при вывяснении соответствия его области измеряемых психических явлений. В.т.к. показывает, насколько полно тест охватывает исследуемое множество измеряемых параметров. Если, например, нужно проверить с помощью теста математическую подготовку абитуриента вуза, то в предлагаемый тест должны быть включены математические задания, для решения которых необходимы знания по всем разделам математики, изучаемым в средней школе. Таким образом, степень соответствия структуры данного теста структуре программы математических дисциплин, изучаемых в школе, и является валидностью данного теста по содержанию. Естественно, что для обследования лиц, окончивших вузы, предназначаются тесты с иной вялидностью по содержанию.

Валидность теста прогностическая

критерий качества теста, используемый при предсказании характера развития измеряемого параметра в будущем. Одним из самых существенных недостатков подобных тестов является то, что они не учитывают неравномерность развития измеряемого параметра у различных людей в будущем. Данный вид валидности является особо ценным с практической точки зрения.

Валидность эксперимента

критерий качества эксперимента, степень его точности, в зависимости от которой выводы, полученные в его ходе могут быть распространены на всю генеральную совокупность. В.э. позволяет определить насколько всеобщими могут быть выводы, полученные путем исследования ограниченной по времени и обьему выборки. Различают внутреннюю и внешнюю валидность эксперимента.

Валидность эксперимента внешняя

критерий качества эксперимента, в зависимости от которого выводы об определенной тенденции, закономерности развития конкретных психических явлений, личностей, видов деятельности и т.д. могут быть распространены на другие явления и т.д. в данной или иной сфере. Языком математики это можно сформулировать так: насколько закономерности данного подмножества характерны для всего множества. Для определения границ применения экспериментальных выводов и необходимо определять в.э.в.

Валидность эксперимента внутренняя

критерий качества эксперимента, используемый при выяснении степени достоверности выявленной в результате эксперимента тенденции, закономерности, характерной для данной единицы множества или для всего подмножества элементов генеральной совокупности. Допустим, исследуя степень влияния освещенности на эффективность производственной деятельности ткачих, психологи обнаружили статистическую зависимость их эффективности работы от частоты смены освещения. Что является основным фактором повышения эффективности деятельности: смена освещения, внимание экспериментаторов, особое поведение руководителей в период эксперимента или другие факторы? В данном случае психологи пришли к выводу: появление молодых мужчин-исследователй в цехе, где работали женщины, и послужило причиной повышения производительности их труда. Но ведь могла быть и принята гипотеза о росте производительности ткацкого труда в зависимости от смены освещенности. В.э.в. показывает в какой степени независимая переменная (производительность труда) связана с зависимой (освещенность). Строго научное проведение психологического эксперимента предполагает определение его валидности.

Источник

Тесты психологические. Тестирование персонала

Тест (англ. test — проба, испытание, исследование) — стандартизированное задание, результат выполнения которого позволяет измерить психофизиологические и личностные характеристики, а также знания, умения и навыки испытуемого.

При тестировании персонала применяемая батарея тестов (в том числе компьютерная) должна отвечать базовым требованиям валидности и надежности.

Валидность теста — это критерий степени достоверности измерения психического свойства (качества, явления), которое хотят измерить с помощью данного теста. По сути, валидность теста — это показатель степени его эффективности и пригодности для измерения нужной нам характеристики.

Различают несколько видов валидности:

Валидность лучших тестов не превышает 80%. Следует учитывать, что валидность меняется в зависимости от контингента людей, которые подвергаются тестированию, а также характера их будущей деятельности. В результате один и тот же тест может быть высоковалидным для одной ситуации, и совершенно невалидным для другой.

Основные виды валидности тестов

Конструктивная валидность — это критерий качества теста, используемый при измерении какого-либо сложного психического феномена, имеющего иерархическую структуру, измерить который из-за этого одним актом тестирования невозможно. К примеру, психодиагностика интеллекта невозможна без предварительного определения понятия «интеллект» и его структуры. В данном случае степень соответствия структуры интеллекта структуре теста и будет составлять конструктивную валидность теста. В общем она нацелена на определение точности измерения сложных, устойчивых типов поведения, качеств личности, психических явлений.

Валидность по критерию — это критерий качества теста, с помощью которого можно судить об интересующем аспекте психики конкретной личности в настоящем и будущем. Для его определения сопоставляются результаты тестирования с уровнем развития измеряемого признака, качества личности на практике. Так, для теста на технические способности основным критерием их определения будет выступать техническая деятельность конкретных специалистов, оценка их технических способностей с помощью экспертов, хорошо знающих испытуемых в интересующем аспекте на протяжении достаточно продолжительного времени. Оценка при этом дается по шкале порядковой, интервальной или отношений. В целом, применение теста считается оправданным, если валидность по критерию составляет минимум 0,2-0,25.

Валидность по содержанию — критерий качества теста, используемый при выяснении соответствия его области измеряемых психических явлений. Показывает, насколько полно тест охватывает исследуемое множество измеряемых параметров.

Прогностическая валидность — критерий качества теста, предсказывающий характер развития измеряемого параметра в будущем. Данный вид валидности особенно ценен с практической точки зрения. Однако существенным недостатком критерия является то, что он не учитывает неравномерность развития измеряемого параметра у различных людей в будущем.

Надежность теста — это его фундаментальная характеристика, показывающая степень стабильности результатов тестирования при неоднократном обследовании. Может определяться путем повторного тестирования через строго определенный отрезок времени и вычисления коэффициента корреляции между результатами первого и повторного тестирования. При этом важно учитывать, что надежность результатов тестирования зависит не только от качества самого теста, но и от процедуры проведения тестирования персонала (она должна быть одинаковой в первом и последующих случаях) и социально-психологической однородности выборки. Надежность теста может быть различной, к примеру, для подростков, мужчин, женщин, представителей различных социальных групп. Таким образом, надежность теста, выражая степень неточности, возможность ошибки, возникающей при любом тестировании, заставляет искать пути уменьшения этой ошибки, более конкретного, целенаправленного применения теста. Надежность лучших тестов составляет 0,8-0,9.

В целом, для того чтобы методы тестирования персонала оказались результативными, они должны быть достаточно надежными, достоверными. Достоверность метода отбора характеризуется его неподверженностью систематическим ошибкам при измерениях, то есть состоятельностью при переменных условиях.

На практике достоверность при вынесении суждений достигается сравнением результатов двух (или более) аналогичных тестирований, проведенных в разные дни. Многие квалифицированные эксперты отмечают, что результаты теста характеризуют человека в определенное время в определенном месте.

Не следует сбрасывать со счетов и волнение кандидатов в процессе тестирования. Профессиональные специалисты, проводящие тестирование, как правило, наблюдают за состоянием тестируемых и в случае необходимости стараются их успокоить.

Другой путь повышения достоверности тестирования персонала — сравнение результатов нескольких альтернативных методов профотбора (например, тестов и собеседования). Чем более сходны результаты, полученные с помощью нескольких адекватных задачам отбора методов, тем они более достоверны.

Из всего многообразия тестов важно выделить наиболее подходящие для решения конкретных задач отбора. В современной практике российских компаний используются в основном западные методики, адаптированные в той или иной мере к отечественным социально-культурным особенностям.

В общем виде все тесты можно разделить на три основные группы:

К тестам-испытаниям относятся следующие группы тестов.

Деловые игры нацелены на испытание человека (проверку, как он себя будет вести) в ситуациях, приближенных к реальным, с которыми ему придется сталкиваться на работе. Они применяются не только при отборе новых сотрудников, но и для того, чтобы оценить профессиональный рост уже работающих и, при необходимости, решить, как повысить их уровень.

С помощью тестов-опросников определяются интеллектуальные качества, свойства личности или интересы, предпочтения. Опросники используются для определения склонности к тому или иному виду деятельности, например, нравится ли человеку работать в коллективе, есть ли у него склонности к данному виду деятельности и т. д. В настоящее время широко применяются компьютерные варианты опросников.

Проективные тесты берут свое начало из глубины веков, от различных видов гаданий (на кофейной гуще, расплавленном воске, пламени свечи, полете птиц, небесных явлениях и др.). Современные проективные методики: тест Люшера, тест Роршаха, ТАТ (тематический апперцептивный тест), а также различные методики изучения продуктов творчества человека (например, рисование человека, дерева, дома, несуществующего (мифического) животного и др.). Проективные тесты построены на интерпретации ответов личности на внешне нейтральные вопросы и реакций на ситуации, допускающие множественность толкований при восприятии их испытуемым. По этим реакциям исследователь пытается понять глубинную сущность, психические особенности личности (например, раскрыть систему личностных смыслов, структуру мотивации и др.). Испытуемый проецирует на тестовую картинку свои мысли и чувства (отсюда и название тестов — проективные). Проективные методики позволяют выявить управленческий потенциал личности, определить уровень тревожности кандидата, выявить доминирующие потребности, склонность к конфликтности и пр.

Проективные тесты эффективны при выявлении творческого потенциала личности. В условиях возрастающей конкуренции предприниматели стремятся привлечь сотрудников с развитым творческим мышлением, способным генерировать новые идеи в быстро меняющейся бизнес-среде.

Популярные тестовые методики, применяемые в практике профессионального отбора и тестирования персонала

Проективные тесты

Тест Роршаха. Испытуемому предъявляются для интерпретации картинки с абстрактными изображениями — пятнами различной конфигурации и цвета (напоминающими чернильные кляксы). На основании того, что увидит испытуемый, диагностируются его скрытые установки, побуждения, свойства характера.

Тест Люшера позволяет исследовать личность работника путем анализа его субъективных предпочтений при выборе цветовых стимулов. В оригинале стимульный материал представляют 73 карточки различного цвета, в российской психодиагностике распространена упрощенная тестовая методика, применяющая восемь основных цветов. При этом каждому цвету приписывается определенное значение. Важен порядок выбора цветов: первые выбранные цвета выражают явные цели деятельности личности и способы их достижения, последние — подавленные, вытесненные стремления.

Тематический апперцептивный тест (ТАТ) направлен на исследование психических свойств личности по спонтанному описанию тестируемым тех или иных стандартных ситуаций, изображенных на предъявляемых ему рисунках. Это один из наиболее известных тестов на мотивацию достижений. Надежность в практике тестирования персонала не является доказанной. По мнению специалистов, ответы на вопросы ТАТ могут быть подвержены влиянию сторонних факторов. Тем не менее, успешность прохождения данного теста коррелирует как с общими успехами человека в учебе, так и с его экономическим преуспеванием.

Тест Майнера на завершение предложений позволяет прогнозировать управленческий и творческий потенциал менеджеров. Этот тест состоит из 40 незаконченных предложений, которые тестируемый должен дописать самостоятельно. По нему можно судить о различных аспектах мотивации менеджерской деятельности. В других тестах на завершение предлагается досочинить рассказ или дорисовать рисунки.

По критерию измеряемого психологического качества можно выделить следующие группы тестов:

Тесты на уровень интеллекта (тесты на IQ — интеллектуальные тесты)

Тестов, измеряющих уровень интеллекта, очень много, большинство из них происходят от двух классических методик: теста Бине-Симона и теста Векслера. Оба теста прошли испытание на протяжении 70-летней практики их применения и являются наиболее изученными и надежными. К примеру, баллы по результатам словесно-речевых IQ-тестов (тест Векслера) всегда хорошо коррелируют с успехами в учебе.

Применяя тот или иной тест интеллекта, важно знать, что автор или авторы теста вкладывают в понятие «интеллект». В настоящее время психологами выделяется несколько видов интеллекта: словесно-речевой, математический, визуально-пространственный, художественный, двигательный, музыкальный и прикладной. При этом многие психологи говорят о так называемом «общем (едином) интеллекте», позволяющим человеку довольно эффективно проявлять себя в разных областях жизнедеятельности.

Тесты на IQ (коэффициент интеллекта) помогают выявить наличие отдельных интеллектуальных способностей человека, в том числе:

Недостатком интеллектуальных тестов является то, что они нацелены на получение некоторого суммарного балла, отражающего интеллектуальные способности «вообще». Но за этим суммарным баллом остаются неразличимыми отдельные сильные и слабые способности человека. Выполняя интеллектуальные тесты, человек использует главным образом конвергентное мышление. Это мышление «специализируется» на решении задач, у которых есть только один правильный ответ. Однако на многие вопросы нельзя дать однозначный, верный или неверный ответ. Например, когда нужно найти новую генеральную линию развития фирмы, которая позволила бы ей обогнать своих конкурентов, или выработать новый действенный слоган — в этих случаях у задачи множество вариантов решения. Некоторые из них будут лучше, другие хуже (зачастую это может показать лишь время), но ни один из них не является единственно верным. Такие вопросы требуют дивергентного мышления. Тесты на IQ реально зондируют лишь конвергентное мышление.

К тому же высокий коэффициент интеллекта сам по себе не является гарантией успешной работы сотрудника. Многое определяется тем, что требуется для выполнения конкретной работы, а в этом случае на первом месте далеко не всегда выходят интеллектуальные качества. К примеру, финансовому директору недостаточно иметь хороший математический интеллект, ему очень важно уметь верно оценивать степень риска и принимать правильные финансовые решения.

Тесты на личностные качества

Отличительная особенность данных тестов в том, что в них оценивается не правильность ответов тестируемого, а его личностные качества. Хотя не все стороны характера можно оценить с помощью тестов, поскольку каждый человек уникален, но некоторые личностные черты поддаются количественной оценке.

В практике кадровой работы часто используются MMPI (Миннесотский многопрофильный личностный опросник), СМИЛ (стандартизированный метод исследования личности), тест Айзенка, 16-факторный опросник Кеттелла (тест 16PF), тесты Лири, Стреляу, Леонгарда, «рисуночные тесты», тесты цветовых предпочтений, а также такие экзотические, как графологические (анализ почерка) и физиогномические (анализ черт лица). Эти тесты могут применяться при профотборе, если в службе персонала есть квалифицированные психологи, способные интерпретировать получаемые с их помощью данные. При этом следует учитывать, что ни один из этих тестов не рассчитывался на специальное применение в кадровых службах. Личностные тесты обладают недостатком: как правило они достаточно громоздки и сложны. В то же время большинство служб персонала при определении личностных качеств кандидата стремятся использовать более простые тесты.

Многофакторный метод исследования личности (СМИЛ) — это модифицированный (адаптированный к российским условиям) вариант теста MMPI, разработанного в 40-х годах американскими психологами Дж. Маккинли и С. Хатэуэем для профессионального отбора военных летчиков. Методика построена по типу опросника, при этом оценка результата базируется не на прямом анализе ответов испытуемого, а на данных статистически подтвержденной значимости каждого ответа в сравнении со средненормативными показателями. Одно из важных достоинств метода состоит в том, что автоматизированный способ обработки данных практически исключает зависимость получаемых результатов от личностных особенностей и опыта специалиста, проводящего тестирование. В основу методики положена статистически достоверная математическая база.

Тест эффективен в решении сложных вопросов профотбора и профориентации, комплектовании рабочих коллективов, расстановки кадров, при изучении социального климата в организациях и на предприятиях. Он находит активное применение в профконсультировании и профориентационной работе психологов.

Тест Кеттелла (16PF) выводит баллы для разных качеств личности (17 факторов первого порядка). Данные по некоторым из этих шкал коррелируют друг с другом, поэтому в итоге образуются 5 факторов (показателей) второго (высшего) порядка. Полный вариант теста Кеттелла позволяет исследовать и уровень интеллекта, и личностные качества. Тест Кеттелла, а также тест Айзенка наиболее результативны в диагностике степени нервозности личности, что профессионально значимо для некоторых профессий.

Тест Майерс-Бриггс, в основе которого лежит психологическая теория личности К.Г. Юнга, содержит более ста утверждений и позволяет описать личность человека по четырем составляющим:

Однако этот тест больше подходит для оценки возможности карьерного роста сотрудников внутри организации, чем для решения вопроса о приеме на работу.

На входном контроле (при приеме на работу) используют тесты самооценки, например, тест Лири, личностный дифференциал (ЛД) или опросник деловой направленности (ОДН) личности, а также СМИЛ, результаты которого коррелируют с результатами, полученными другими методами.

Тесты на творческое мышление

Существуют следующие виды:

Нередко в тестах на творческое мышление применяются сюрреалистические либо иронические рисунки.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *