Кризис репликации в психологии связан с опасениями по поводу достоверности результатов психологической науки. Термин, появившийся в начале 2010-х годов, означает, что результаты поведенческой науки часто не могут быть воспроизведены: психологи не получают результатов, сопоставимых с исходным рецензируемым исследованием, при повторении этого исследования с использованием аналогичных процедур. По этой причине многие ученые сомневаются в точности опубликованных результатов и теперь призывают к более тщательному анализу исследовательской практики в психологии.
Содержание
- Что привело к кризису репликации?
- Понимание методов исследования
- Как психология продвигается вперед
Что привело к кризису репликации в психологии?
Некоторые ученые годами предупреждали, что определенные способы сбора, анализа и представления данных, часто называемые сомнительной исследовательской практикой, повышают вероятность того, что результаты будут казаться статистически значимыми, хотя это не так. Некорректный дизайн исследования и « предвзятость публикации », которая способствует подтверждению результатов, – это другие давние источники беспокойства.
Серия репликационных проектов в середине 2010-х годов усилила эти опасения. В одном крупном проекте менее половины исследований, которые репликаторы пытались воссоздать, дали аналогичные результаты, предполагая, что по крайней мере некоторые из исходных результатов были ложноположительными.
После попыток репликации были поставлены под сомнение различные результаты, в том числе хорошо известные, предполагающие, что определенные типы прайминга , физических поз и других простых вмешательств могут удивительным или благоприятным образом влиять на поведение. Однако важно отметить, что не только психология: другие области, такие как исследования рака и экономика, сталкиваются с аналогичными вопросами о методологической строгости.
Растущее понимание того, как исследовательская практика может приводить к ложным срабатываниям, совпало с крайними случаями умышленного искажения и фальсификации, что в некоторых случаях приводит к отстранению или отставке выдающихся ученых.
Когда начался кризис репликации?
Психология начала рассчитывать на воспроизводимость примерно в 2010 году, когда в особенно сомнительной статье утверждалось, что она предоставляет доказательства «предвидения» или способности воспринимать события в будущем. Ученые все чаще стали обсуждать методологические проблемы и повторять эксперименты для подтверждения опубликованных исследований. Неспособность последовательно воспроизвести эти результаты подтолкнула движение вперед.
Какие методы исследований привели к ненадежным результатам?
Журналы заинтересованы публиковать интересные и неожиданные открытия. Это приводит к предвзятости публикации, к тенденции публиковать положительные результаты, а не исследования, которые не находят никакого эффекта. Исследователи заинтересованы в том, чтобы публиковаться как можно чаще, чтобы продвинуться по карьерной лестнице. Следовательно, они могут проявлять гибкость при анализе данных для достижения статистической значимости .
Насколько надежны результаты исследования?
Важный документ 2015 года показал, что из 97 попыток повторить результаты предыдущих исследований менее 40 процентов были признаны успешными. В рамках другого крупномасштабного проекта в 2018 году было проверено 28 результатов, датируемых с 1970-х по 2014 год. Было обнаружено около половины доказательств. Изучение 21 вывода, опубликованного в ведущих журналах, показало, что две трети реплицируются успешно . Однако эти результаты не обязательно репрезентативны для психологии в целом, и некоторые области , вероятно, собрали более веские доказательства, чем другие.
Является ли воспроизводимость большей проблемой в психологии, чем в других науках?
Другие области также испытывают трудности с воспроизводимостью, например, экономика и медицина. Тем не менее, психология может столкнуться с определенными проблемами: измерение человеческого поведения может быть менее точным, чем измерение, например, физиологических маркеров, таких как артериальное давление или частота сердечных сокращений.
Почему так важен кризис репликации?
Обоснованность психологических исследований важна как для получения знаний о человеческом поведении, так и для влияния реальных вмешательств в области психического здоровья, медицины, образования , бизнеса и политики .
Какие выводы из психологии оказались надежными?
Несмотря на трудности с надежностью, даже скептически настроенные ученые по-прежнему верят в ряд выводов о человеческом поведении. Примеры таких идей включают то, что черты личности остаются довольно стабильными в зрелом возрасте, что индивидуальные убеждения формируются групповыми убеждениями, что люди стремятся подтвердить свои ранее существовавшие убеждения и многое другое.
Понимание методов исследования
Чтобы лучше понять кризис репликации, стоит изучить некоторые статистические методы, используемые в психологических экспериментах. Гибкость в методологии исследования может помочь объяснить, почему психологи бессознательно (а иногда и сознательно) дают ненадежные результаты.
Что такое нулевая гипотеза?
При проведении эксперимента исследователь вырабатывает гипотезу. Например, они могут выдвинуть гипотезу о том, что времяпрепровождение с друзьями делает людей счастливее. Затем они стремятся отвергнуть нулевую гипотезу – возможность того, что нет ассоциации или эффекта того типа, который предлагают психологи. В этом случае нулевая гипотеза будет заключаться в том, что нет никакой связи между счастьем и проведением времени с друзьями.
Что такое статистическая значимость?
Открытие считается статистически значимым, если предполагается, что результаты исследования, основанного на конкретной выборке людей, могут быть обобщены на более широкую исследуемую популяцию. Традиционным критерием статистической значимости в психологии является p-значение 0,05, хотя недавно были предложены более строгие критерии.
Что такое p-значение?
Значение p – это мера для определения статистической значимости. Грубо говоря, p-значение – это вероятность случайного получения результата исследования, если нулевая гипотеза верна. Чем меньше p-значение, тем меньше вероятность того, что наблюдаемый результат будет найден в отсутствие реального эффекта или связи между переменными. Порог значимости традиционно составляет p-значение менее 0,05 , хотя кризис репликации заставил психологов переосмыслить использование p-значений или предложить изменить порог того, что считается «значимым», на более низкое p-значение ( например .005). Тот факт, что 0,05 является произвольным эталоном, для некоторых является еще одним свидетельством того, что значениям p придают слишком большое значение.
Что такое ошибки типа I и типа II?
Ошибка типа I возникает, когда нулевая гипотеза отклоняется, даже если она действительно верна, что обычно называется ложноположительным. Чем ниже значение p, тем ниже вероятность ошибки 1-го типа. Ошибка типа II возникает, когда нулевая гипотеза принимается неправильно, что называется ложноотрицательным. Большая статистическая мощность исследования (которая связана с такими факторами, как размер выборки) означает меньшую вероятность ошибки типа II.
Как психология продвигается вперед
Кризис репликации спровоцировал горячие внутренние дебаты в этой области, некоторые утверждали, что он требует пересмотра психологической науки, а другие утверждали, что «кризис» нереален или преувеличен. Тем не менее психологи, заинтересованные в реформе, прилагают все усилия, чтобы сделать утверждения психологических исследований более убедительными.
Что должно произойти дальше?
Ближайшие цели реформаторов включают большую прозрачность в планировании исследований и анализе данных, более регулярное последующее тестирование результатов, чтобы убедиться, что их можно надежно наблюдать, а также дизайн исследований, который хорошо подходит для рассматриваемых научных вопросов. Еще предстоит увидеть, какие подходы в конечном итоге будут наиболее полезными для повышения достоверности психологических выводов.
Какие практики могут исправить кризис репликации?
Психологи разработали ряд стратегий, чтобы обеспечить большее доверие к будущим открытиям. Сюда входит проведение большего количества копий новых результатов, использование более крупных выборок и использование тщательно проверенных мер. Другой – предварительная регистрация, определение своей гипотезы и планы исследования перед проведением исследования. Еще один – зарегистрированные отчеты, в которых журналы соглашаются публиковать прозрачно спланированное исследование независимо от результатов.
Как изменилось поле?
В дополнение к особым процедурам, направленным на ограничение ненадежной исследовательской практики, многие организации, приверженные принципам надежности и прозрачности , возникли после кризиса репликации. Некоторые из этих инициатив включают Открытое научное сотрудничество , Общество улучшения психологических наук и Акселератор психологических наук.