Некоторое время назад в моей ленте мелькнула статья «Analyzing the history of Cognition using Topic Models».
Уже из названия видно, что статья совмещает сразу несколько крайне любопытных областей — историю науки и сложные методы анализа даных,
Посетовав на то, что исследований, посвященных истории когнитивной науки, лишь считанное количество, авторы решили пойти другим путем. В конце концов, разговоры в кулуарах и на банкете во время конференций — неплохой способ быть в теме, но сколько ж можно. И собрали заголовки и аннотации статей журнала Cognition за последние 34 года. К слову о репрезентативности, impact factor у Cognition порядка 3,6, у нежно любимого мной Behavior Research Methods около 2,45, а у самого известного российского журнала «Вопросы психологии» - всего 0,66.
Полученные аннотации были очищены от стоп-слов, стеммизированы и пропущены через алгоритм латентного размещения Дирихле (Latent Dirichlet Allocation, LDA). Если кратко описывать метод, то предполагается, что группа тех или иных слов в тексте может относиться к одной определенной теме. Например, слова «мяу», «молоко», «котенок» так или иначе связаны с темой «кошки». Соответственно, каждый текст может быть связан с небольшим количеством неявных тем, которые проявляются через используемые в тексте слова. А LDA — один из методов машинного обучения, позволяющий определять, с какими темами общего корпуса текстов связан тот или иной конкретный текст.
Акцентов в анализе аннотаций статей было два. Первый — об общих трендах в когнитивной науке, framing topics. Выяснилось, что где-то с 90-х годов происходит ощутимое падение количества работ, описывающих высокоуровневые абстрактные теории, и растет количество экспериментальных работ.
Наряду с общими трендами оценивались и более локальные темы (графики представлены ниже на картинке). Так, оказалось, что тема «moral (social behaviour, judgement, harm, people)» стала крайне интересна исследователям в начале 2000-х годов, чуть более равномерно растет доля работ по теме «action (movement, control, participant, sense)». Одновременно с этим с начала времен, то есть, за весь наблюдаемый период, падает интерес к лингвистическим аспектам мышления «sentence (processing, syntactic, verb, language)» и к возрастным особенностям когнитивного развития «child (study development, adult, age)». Последняя, впрочем, в последние годы находится на «плато», и достаточно стабильно привлекательна для исследователей. Наиболее драматична судьба темы «gaze (eye movement, visual, scene fixation)» — вероятность встретить работы с подобными словами стремительно росла с 90-х по середину 2000-х, после чего мы наблюдаем спад интереса, авторы исследования связывают такую динамику с увлечением в тот период айтрекингом.
Ну и сама статья, конечно же.
http://www.sciencedirect.com/science/article/pii/S0010027714002261