Вредные советы от Карла Фристона

Обязательно почитайте эту статью. Карл Фристон под видом вредных советов для рецензента разбирает ряд мифов, которые существуют по поводу статистики и проверки гипотез.

Полезно и весьма. Читать всем, кто подает статьи в западные журналы.

NeuroImage2012Friston

Journal of Visualized Experiments

И все-таки мы живем в увлекательные для науки времена. Например, у нас есть Jounal of Visualized Experiments — журнал, в котором публикуются не статьи, а видео методов.

Журнал преследует две цели. Во-первых, видеорегистрация методов позволяет более точные репликации, нежели следование протоколам, описанным словесно. Во-вторых, с помощью видео можно быстрее и проще научиться различным методам. #горячимюнымкогнитивным могут быть интересны некоторые публикации из разделов Behaviour и Neuroscience.

Например, в этом видео Дэвид Кармел и Марк Аркаро подробно обсуждают методы создания бинокулярного соревнования:

http://www.jove.com/video/2030/how-to-create-and-use-binocular-rivalry

«You should be just terrified»

«Не-статистикам, опасающимся научных цифр в литературе, я могу сказать следующее: «Цифр, которые вы слышите, не нужно бояться. Иногда от них стоит приходить в ужас».

(«To non-statisticians who are afraid of scientific numbers in the literature, I can tell you that you should not be afraid of the numbers you hear. Sometimes, you should just be terrified»)

Речь Джона Иоаннидиса на факультете статистики в Университете Калифорнии в Беркли — «Ошибки (мои собственные) и устрашающая неопределенность чисел».

Полный текст речи опубликован в European Journal of Clinical Investigation: http://www.ncbi.nlm.nih.gov/pubmed/24 785 138?dopt=Abstract

pic: http://xkcd.com/605/

«The Meaning of „Significance“ for Different Types of Research»

В Acta Psychologica опубликован перевод на английский статьи классика голландской психологии Адриана де Гроота «The Meaning of „Significance“ for Different Types of Research».

Несмотря на то, что статья была написана в 1956 году, к 2014 она стала лишь актуальнее — в ней рассматривается острый для современной психологии вопрос различия «эксплораторного» и «конфирматорного» типов исследования и соответствующих аналитических практик.

Текст, несмотря на тему, читается очень легко, а в комментариях переводчики анализируют идеи автора в современном контексте.

#TCTS весьма рекомендует к прочтению!

Препринт статьи в открытом доступе: http://www.ejwagenmakers.com/inpress/DeGroot1956_TA.pdf

pic: http://pps.sagepub.com/content/7/6/632/F1.large.jpg

Original: http://pps.sagepub.com/content/7/6/632/F1.large.jpg

Дорогу осилит пишущий

Не можем не напомнить всем пишущим в данный момент курсовые, дипломы, диссертации и статьи — вы справитесь, мы в вас верим =)

Старайтесь по мере возможности не делать бессмысленной работы, а если без этого никак, то привносить в бессмысленную работу хотя бы немного смысла. Например, если вы пишите диплом, и не видите в этом смысла, рассматривайте его как тексты для будущих статей. Ну и упорства и терпения вам.

Журнальный клуб TCTS — встреча 4 мая

Очередная онлайн-встреча журнального клуба TCTS — воскресенье 4 мая 20.00 по московскому времени.

Обсуждаем статью «Evidence for the automatic evaluation of self-generated actions» K. Aarts, J. De Houwer, G. Pourtois (см. ссылку).

Желающие присоединиться да напишут на

Текст статьи: Aarts_DeHouwer_Cognition

Рекомендации по созданию презентаций

Все #горячиеюныекогнитивные рано или поздно вынуждены делать презентации.

Этот опыт может быть болезненным (причем не столько для докладчика, сколько для слушателей). Чтобы этого не произошло, вот несколько полезных советов: Читать далее Рекомендации по созданию презентаций

Оформление списка литературы с помощью Mendeley/Zotero

Если вы сейчас пишете курсовую или диплом и оформляете список литературы вручную — не делайте этого. Не в том смысле, что не надо писать, а в том смысле, что для составления списков литературы и их оформления умные люди давно придумали две полезные программы — Mendeley и Zotero (есть еще Endnote и всякое другое, но они хуже). Они достаточно похожи, поэтому для краткости я буду называть их M&Z. Подробнее про разницу M&Z можно почитать тут: chetvericov.ru/faq-po-mendeley-i-zotero/ Основной момент — Zotero предполагает интеграцию в Firefox или Chrome, в то время как Mendeley — принципиально отдельное приложение. Чтобы их использовать, вам нужно выполнить несколько простых шагов.

1. Нужно установить программу на ваш компьютер. Mendeley можно взять отсюда, Zotero — отсюда.

2. Нужно импортировать свои статьи в базу программы. M&Z умеют автоматически обрабатывать большиство PDF и вытаскивать из них информацию об авторе, издании, и т. д. Поэтому вам нужно в настройках программы указать каталог, где лежат ваши PDF, и они будут автоматически импортированы. Разумеется, книжку 64-го года издательства Наука они вряд ли распознают. Поэтому часть информации придется вбить вручную. Это достаточно скучный, но необходимый процесс. Вот тут можно увидеть как импортировать статьи в Mendeley, а тут — как импортировать их в Zotero. Это несложно, честное слово.

3. Каждая из этих программ автоматически устанавливает плагины (дополнения) для Word и OpenOffice. Поэтому далее вы открываете свой текст и там, где вы ссылаетесь на какого-нибудь автора, вы используете плагин, чтобы вместо просто текста типа (Аллахвердов, 1993) вставить ссылку на соответствующий источник в базе, которую вы создали на предыдущем шаге.

4. Наконец, вы выбираете стиль цитирования ГОСТ Р 7.0.5−2008 (или тот стиль, который от вас требует ваш руководитель), жмете магическую кнопку «вставить библиографию», и у вас в тексте появляется аккуратно оформленная по всем правилам библиография.

Чтобы добавить наглядности — вот видео Юрия Тукачева, на котором он показывает, как можно просто сделать библиографию по ГОСТ с помощью Mendeley: www.youtube.com/watch?v=6ETQpdGa-4U

Если у вас есть вопросы про то, как использовать эти программы, пишите, мы готовы вам что-то подсказать. Если наберется достаточно желающих, можно попробовать какой-нибудь мини-семинар на психфаке СПбГУ организовать по работе с ними (в обмен на участие в экспериментах — А.Ч. =)).

Журнальный клуб TCTS — встреча 27 апреля

Очередная онлайн-встреча журнального клуба TCTS — воскресенье 27 апреля 20.00 по московскому времени. Обсуждаем статью «Attention Samples Stimuli Rythmically» A. Landau, P. Fries (см.ссылку).

Желающие присоединиться да напишут на 

www.esi-frankfurt.de/fileadmin/user_upload/Articles/Landau2012.pdf

«10 советов по анализу данных, которые я хотела бы узнать раньше» от Дороти Бишоп

Британский нейропсихолог Дороти Бишоп опубликовала в своем блоге «10 советов по анализу данных, которые я хотела бы узнать раньше», и любезно согласилась поделиться ими с #горячимиюнымикогнитивными. Советы в основном касаются сбора и систематизации данных, и рассчитаны на психологов, использующих SPSS и Excel. Кстати, TCTS горячо рекомендует блоги Дороти — deevybee.blogspot.com/. Там можно найти много интересного, в том числе вводные занятия по R, анализу близнецовых данных, анализу ЭЭГ, нейропсихологические тексты и просто около-академические размышления.

Итак, по мнению Дороти, при планировании эксперимента нужно держать в уме следующее:

• От того, как построен набор данных, напрямую зависит то, насколько просто будет его анализировать

• Через несколько месяцев, и тем более лет, вы о своих данных забудете практически все

• Совместное использование данных стремительно набирает популярность — подумайте о том, чтобы хранить свои данные в публичном репозитории.

Именно на эти основные идеи опираются сами рекомендации.

«1. Называйте файлы испытуемых однообразно и анонимно.

Большинство этических комиссий при использовании людей в качестве испытуемых требует анонимизировать данные. Не используйте в качестве названий файлов имена, инициалы и даты рождения испытуемых! Обычно для названий вполне подходят цифры. Но нужно помнить о двух вещах. Во-первых, вам может понадобиться возможность сортировки испытуемых по группам, поэтому к цифре удобно приставить букву, обозначающую группу (например, для групп young-middle aged-old подойдет Y1, Y2, … M1, M2 и т. д.). Но не забывайте о том, что вам скорее всего придется столкнуться с автоматической сортировкой по алфавиту, так что наилучшим выбором будет естественная последовательность букв. К тому же, последовательность из двадцати файлов может при сортировке превратиться в «S1, S10, S11, S12, S13, S14, S15, S16, S17, S18, S19, S2, S20, S3, S4, S5, S6, S7, S8, S9». Чтобы избежать этого, достаточно проследить за тем, чтобы все названия были одной длины — S01, S02 и т. д.

С другой стороны, если вы планируете использовать автоматическую обработку данных, убедитесь в том, что для названий файлов легко придумать цикл. Гораздо проще попросить программу последовательно обработать файлы, начинающиеся с S и заканчивающиеся номерами от 1 до 20, чем вводить названия файлов вручную.

А если вам нужно проанализировать большое количество файлов, задумайтесь о систематизации папок. Некоторые хранят все файлы по отдельному испытуемому в отдельной папке, а эту папку — в папке соответствующей группы — как неудобно! Мне нравится, когда все файлы, которые должны быть проанализированы вместе, хранятся вместе. Если продумать систему наименования файлов, нет никакой вероятности запутаться, где кто, и можно при анализе добраться до одной нужной папки не прибегая к большому количеству циклов.

2. Называйте переменные единообразно и интуитивно понятно, так чтобы эти названия работали в любой среде.

Если вы собираетесь анализировать свои данные в SPPS, назовите свои переменные так как этого требует SPSS — без пробелов, цифр в начале или запрещенных символов (и латиницей — прим.пер.). Подумайте о том, как вы будете называть эту переменную при описании результатов исследования. Часто рецензентов раздражает, когда одна и та же переменная называется по-разному в разных разделах текста. Гораздо правильнее начать с того названия, которое продержится как можно дольше.

3. Используйте закрепленные области в Excel

Это очень просто, но на удивление мало людей об этом знает. При прокручивании файла вниз или вправо в Excel, название переменной или наблюдения скрывается с листа. Если же вы наведете курсор на ячейку непосредственно под названиями переменных и справа от названий строк (т.е. на первую ячейку собственно данных, и выберете «окно"→"закрепить области», и столбцы, и строки над выделенной ячейкой будут оставаться на месте, когда вы прокручиваете таблицы.

Кроме того, есть (не очень удобный) способ заморозить области в SPSS — он описан здесь.

4. Ведите список переменных с их описанием.

В SPSS для сохранения подробностей можно использовать «метки» переменных, но они ограничены по длине и не всегда вмещают все необходимое. Имеет смысл держать отдельный файл для описания кодировки данных, включающий в себя список переменных, их описание, как обозначены отсутствующие данные и т. д. Если вы планируете выкладывать данные в открытый доступ — это обязательный пункт. И лучше всегда работать так, будто в ваших данных должен будет разобраться кто-то другой.

5. Используйте один большой файл вместо множества маленьких, и скрывайте переменные, которые вы не используете в конкретный момент.

Если вы работаете с большим набором данных, часто хочется разбить его на несколько более простых в обращении. У вас могут быть сотни переменных, из которых вы хотите взять несколько интересующих в конкретный момент, и выделить в отдельный файл. Проблема в том, что сделав это, вы можете легко потеряться в собственных данных.

Представьте, что у вас есть гигантский файл, и вы выделили несколько переменных для нового файла, и в нем нашли ошибку. Теперь вам придется исправить ее в двух файлах, что неудобно — настолько неудобно, что вы можете пропустить этот шаг и у вас будет две разные версии данных, и вы забудете, какая из них правильная.

Кроме того, если вам захочется проанализировать связь между выделенными переменными и переменными в том большом файле, вам придется еще дольше возиться с переносом данных, что является прямым путем к ошибкам — особенно если вы копируете и вставляете. Поэтому я советую работать с большим файлом, содержащим все данные, скрупулезно переименовывая его в случае изменений. Проблема «слишком много данных» решается скрыванием ненужных частей файла.

В Excel это делается просто. Выделите колонки, которые хотите скрыть, и нажмите «Ячейки—Формат--Скрыть «. Чтобы вернуть их назад, выделите колонки рядом со скрытыми и нажмите «Отобразить».

Похожую операцию можно сделать в SPSS, она называется «набор переменных». Она требует чуть больше шагов чем в Excel, но достаточно определить набор один раз, и он сохраняется вместе с файлом, так что выбрать те же переменные заново можно очень просто. Инструкции — здесь.

Кстати, этот сайт полон полезностей. Например, там есть инструкция по созданию таблиц в формате APA в SPSS.

6. Никогда не добавляйте к названию файла «final» и всегда храните копии основных данных.

Назвать файл «финальным» очень хочется. Но у вас обязательно окажутся файлы с названиями «final final», «действительно final» или «final версия 10». Для определения наиболее свежей версии лучше использовать даты.

Совет о резервном копировании элементарен до боли, но даже самые опытные из нас забывают это делать. Если вы потратили на что-то несколько дней, пусть оно хранится в безопасности, даже если компьютер сломается или его украдут.

7. Смотрите на данные

Прежде чем хвататься за статистику, важно визуализировать ваши данные. Это хороший способ обнаружения странностей в вашем наборе данных, например, выходящих за ожидаемые рамки значений. Например, если у вас есть сырые и взвешенные значения, построив график рассеивания, вы убедитесь, что конвертация произошла правильно. Также следует проверить распределение данных, и определиться с дальнейшими шагами, если анализ предполагает нормальность, а данные распределены иначе. Об этой часто встречающейся ситуации можно прочесть в учебнике Филда «Discovering Statistics Using SPSS» (да и в других учебниках по статистике, список которых можно найти в блоге по тегу stats — прим. пер).

8. Ведите журнал анализа.

Обычно я продумываю то, что я хочу сделать, составляю список аналитических процедур и таблиц, которые я хочу получить, и работаю по этому списку. На практике, работа редко идет гладко. Можно обнаружить отсутствующий или поврежденный файл, или понять, что данные нужно трансформировать. Традиционно в процессе анализа используют с"лабораторный журнал", в который заносят соответствующие записи. Я предпочитаю использовать обычный файл Word, который держу открытым в процессе анализа, и в который я записываю все что делаю, по дням.

Эти записи включают в себя названия созданных файлов, их местоположение, и что в них находится. Это действительно важно, если вы не хотите через некоторое время оказаться посреди огромного количества разных версий разных файлов, пытаясь найти тот, который вы едва помните как создавали.

Кроме того, я веду записи о возникших проблемах. Например, у вас есть экспериментальная задача, которая была несколько раз проведена неправильно, так что эти случаи нужно будет исключить. В журнале вы можете сделать запись о том, когда ошибка была замечена, какая часть данных была затронута, и какие меры были предприняты. Если вы этого не сделаете, вполне возможно что вы, или кто-то другой, работая с данными позднее, не будет понимать, откуда проблема. Или, как это, пожалуй, слишком часто бывает со мной, вы проведете все утро, пытаясь найти проблему, которую уже находили месяц назад.

10. Используйте скрипты SPSS

При использовании SPSS нужно хранить скрипты проведенных тестов и манипуляций — это касается всех нас. Даже если вы ничего не знаете о скриптах, это очень просто начать делать. Сделайте все нужные настройки через меню SPSS, но вместо OK нажмите Paste. Откроется окно, в котором выбранные вами команды записаны в виде скрипта. Теперь можно выделить весь скрипт или его часть, и запустить его, нажав на большую зеленую стрелку. Если вы проведете другой анализ, и снова нажмете Paste, новые команды будут дописаны к тому же скрипту.

Такой способ имеет четыре преимущества:

1) Скрипт можно сохранить, и у вас будет постоянная запись о проведенном анализе. Она может дополнять ваш журнал (в котором можно хранить имя файла со скриптом).

2) Скрипт можно комментировать. Любой текст, начинающийся звездочкой и заканчивающийся точкой, является комментарием. Их можно использовать для заметок о том, что именно проверяет анализ.

3) Можно всегда вернуться и провести анализ заново. Например, если вы обнаружили ошибку в данных и исправили её, вам не нужно повторять все свои шаги заново — вы можете просто еще раз запустить скрипт.

4) Это отличный способ научиться скриптам SPSS. Очень многому можно научиться просто взяв сгенерированный код в качестве основы и изменяя параметры (например, названия переменных). Если вы хотите параллельно провести анализ нескольких переменных, гораздо проще скопировать часть скрипта и подставить нужные названия, чем возвращаться в меню.

10. Проверьте весь анализ перед публикацией.

Очень важно проверить все шаги прежде чем сдать работу. Всегда проверяйте, все ли таблицы и цифры вы можете воспроизвести. Удивительно, насколько часто, делая анализ второй раз, получаешь другие результаты! Иногда кажется, что это какой-то злой дух вселился в компьютер и дразнится. Даже если различия небольшие, они все равно вызывают беспокойство. В моем опыте, такие вещи часто происходят из-за того, что забываешь выделить нужную группу испытуемых (если есть критерии исключения). Или код отсутствия данных по ошибке был включен в данные. При плохом развитии событий, вы могли скопировать и вставить что-то в файл, забыв о том, что данные были определенным образом отсортированы. И иногда (лишь иногда), эти ошибки распространяются и на файл в Excel и на файл в SPSS. Полезно хранить данные в обоих форматах, чтобы в таких случаях иметь возможность грубо сравнить, например, средние. И здесь вы оцените скрипты SPSS. Со скриптом гораздо проще провести анализ заново. Более того, при финальной проверке, можно подписать, какая таблица в статье к какому фрагменту кода относится, и таким образом всегда иметь возможность вернуться и перепроверить результаты."

Оригинальная запись тут.