Обзор учебников по статистике и мат. методам анализа данных

Ниже перечислены те учебные материалы по мат. методам анализа данных, к которым я так или иначе обращаюсь. Это не самый полный список и даже может быть не самый лучший набор, особенно в части англоязычных материалов. Если вы знаете какой-нибудь интересный и адекватный учебник, который я обошел вниманием — пишите в комментариях.

Учебников по мат. методам много, и в каждой специальности они разные. Так, русскоязычные психологи используют обычно учебник А. Наследова (ранее — Е. Сидоренко). Социологи отдают предпочтение другим учебникам — «Измерение в социологии» Ю. Толстой и «Математическая обработка данных в социальных науках. Современные методы» Д. Крамера, медики — «Медико-биологическая статистика» С.Гланца. Все специальности, как правило, имеют свои традиции использования методов и описания результатов, иногда очень специфические или необычные — особенно в этом отношении преуспели медики и экономисты (экoнометристы).

Когда меня спрашивают, какой учебник читать, я обычно рекомендую начинать с учебника Наследова и потом переходить на англоязычные учебники. И, отдельным пунктом — не очень рекомендую учебник Сидоренко, ввиду его некоторой старости и акцента на ручных методах анализа. Не говоря уже о некоторых фактических ошибках, о которых как-то мне говорили коллеги. Учебник Наследова достаточно прост в понимании, содержит, как я уже ранее упоминал, примеры работы в SPSS и т. д. Хотя у этого учебника тоже есть некоторые недостатки: есть определенного рода претензии к этому учебнику — предельная алгоритмизация методов анализа (если переменные интервальны — один метод, если интервальные и номинальные — другой, если они зависимы — третий и т. д.). Из-за этой алгоритмизации может пропасть желание понимать, как же реально ведут себя данные, что же происходит с процессами. К тому же, многие вещи из современного инструментария просто опущены — те же бутстрепы и доверительные интервалы. Однако справедливости ради стоит сказать, что учебнику уже десять лет, и АДН уже давно ведет речь и вроде бы даже пишет новый учебник. В общем, ждем.

Англоязычные учебники, как правило, либо совсем простенькие (и я, честно говоря, их не знаю, не назову), либо, что чаще, затрагивают какую-то определенную группу методов. Психологи чаще всего пользуются многомерными методами, помимо примитивных методов проверки значимости нулевой гипотезы. В этой области вполне хороши учебники «Applied multivariate research» от Meyers, Gamst & Guarino. Естественно, хорош «Using Multivariate Statistics» от Tabachnick, Fidell. Коллеги утверждают, что неплох ранее упоминавшийся учебник Филда «Discovering Statistics using IBM SPSS Statistics». Я в последнее время эпизодически обращаюсь к «Handbook of statistics. Volume 26 Psychometrics» под редакцией Rao и Sinharay. Несмотря на то, что в названии фигурирует «психометрика» (к слову, самая «статистически"-емкая дисциплина в психологии; или, как мне тут под руку ворчат намекают, как минимум, «одна из»), это более тысячи страниц концентрированной радости аналитика.

Для тех, кто уже более опытен в аналитизе данных и знает свою область исследований и релевантные методы анализа, могу порекомендовать две серии:

1) небольшие, достаточно давние, но весьма подробные тексты по конкретным методам или парадигмам.

2) современная и динамично пополняющаяся серия книг от Springer. Ощущается небольшой уклон в сторону промышленно-программистских тем и методов, но может быть полезно и академическим психологам.

Из онлайн-ресурсов очень хорош электронный учебник от компании StatSoft Statistica — statsoft.ru/home/textbook/default.htm. Рассмотрены и внятно описаны базовые понятия и алгоритмы. Естественно, так как это продукт компании, которая выпускает программу Statistica, многие разделы выглядят как статистическая справка к реализованным в программе методам. Ну и, естественно, все иллюстрации из Statistica.

___________

Филипп Управителев