R: учебники

Бумажные учебники по R, как и по большинству динамично развивающихся областей, устаревают очень быстро. Поэтому если что-то читать — то лучше читать либо электронные англоязычные учебники, либо тематические блоги и сообщества. Вообще, настоятельно рекомендую забыть о мысли искать и читать на русском языке какие-либо тексты по анализу данных, как и в целом академические тексты. (Вторая иллюзия, которая возникает у новичков при работе с данными — что нужно постоянно видеть таблицу данных, через некоторое время также развеивается. Но это уже детали.)

Если все же хочется какого-то введения на русском языке, то рекомендую «Наглядная статистика. Используем R!» Шипунова и коллег, базовые вещи там вполне неплохо описаны. Из англоязычных — Burns P. The R Inferno; Kabacoff R. R in Action: Data Analysis and Graphics With R; Zhao Y., Cen Y. Data Mining Applications with R. В сети большая часть учебников или прочих дополнительных материалов легко гуглится. Например, очень большую коллекцию книг по R собрал мой друг и коллега Артем Клевцов: psylab.info/R:Литература

Из онлайн-учебников весьма хорош сайт www.statmethods.net/, где описаны основные методы манипуляции с данными (слияние, расщепление, транспонирование и проч.), методы анализа данных (проверка гипотез, многомерные методы, оценка мощности) и визуализации (гистограммы, дендрограмы, графики рассеяния, графики плотности и проч.).

Для тех, кто предпочитает различные онлайн-курсы, есть набор заданий, которые охватывают базовые разделы работы с R. Точно так же ряд тематических курсов на https://www.coursera.org/, которые посвящены анализу данных и близким темам, предполагают выполнение заданий на R.

В конце концов, сам R имеет достаточно подробную справку для каждой функции. Помимо просто описания функции, ее аргументов и структуры вывода, для многих команд есть еще и демо-примеры (команда demo ()). Не так давно вышел пакет swirl, который, по сути, является интерактивным учебником по R, в котором взаимодействие с пользователем строится через консоль.

Тем не менее, ситуации, когда приходится лезть в гугл и искать, как же можно решить свою задачу, случаются практически всегда, особенно на первых порах освоения языка. Благо, экосистема R включает в себя не только пакеты методы на любой вкус, но и обширное сообщество, у которого можно что-либо спросить. Ранее я упоминал уже про рассылку Nabble (http://r.789 695.n4.nabble.com/). Мне лично больше нравятся два других ресурса — CrossValidated и StackOverflow. Это форумы, на которых можно что-то спросить и получить ответ. CrossValidated — это сеть, которая объединяет различные ресурсы вопрос-ответного плана, StackOverflow, который посвящен языкам программирования (ветка по R — stackoverflow.com/questions/tagged/r), входит в нее. На CrossValidated есть и спец. форумы по статистике (http://stats.stackexchange.com). Таким образом, если гуглить что-то в духе «how to do xxx in R» или «k-medoids in R», ссылки на эти два форума будут в первой десятке.

Для любителей видео-курсов есть различные YouTube-каналы и плейлисты, например www.youtube.com/playlist?list=PL69A9CCD816A5F3A5.

Следует все же отметить, что большая часть учебников и учебных материалов по R посвящена именно каким-то основным принципам написания скриптов или работы с пакетами. Другие аспекты работы в R, такие как принципы грамотного программирования и оптимизация кода, написание собственных пакетов или разработка web-приложений для анализа данных на основе Shiny — практически не рассматриваются. Впрочем, для большинства психологов это требуется в очень редких случаях."

_____________

Филипп Управителев