Paquetes recomendados de R

Hacer una lista de Paquetes recomendados de R puede ser una tarea complicada. Navegando podrás encontrar cientos (si no miles) de librerías diferentes. En el siguiente artículo te mostraré las librerías que más utilizo en mi día a día  y que te pueden resultar útiles para trabajar:

¿Cómo instalar un paquete en R?

Las funciones más útiles para trabajar desarrolladas en R se encuentran en los paquetes. Son librerías completamente gratuitas escritas por los usuarios de la comunidad de R. Instalar y cargar paquetes en R es muy sencillo. Deberás utilizar las siguientes instrucciones:

[sourcecode language=”python” wraplines=”false” collapse=”false”]
# Instalar paquete
install.packages(‘nombre del paquete’)
# Cargar paquete
library(‘nombre del paquete’)
[/sourcecode]

Paquetes recomendados de R

Por defecto se descargarán los paquetes de CRAN, por lo que es indispensable tener conexión a internet. Una vez esté el paquete está instalado, siempre lo tendrás disponible. Únicamente deberás llamarlo mediante la instrucción library o require una vez lo necesites.

Suscribete en linkedin

Cargar datos en R

RODBC, RMySQL, RPostgresSQL, RSQLite – Si necesitas leer datos de una base de datos, estos paquetes son realmente útiles. Te recomiendo que los pruebes todos para ver cuál funciona mejor y tiene mejor tiempo de carga para la base de datos que quieras cargar.

XLConnect, xlsx – Estos paquetes te permitirán leer ficheros de Microsoft Excel en R. En caso que no consiguieras cargar los datos, te recomiendo que conviertas los ficheros en .csv y utilices las funciones base incluidas en R para cargar ficheros de texto plano, en caso de dudas, consulta la siguiente guia para importar y exportar datos.

foreign – Necesitas leer tablas de SAS o SPSS? En este paquete encontrarás varias funciones muy útiles para conseguir dicho objetivo.

Manipular datos en R

dplyr – Funciones básicas para sumarizar, reordenar y fusionar datasets. Este paquete es muy ágil para manejar los datos. Ejemplos de uso.

stringr – Útil paquete con bastantes funciones para trabajar con datos del tipo character.

lubridate – Trabajar con fechas puede ser algo realmente tedioso en R. En este paquete podrás encontrar interesantes funciones para trabajar fácilmente con este tipo de dato.

Visualizar datos en R

ggplot2 – Este paquete es uno de los grandes en el mundo de R. Es muy probable que lo conozcas si tienes algo de experiencia en el uso de librerías para R. Uno de los paquetes recomendados de R que no debe faltar en tu día a día. Con ggplot2 podrás realizar visualización gráfica de cualquier tipo. El tipo de gráficos que podrás crear son realmente atractivos (visualmente hablando). Ejemplos de uso.

ggvis – Se autodefine como un paquete que combina lo mejor de R con lo mejor de la web. Ello lo convierte en un práctico paquete si has de publicar los gráficos vía web. Permite realizar gráficos interactivos. Ejemplos de uso.

shiny– Duro rival para el paquete anterior. Es el principal paquete utilizado para construir aplicaciones web utilizando el lenguaje R. Ofrece infinidad de posibilidades para mostrar datos con visualizaciones muy atractivas. Sin duda, si tu intención es utilizar los outputs de R para realizar tus presentaciones, este es de los mejores paquetes recomendados de R que puedes utilizar. Ejemplos de uso.

rgl – Necesitas realizar gráficos en 3D? Prueba este paquete,no te defraudará. Dentro de todos los paquetes que he utilizado para realizar visualizaciones en tres dimensiones, este lleva implementadas muchas funciones y los gráficos resultantes son espectaculares.

googleVis – Si te gusta la interfaz Google, con este paquete podrás implementar los Google Chart tools para visualizar los datos en tu propia página web. Ejemplos de uso.

Suscribete a la newsletter

Modelización en R

caret – Este es uno de los paquetes recomendados de R que cualquier científico de datos debería conocer. Es como una ‘navaja suiza’ en la que encontrarás todo tipo de herramientas para resolver problemas tanto de regresión como de clasificación.

car – Archifamoso paquete para realizar el test de varianza Anova.

mgcv – Paquete para realizar Modelos Aditivos Generalizados (GAM).

randomForest – Métodos de Random forest methods para problemas de aprendizaje automático.

multcomp – Herramientas para tests de comparación múltiple.

vcd – Herramientas de visualización y tests para datos categóricos.

glmnet – Regresiones de Lasso y elastic-net con validación cruzada.

survival – Herramientas para análisis de supervivencia.

Conclusión

Debido a la amplia comunidad que hay detrás de este popular lenguaje desarrollando y creando constantemente nuevos paquetes es posible disponer de estos recursos. Sin duda, este es el gran secreto para que este lenguaje, se haya convertido en uno de los más populares por los científicos de datos.

Ferran Arroyo
Fan del Machine Learning, la IA, la tecnología y viajar. No siempre por este orden.
Paquetes recomendados de R
Puntúa mi artículo