Cómo cargar datos de un fichero CSV (columnas separadas por tabulador) y cómo hacer filtros y otros tratamientos en R.

Requisitos para hacer tratamiento de ficheros CSV en R

El requisito único será disponer de R y RStudio, así como de sus librerías básicas. En el siguiente artículo explicamos cómo instalar R, RStudio y sus librerías básicas:

El contenido del fichero de ejemplo personas.csv

El contenido del fichero CSV que usaremos de ejemplo, será el siguiente:

Cada campo, en este caso, va separado por tabulador. Este fichero lo llamaremos «personas.csv».

Cargar y preparar datos de CSV en R

En primer lugar, instalaremos la librería que utilizaremos «readr», ejecutando en R:

La usaremos, ejecutando:

Cargaremos el fichero CSV con columnas separadas por tabulador, guardando el contenido en el dataset «ds», usando el comando:

Con el comando siguiente mostraremos los datos cargados en el dataset «ds»:

Cargar y preparar datos de CSV en R

Para mostrar el tipo de datos que R ha asignado a cada columna (y el nombre), ejecutaremos el comando:

Cargar y preparar datos de CSV en R

Y con este otro comando obtendremos el sumario de los datos cargados (número de columnas, tipo, número de filas, media, mínimo, máximo, tamaño, etc.):

Cargar y preparar datos de CSV en R

Para establecer un nombre personalizado a cada columna del dataset «ds», ejecutaremos los siguientes comandos:

Filtrar información CSV en R

Para obtener las personas con edad mayor de 35 y guardar el resultado en un dataset llamado dsMayorEdad35, ejecutaremos:

Para mostrar el contenido del dataset dsMayorEdad35, ejecutaremos:

Filtrar información CSV en R

Para obtener la media de edad de las personas de más de 30 años y que su provincia sea «Alicante» o «Murcia», ejecutaremos:

Que nos devolverá: 44.

Filtrar información CSV en R