R: la revolución del análisis estadístico

Categories: Cursos

Por José Ignacio Casas
Jomial Research & Consultants SL

Hasta hace muy pocos años el lenguaje estadístico R era un completo desconocido fuera del ámbito académico anglosajón. De hecho nació a mediados de la década de los noventa, de la mano de dos catedráticos de la Universidad de Auckland (Nueva Zelanda) pero hoy en día es el software dominante en el terreno del análisis estadístico universitario, con presencia creciente incluso en nuestro país.

Sus fortalezas: R es un lenguaje libre, abierto y gratuito, con una potencia analítica sin rival, una entusiasta comunidad de desarrolladores y con una continua expansión en aplicaciones de todo tipo, desde la captura de datos de internet hasta el geomarketing, pasando por muy altas capacidades gráficas y la confección semi-automática de informes.

Norman Nie, del SPSS a R

Durante muchos decenios el software para el análisis estadístico estaba dominado por dos grandes propuestas comerciales: SAS, en particular en el seno de la gran empresa; y SPSS, para ámbitos académicos y de estudios de mercado. A este respecto, es significativa la trayectoria de Norman Nie, co-fundador de SPSS y su Presidente y CEO hasta 2009. En enero de ese año dos muy citados artículos de The New York Times (aquí y aquí) alertaban sobre la imparable expansión del lenguaje R. En julio del mismo año IBM anunciaba la compra de SPSS y en octubre Nie era nombrado CEO de Revolution Analytics, empresa que ofrece apoyo comercial sobre la base del lenguaje R, como recogía la revista Forbes. No es ninguna sorpresa que a principios de 2015 Revolution Analytics fuera adquirida por Microsoft.

Comparativa según la Universidad de Nueva York

¿Qué ofrece R en comparación con los paquetes hasta ahora conocidos de software estadístico? La Universidad de Nueva York (NYU) nos brinda el siguiente cuadro:

cuadro

Uso de R

A pesar de tener una curva de aprendizaje “empinada” -inicio exigente, pero compensado con creces al poco tiempo-, el uso de R se extiende continuamente entre los investigadores y analistas de datos. Según los “Job Trends” del observatorio del mercado de trabajo de www.indeed.com el porcentaje de puestos de trabajo ofertados en los que se requiere el manejo de R ha sobrepasado al de SPSS, como recoge el siguiente gráfico:

 

Fuente: http://r4stats.com/articles/popularity/

La comparativa entre R y SAS todavía se inclina a favor de la segunda, aunque la tendencia a medio plazo parece también anunciar un vuelco:

Fuente: http://r4stats.com/articles/popularity/

SAS parece más asentado en la gran empresa, donde el coste de la licencia no supone un obstáculo, si con ello se garantiza el apoyo técnico y comercial. R carece de este respaldo comercial pero en su lugar cuenta con una entusiasta comunidad de desarrolladores en blogs o webs de consulta. Otra gran fuente de ayuda son revistas gratuitas online como el Journal of Statistical Software o The R Journal.

R para la investigación de mercados y el análisis de encuestas

Pero gracias a su potencia de análisis y de presentación gráfica, a su gran versatilidad y su capacidad para integrar el proceso de producción desde la descarga de datos hasta la confección de informes, el software estadístico R parece destinado a dar un gran juego en la investigación de mercados. Por eso AEDEMO ha organizado un próximo curso introductorio, que ayude a los profesionales del sector a escalar esa “empinada” curva de aprendizaje y sacar el máximo partido al lenguaje R.

4 Responses to "R: la revolución del análisis estadístico"

  1. Juan V. Posted on 5 junio, 2015 at 00:08

    Interesante comparativa. En el siguiente artículo se añaden otros puntos de análisis:

    http://blog.mbitschool.com/2015/05/data-science-tools-sas-vs-r.html
    http://sasybi.blogspot.com.es/2015/05/data-science-tools-sas-vs-r.html

  2. Rafael Posted on 7 septiembre, 2015 at 19:53

    Muy bueno!!!!

  3. Eduardo Ortega Paez Posted on 15 abril, 2016 at 14:57

    Hola, me gustaría consultaros si sabéis la función de R para calcular los intervalos de confianza de la media recortada y de la mediana para Mac. Gracias

Deja un comentario