Observatorio de CENATIC

Equipo, redes
  • Increase font size
  • Default font size
  • Decrease font size

Minería de datos con Ruby y Twitter

E-mail Imprimir

 

M. Tim Jones, Independent author

Resumen: Twitter no solo es una herramienta fantástica de redes sociales en tiempo real, también es una rica fuente de información que está madura para hacer minería de datos. En promedio, los usuarios de Twitter generan 140 millones de trinos por día en una variedad de temas. Este artículo le introduce a la minería de datos y demuestra el concepto con el lenguaje Ruby orientado a objetos.

En octubre del 2008, como muchos otros, creé una cuenta de Twitter por curiosidad. Como la mayoría de las personas, me conecté con amigos y realicé algunas búsquedas aleatorias para entender mejor el servicio. Comunicarse con solo 140 caracteres no me pareció una idea que pudiera ser popular. Un evento no relacionado me ayudó a entender el valor real de Twitter.

A principios de julio del 2009, mi proveedor de servicios Web se apagó. Después de una búsqueda al azar en la Web encontré información que señalaba que el culpable había sido un incendio en la Plaza Fisher de Seattle. La información de fuentes tradicionales basadas en la Web fue lenta y no daba ninguna indicación sobre cuándo se reanudaría el servicio. No obstante, después de buscar en Twitter, encontré cuentas personales sobre el incidente, incluyendo información en tiempo real sobre lo que estaba sucediendo en el sitio. Por ejemplo, poco después de que mi servicio Web retornara, recibí un trino que indicaba que había generadores eléctricos diesel afuera del edificio.

Allí fue cuando entendí que el verdadero poder de Twitter es la comunicación de información abierta y en tiempo real entre individuos y grupos. Aún así, debajo de la superficie, hay un tesoro oculto de información sobre los comportamientos de los usuarios y sobre tendencias a niveles locales y globales. Exploro este descubrimiento en el contexto de scripts simples usando el lenguaje Ruby y Twitter gem, un derivador de API para Twitter. También demuestro cómo construir mashups simples para virtualización de datos usando otros servicios y aplicaciones Web.

Artículo completo en: http://www.ibm.com/developerworks/ssa/library/os-dataminingrubytwitter/index.html

Fecha: 2/05/2012. Fuente: IBM developerWorks