Archivo mensual: octubre 2011

CFP / ACM TIST (ACM Transactions on Intelligent Systems and Technology) Número Especial sobre Social Web Mining

Las plataformas sociales, como Facebook, Google+, Twitter, han llamado la atención tanto a usuarios, como a la industria e incluso a las comunidades de investigadores. El éxito de estas plataformas proporciona gran cantidad de información y sus consecuentes oportunidades en el comercio electrónico, formulación de políticas, recomendaciones de social media, y otros campos. Por ello, es todo un reto desarrollar modelos para las redes sociales y realizar predicciones sobre las mismas, ya que esta prosperidad en las redes sociales está llevando a un exceso de información difícil de procesar.

El social web mining tiene como objetivo modelizar las iteraciones sociales, (p.e. mensajes y post en Facebook), las relaciones (p.e. Amistades en Facebook, Followers en Twitter, Amigos/Familia/Conocidos en Google +), y entender las reglas para poder realizar predicciones.

Esta publicación pretende crear un compendio con los principales trabajos de data mining y aprendizaje automático en relación a las redes sociales. Los principales temas de interés son:

– Detección de comunidades
– Rastreo de redes sociales
– Grafo mining a gran escala
– Data mining multi-relacional
– Noticias/sistemas de recomendación social
– Aprendizaje en redes sociales
– Protección de la privacidad
– Análisis de los sentimientos (p.e., opinion mining en Twitter)

Cuando se publique, habrá que hacerse con él! Porque será la referencia a nivel académico de la realidad social.

 

 

http://tist.acm.org/

Agradecimientos:  Gabor Lugosi

Anuncios

3 comentarios

Archivado bajo social media

Anónimo versus identificado – Latest News!

Después de mucha polémica, con perfiles retirados o incluso borrados, y una postura que parecía muy firme, Google, a través de Vic Gundotra SVP, y durante las conversaciones sobre la web 2.0 que han tenido lugar en San Francisco
http://www.web2summit.com/web2011
ha anunciado que su red social soportará pseudónimos, alias y otros tipos de identidad. No se han dado fechas, ni funcionamientos específicos.
Esto no quiere decir que Google vaya a permitir que introduzcamos un nickname en lugar de nuestro nombre, sino que se implementarán nuevos campos para guardar dicha información y mostrarla en lugar de nuestro nombre. Lo que no se ha dicho es si será obligatorio utilizar el nombre real para identificarse de cara a Google.

We will see…

Deja un comentario

Archivado bajo social media

Google y N-Grams, juguemos!

La semana pasada estuve entretenida con la estadística, todo empezó con la visita a Barcelona de Hal Varian (economista en jefe de Google) sobre la estadística como profesión de futuro http://www.youtube.com/watch?v=tm3lZJdEvCc

La cual me llevó a un artículo del New York Times, donde se menciona cómo las búsquedas de Google pueden usarse en las ciencias sociales como datos de comportamiento de millones de sujetos según cómo interactúan en la web:
http://www.nytimes.com/2009/08/06/technology/06stats.html?scp=1&sq=For%20Today%92s%20Graduate,%20Just%20One%20Word:%20Statistics&st=cse
http://books.google.com/ngrams/

Y entonces y gracias a TED y descubrí n-grams:
http://www.ted.com/talks/what_we_learned_from_5_million_books.html
http://books.google.com/ngrams/

Google en los últimos años ha digitalizando 5,2 millones de libros, publicados entre 1500 y 2008, en inglés, francés, español, alemán, chino y ruso. Lo cual supone una base de datos gratuita, con 500 mil millones de términos obtenidos de esos libros.
¿Qué hace exactamente Google Books Ngram Viewer?
1. Lee una serie de términos separados por comas —n-gramas, específicamente—
2. Lee un rango establecido en años
3. Lee un corpus elegido por el usuario: la base de datos. Hay 10 disponibles.
4. Lee un factor de precisión (smoothing) entre 0 y 50, con 3 como valor por defecto. Mientras más grande sea el factor, más “suave” es la curva de la gráfica
5. Entrega una gráfica con la frecuencia de los términos de búsqueda a lo largo del corpus y los años elegidos
Yo he introducido el término: blog y 2 rangos de datos, como podéis ver en las curvas adjuntas.

de 1800 a 2000

de 2000 a 2008

Curiosamente alrededor de 1900 hay una explosión similar que a partir del 2000. Son los blog tan antiguos?

Deja un comentario

Archivado bajo social media

Spotify y Facebook

Desde hace unos días la única forma de registrarte en Spotify como nuevo usuarios es a través de una cuenta de Facebook. Las quejas de los usuarios han sido inmediatas, por la inexistencia de otras opciones. Pero no me trataré de la resistencia al cambio de los usuarios, que ya traté la semana pasada, sino de los cambios en el modelo de negocio de Spotify:
– está renunciando a tener usuarios propios, ya que pasan a ser controlados directamente por Facebook
– añade una exigencia nueva a tus actuales clientes
– queda a merced de una compañía con riesgos de privacidad y con una relación de poder para cambiar las reglas de negocio cuando lo entienda oportuno.
Mi impresión es que hasta dentro de cierto tiempo no sabremos si a Spotify le ha merecido la pena el cambio de negocio. Está claro que su situación económica era insostenible y algo tenía que hacer. Ahora habrá que estar atentos a la reacción de sus competidores, que pueden empezar a ver en la alianza Facebook-Spotify una de las posiciones más sólidas en el binomio “social-contenidos”.

Deja un comentario

Archivado bajo social media