lunes, 16 de junio de 2014

Como no hacer un artículo científico buscando universales

Estoy un poco encendido hoy, y todo por culpa de este artículo: Language universals at birth. Los que leéis este blog desde hace algún tiempo sabéis que me encantan los temas que hablan de universales comunes a toda la especie humana, tales como las expresiones faciales de las emociones básicas, la evolución de la anatomía y otros rasgos, etc. Sin embargo, para poder buscar este tipo de factores comunes a todos los seres humanos, tenemos que diseñar experimentos que nos permitan asegurar que esos efectos tienen una base neuro-biológica común a todos los seres humanos, lo que se ha denominado la unidad psíquica humana  (y probablemente a otros primates), y no como consecuencia de otros factores sociales.

Desgraciadamente, muchos de los experimentos que se encuentran por ahí son del tipo:

"He visto 20 personas, todas del mismo pueblo, perfil socio-económico, idioma y equipo de fútbol que hacen lo mismo los sábados por la tarde, por lo tanto, todas las personas del mundo deben hacer lo mismo a cualquier hora del día y en cualquier parte del mundo"

Esto es precisamente lo que hace este artículo que traigo hoy al patíbulo.

El artículo no empieza mal, trata de demostrar que los seres humanos tienen cierta predilección por una cierta formación de sílabas que cumplen ciertas reglas fonológicas de saliencia perceptual. Sin embargo, aquí pienso que está el primer punto debil... Hay lenguas con ritmo silábico, que efectivamente sí que tienen la base de su ritmo en las sílabas al hacer que todas tengan la misma duración, pero ¿qué pasa con las lenguas de ritmo acentual? En ellas las sílabas se alargan o acortan para que el espacio entre acentos sea siempre constante. ¿Deberíamos pensar que estas personas tienen la misma predilección o saliencia en las sílabas que los que hablan lenguas de ritmo silábico?

Si pasamos esto por alto, el artículo sigue asegurando que personas de "numerosos idiomas" (sic.) tienden a diferenciar mejor las sílabas "mejor formadas" que las "peor formadas". Para ello da ejemplos del inglés, francés (ambos indoeuropeos), hebreo y coreano (ambos países con una gran influencia occidental y con segundo idioma el inglés). ¿Donde están los hablantes de lenguas tonales? ¿Dónde están los hablantes de lenguas click? ¿o sujetos sin influencia occidental, como tribus amazónicas o polinésicas poco o no contactadas? ¿Donde están al menos lenguas de sitios no colonizados por hablantes indoeuropeos?

Para rematar, de la documentación que aportan sobre estos hallazgos, sólo uno de ellos no está firmado por uno de los propios autores del artículo, el resto son de I. Berent. Ser uno mismo casi la única referencia de algo que das por cierto no es metodológicamente muy correcto. Pero bueno, vamos a dejarlo también pasar (y lo de llamar "numerosos" a 4 idiomas también).

El problema es cuando elige para el estudio a 24 niños italianos de la misma clínica de madres todos ellos italianas. Parte de la base de que los niños "muy probablamente" (sic.) no pueden haber aprendido las sílabas antes de nacer por la dificultad de distinguir las sílabas correctamente debida a la atenuación del sonido dentro del útero.

Aquí habría que ver si la documentación que utiliza para esta afirmación (Abrams RM, et al. (1998) Fetal music perception: The role of sound transmission y Cuerleu D, Renard X, Versyp F, Paris-Delrue L, Crèpin G (1988) Fetal hearing) están debidamente actualizadas (la más reciente es de hace casi 15 años y la tecnología ha mejorado bastante) y de si se refieren a sonidos exteriores o producidos por la madre (aquí no sé si darle un voto de confianza a los autores por la segunda...).

Además no contempla el efecto del "baby-talk" de las madres que enfatiza los sonidos, saliencia y estructuras de los sonidos y sílabas del lenguaje materno, lo que en cualquier caso, combatiría la posible atenuación de los sonidos exteriores en le útero materno.

Así pues, cogemos a 24 bebés italianos, les ponemos unos sonidos de sílabas parecidas a las de las lenguas indoeuropeas y otras que no, y como no los reconocen tan bien como los que hacen los italianos pensamos que todos los bebés del mundo prefieren las sílabas del italiano a las de sus lenguas maternas, ¿no?

Pero no ha acabado aún... aquí viene la guinda del pastel: Para crear los sonidos a los que exponen a los bebés italianos, utilizan a una nativa rusa... ¡¡¡ya que en ruso sí que se pueden realizar esas combinaciones de sílabas!!!  ¿Si es un universal el rechazo de esos sonidos, por qué estos son perfectamente producibles por los rusos? ¡Por los 150 millones de hablantes nativos de ruso! ¿¿¿Y por qué no se ha replicado el experimento con bebés de madres rusas???

Una forma de mejorar el experimento (ojo que aquí estoy siendo sarcástico, no me toméis en serio, no por que sea metodológicamente incorrecto lo que voy a decir, sino porque sería éticamente una barbaridad*) sería hacer como en el experimento de los gansos de Konrad Lorenz en su libro "King Solomon's ring". Para asegurarse de si los gansos siguen instintivamente a sus madres por genética o por impronta pre-natal, les hizo una operación que los volvió temporalmente sordos. Esos gansos no fueron capaces de seguir a su madre cuando les devolvió la audición.

Escoger o crear fetos "temporalmente sordos" para ver si después de recuperar el oído tienen esa predilección por las sílabas bien formadas sería la única forma de asegurarse de que esa predilección es un universal humano, y no una impronta pre-natal como la de los gansos.

...Aunque sería mucho más fácil (¡y ético!) como he dicho replicar el experimento con niños rusos o al menos expuestos sistemáticamente a estas sílabas "mal formadas" en los últimos 3 meses de embarazo.

Por cierto, este "pedazo de artículo" ha sido publicado nada más y nada menos que en PNAS. Manda huevos de ganso...

*Nota: Sé que a la mayoría no habría que hacerles esta aclaración, pero hay gente en la cárcel por escribir bromas en internet que otros interpretaron que no era una broma, así que me curo en salud...

ResearchBlogging.orgGomez, D., Berent, I., Benavides-Varela, S., Bion, R., Cattarossi, L., Nespor, M., & Mehler, J. (2014). Language universals at birth Proceedings of the National Academy of Sciences, 111 (16), 5837-5841 DOI: 10.1073/pnas.1318261111

Lorenz, K. (2003). King Solomon's ring Routledge

martes, 10 de junio de 2014

Analizando el comportamiento de usuarios de Twitter durante eventos televisados

Cuando le explico a la gente que estoy estudiando una nueva carrera a veces me preguntan ¿y por qué un ingeniero informático elige antropología, si no tiene nada que ver? El motivo, además de preferencias personales, también son profesionales. Desde que me dedicaba a crear videojuegos en mi primera aventura profesional tuve claro que internet se estaba convirtiendo en algo social, y que para entenderlo no bastaban los "gurús" que aparecían cada 6 meses con teorías encabezadas por frases triunfantes.

Para comprender lo que está sucediendo en el internet social, tienes que entender al ser humano, pero no al ser humano individualizado, como hace la psicología, sino al ser humano relacionándose los unos con los otros. Esto es precisamente lo que estudia la antropología, y es el motivo por el que un ingeniero informático pasa sus noches estudiando a Levi-Strauss, Marvin Harris, Bourdieu, etc. en lugar de estar viendo Juego de Tronos como el resto de mortales. Bueno... al lío.

Ayer encontré uno de los artículos que unen dos mundos con los que estoy familiarizado: el análisis de Big Data y la antropología social. El artículo se titula Rising Tides or Rising Stars?: Dynamics of Shared Attention on Twitter during Media Events y el objetivo era estudiar si el comportamiento de los usuarios de Twitter cambiaba cuando estaban viendo todos ellos un evento televisivo y comentándolo a la vez.

Cosas destacables a nivel informático:

  • Para la extracción de datos de los usuarios seleccionados para ser estudiados utilizaron scripts en Python y el REST API de Twitter. 
  • Este método de extracción limita el número de mensajes por usuario a los últimos 3.200, lo cual limita el tiempo al cual pueden estudiar el comportamiento anterior de los sujetos. 
  • Tras la extracción completa de los tweets se hicieron con un corpus de más de 210 millones de tweets procedentes de más de 193.000 usuarios. 
  • Para conseguir rescatar toda esa información utilizaron peticiones paralelas a Twitter, con el fin de no perder ningún dato. 
  •  Sobre la análítica qué utilizan me gusta la forma en la que utilizan la curva de Lorenz para estudiar las diferencias de concentraciones de tweets entre principiantes y élites (luego iré a explicar esto).
No voy a entrar en muchos detalles, pero poder analizar las interacciones que suponen 210 millones de tweets supone un reto cuando menos interesante a nivel computacional. 

Por otra parte, a nivel antropológico, utilizan algunos conceptos interesantes: 
  • Atención compartida: El estudio se centra en eventos televisivos porque está interesado en ver como esa "atención compartida" modifica la práctica de los usuarios y la forma de relacionarse entre ellos.  
  • "Rising tides" (marea creciente): Es un efecto que se produce cuando todos los usuarios modifican su comportamiento a la vez. 
  • "Rising stars" (estrellas crecientes): Efecto que se produce cuando una élite de usuarios consigue atraer la atención hacia ellos por parte de la masa de usuarios. 
Las preguntas que se hacen los autores del estudio son las siguientes: En situaciones de atención compartida, ¿hay un cambio en la forma de relación entre usuarios? Si la hay, ¿Es por un cambio en la mayoría o por un cambio en unos pocos? ¿Qué efectos tienen estos cambios?

La respuesta a la primera pregunta es que sí que hay un cambio de práctica. Para ello compararon el comportamiento de los usuarios los días de antes y después del evento televisivo y con otros acontecimientos como noticias. Para detectar cambios en comportamiento examinaron los retweets y las contestaciones como formas de interacción, categorizando las contestaciones como una forma de relación entre pares y el retweet como una forma de interacción de menor a mayor. 

La respuesta a pregunta de si era por un cambio en el comportamiento de unos pocos o de la mayoría, depende de qué miremos. Si observamos la producción de tweets, el efecto es una marea, es decir, hay más gente que publica más tweets, pero si observamos hacia quien se dirige la atención (a quien se retweetea y a quien se le responde) los datos apuntan a que es hacia un segmento más minoritario que en otras circunstancias, lo que sería un efecto de tipo estrella creciente. 

¿Que efecto tiene esto? Los autores argumentan que, pese a la naturaleza plural e igualitaria de Twitter, el comportamiento de los usuarios es altamente estratégico en estos periodos de atención compartida. Por un lado, los usuarios considerados 'élite' (con gran número de seguidores e influencia) no retweetean y tienden a relacionarse sólo con otros de su mismo status, sin embargo, los principiantes tienden a retweetear más a las élites como forma de lograr aceptación y tratan de responderles, siendo ignorados durante este periodo por las élites. Parece que el sector más experimentado de usuarios que está entre principiantes y élite no entra en el juego de retweetear a las élites tanto como los principiantes ni tratar de contestarles, lo que implica también cierto conocimiento implícito de la situación. 

Como crítica al estudio, y es algo que los propios autores proponen al final como otras futuras vías de estudio, es escoger otro tipo de eventos, ya que se han centrado en debates políticos de las elecciones presidenciales de EEUU de 2012. ¿Se comportan igual los que ven un debate político que la Super Bowl? ¿Se comporta igual alguien que ve un debate político que cuando la misma persona ve el último capítulo de Breaking Bad?

Aún así, muy bueno el artículo y me ha gustado mucho la aproximación de unir el tratamiento de Big Data con la antropología social. Esta creo que es la única forma de entender el internet social, y no leyendo el último libro del gurú de turno que compras en la librería de un aeropuerto.

ResearchBlogging.orgLin, Y., Keegan, B., Margolin, D., & Lazer, D. (2014). Rising Tides or Rising Stars?: Dynamics of Shared Attention on Twitter during Media Events PLoS ONE, 9 (5) DOI: 10.1371/journal.pone.0094093