Wikipedia es a menudo citado como una de las grandes maravillas de la actualidad. Un enorme enciclopedia que cualquiera puede contribuir. Millones de artículos escritos por personas que contribuyeron con su experiencia, sin compensación y con el único propósito para reunir todo el conocimiento del mundo en un solo lugar.

La realidad es, al menos en parte otra. De hecho, lejos de todos los artículos de Wikipedia son escritos por personas. En cambio, los robots, los fragmentos de código que recoge de forma automática y organiza los datos en forma legible, que ha sido durante mucho tiempo el responsable de una gran parte de los contenidos de la enciclopedia.

Uno de los más prominentes proviene de Suecia y es creado por Sverker Johansson . Él es un científico y un lingüista y trabajar todos los días en la Universidad de Dalarna. En los círculos de la Wikipedia se le conoce como el hombre detrás Lsjbot , un escritor robot desde el otoño de 2012 estado trabajando para actualizar la Wikipedia con artículos sobre las diferentes especies de plantas y animales.

Relacionado: Wikipedia endurece las normas para las marcas

Lsjbot recupera información de fuentes científicas y los utilizan para crear artículos de Wikipedia a un ritmo vertiginoso. Desde su creación, ha escrito más de 2,7 millones de artículos en tres idiomas: sueco e idiomas filipinos cebuano y waray-waray ("Mi esposa es de las Filipinas", dice Sverker Johansson).

Poco menos de un millón de los más de 1,7 millones de artículos disponibles en Wikipedia sueco está así creada por Lsjbot.


Sverker Johansson es el hombre detrás de Lsjbot, el robot que escribió la mitad de los artículos en Wikipedia sueco. Foto: Tommy Kronqvist, CC 3.0

- Se escribe principalmente sobre la biología y los seres vivos. Esto es a la vez, porque creo que es temas interesantes y que es un área que funciona bien para una cura, dice Sverker Johansson para Internet World.

Se interesó en botprogrammering en el otoño de 2011. Un año más tarde, en el otoño de 2012, fue Lsjbot completado y puesto en obra.

- La base es bastante simple, pero entonces es todas las complicaciones y casos especiales y excepciones que toma tiempo. Está bien para un total de unos meses de trabajo de programación, dice Sverker Johansson.

Los productos creados por Lsjbot todos se basan en el mismo texto, tribal, con palabras clave y algunos datos adaptadas precisamente lo que se describen en este artículo.

Relacionados: Nueve de cada diez en la Wikipedia son masculinos

- Se puede variar el agitan texto, añadir o eliminar una frase en función de lo que se encuentra en la base de datos. Pero básicamente construir todo en fragmentos terminados.

- Recupera la información de varias bases de datos diferentes biológicos.Una Internacional llama Catálogo de la Vida, la lista de la UICN de especies en peligro de extinción y el Centro de Información de Especies de Suecia.Entonces tengo algunas otras cosas, pero son las fuentes más grandes, dice Sverker Johansson.


Lsjbot utilizar diferentes bases de datos científicas como fuentes, y crear texto legible de los datos básicos. Todos los artículos siguen una plantilla similar.

En algunos círculos, muchos se muestran escépticos a los artículos robot escrita. Esta se convierte en demasiado seco, demasiado aburrido y nunca puede ponerse al día el lado más "humano" de un texto, se lee en la crítica.Un robot puede, por ejemplo, nunca describir en detalle cómo se ve un animal o utilizar el razonamiento complejo sobre un tema en particular.

Sverker Johansson de acuerdo en que los escritores robot sólo son adecuados para ciertos tipos de sustancias. Lsjbot sólo crea artículos columna vertebral. Luego le toca a escritores humanos para reponer y mejorar.

- Un robot debe tener muchos artículos similares para trabajar, por lo que puede comenzar a partir de un texto estandarizado y luego rellenar, dice.

Hasta ahora Lsjbot entre otras cosas, creó prendas de aproximadamente 8000 especies de aves y más de 55 000 especies de todo el mundo de los hongos. El objetivo es crear artículos para todas las conocidas especies vegetales y animales del mundo, que Sverker Johansson cree que se completará en algún momento de 2014.

¿Qué remedio tienen la tarea de hacer a continuación, está por verse.

- Estoy pensando en algunas cosas diferentes. Una posibilidad es hacer lo mismo en varios idiomas. Es bastante sencillo. Luego están completamente otras áreas también.

- Por ejemplo, sería leer desde el catálogo de la Biblioteca Real y desde allí crear artículos en prácticamente todos los escritores suecos. Yo tendría que escribir un nuevo programa a la misma, pero con los mismos principios, dice Sverker Johansson.

Daniel Goldberg es editor en Internet World. En Twitter, es @ danielg0ldberg.

No te pierdas el nuevo Internetworldpodden - todos los grandes nätsnackisar de la semana. Escuche el episodio de esta semana aquí: