Wikipedia:Wikipedia en CD/Taller

De Wikipedia, la enciclopedia libre
CONTENIDO ESTÁTICO

Wikipedia en CD
Taller de Wikipedia en CD
Lector Offline
Kiwix Tools

Cómo puedo colaborar[editar]

  • Si tienes conocimientos de programación, puedes colaborar en el script.
  • Si eres un buen editor, puedes hacer la selección de artículos.
  • Si se te da bien el diseño, puedes hacer algunas composiciones de imágenes para los índices de artículos como esta. Asegúrate de usar imágenes relacionadas con los artículos de la categoría, y siempre libres. Súbelo a Commons.

Proceso de selección de WP 1.0 en español[editar]

El proceso de selección constituye la unión de tres conjuntos principales. A continuación, se listan los conjuntos que contendrá la selección.

  1. Selección de los primeros 30 mil artículos en orden de importancia interna y externa.
    Tomando como orden de importancia, los enlaces internos o interwikis, el número de enlaces de otros artículos a ese artículo en particular y las veces que ha sido visitado el artículo.
  2. Versión en español de la lista de artículos incluida en WP 1.0 en inglés. En caso de que exista el artículo correspondiente en español.
  3. Artículos destacados + Artículos buenos.

Adicionalmente, WikiTrust extraería la mejor versión ID, es decir, la mejor versión ID en el historial para cada artículo. Esto se realiza, mediante un algoritmo complejo, que evalúa la reputación de las personas que han editado el artículo evaluando las últimas ediciones.

Universo[editar]

Existe un fichero de recopilación de artículos que contempla el Universo de todos los artículos de Wikipedia hasta la fecha. El fichero está ubicado en la siguiente dirección [1]. En el directorio, se puede encontrar el archivo en formato de texto plano con el nombre de eswiki.counts.AAAAMMDD.txt donde AAAAMMDD se refiere a la fecha en la que fue editado/modificado por última vez (año, mes y día). También existe una versión comprimida en zip cuyo nombre es eswiki.counts.AAAAMMDD.zip.

Cada línea de esa lista contempla:

<artículo> <langlinks> <pagelinks> <hitcounts>

Conjunto 1[editar]

En base a ese la lista anterior, se ha construido una lista preliminar que corresponde al grupo 1:

Selección de los primeros 30 mil artículos en orden de importancia interna y externa (<LANGLINKS>, <PAGELINKS> y <HITCOUNT>).
Select name,id_article from articles order by <LANGLINKS>,<PAGELINKS>, <HITCOUNT> LIMIT 30.000

El fichero está ubicado en la siguiente dirección [2]. Se puede descargar el archivo en formato de texto plano con el nombre de eswiki.counts.ordenado-iw-pagelinks-hits.20110504-top30k.txt donde 20110504 se refiere a la fecha en la que fue editado/modificado por última vez (año 2011, mes 05 y día 04); iw-pagelinks-hits se refiere al orden que se ha tomado para construir la lista, interwikis, enlaces de página y veces que ha sido visitada respectivamente.

Conjunto 2[editar]

Versión en español correspondiente para cada artículo de la lista de artículos incluida en WP 1.0 en inglés. En caso de que exista el artículo correspondiente en español. Esta selección ha sido creada gracias a la ayuda del usuario Hoo man.

Conjunto 3[editar]

El contenido del conjunto , involucra los artículos contenidos en los siguientes enlaces:

  1. Artículos destacados y buenos: Es la unión de Artículos destacados + Artículos buenos.
  2. Artículos que toda Wikipedia debería tener: Lista para facilitar y asegurar que el mayor número de Wikipedias tuviesen cubiertos unos campos mínimos de información.
  3. Usuario:Chabacano/Vitales: Es una selección realizada por el usuario Ignacio Icke.
Nota: Puede existir repetición de artículos en A y C. Esto debe ser revisado al final de todo el proceso de selección.

Notas[editar]

  • Respecto a la cantidad de artículos: Se ha tomado la cifra 30 mil en base a la cantidad de artículos que posiblemente pueden caber en un CD (Solo texto) y DVD (En caso de incluir imágenes en miniatura). El tamaño promedio de cada artículo en Wikipedia en español puede ser tomado aquí [3], los últimos registros datan del año 2009. El texto de los de 30.000 artículos más largos (534790 a 17188 bytes) suma en total 1016892130 bytes, por lo que es en promedio 33 896 bytes solo para el texto (sin comprimir). Es importante recordar que el archivo final de recopilación contempla un formato OpenZIM, que no es más que un formato de compresión LZMA2 similar al usado por 7-zip.
  • Sobre las versiones de las listas:Por cuestiones de tamaño no se ha creado una lista (Conjuntos involucrados en la selección) de artículos en la que todos pueden editar y contribuir en una subpágina del proyecto. Sin embargo, cualquier usuario tiene acceso a las listas con las que se está trabajando. En caso de querer modificar las listas es necesario participar los cambios a todos los integrantes del proyecto, de esa forma, poder estar todos informados de las modificaciones realizadas.
  • Sobre el formato a entregar a WikiTrust: Mediante conversaciones vía correo electrónico, WikiTrust ha pedido un formato específico. El formato de lista a entregar debe contener por línea:
<Nombre_del_artículo> <Page_id>
Esto es debido a que un artículo puede cambiar de nombre desde el momento en el que se empieza a realizar la lista, sin tomar en cuenta las redirecciones a un artículo.

Glosario[editar]

langlinks (iw): Es un enlace corriente del tipo [[enlace]] que, por medio de un prefijo, permite enlazar páginas en otros idiomas, de otros proyectos, e incluso de otros sitios web. Por ejemplo, el enlace [[Portada]] conduciría a la portada de la wikiversidad. Sin embargo [[w:Portada]] conduciría a la portada de Wikipedia y [[en:Main Page]] enlazaría a la portada de la wikiversidad en inglés.
hitcounts (hits): Número de visitantes que un determinado artículo ha recibido.
pagelinks: Cantidad de enlaces en un artículo.
Page_id: Identificador único para cada artículo. Un artículo puede cambiar de nombre pero su Page_id será el mismo a través del tiempo.