Wikipedia:Wikipedia en CD/Archivo/1

De Wikipedia, la enciclopedia libre

Esta página tiene como fin discutir la necesidad, posibilidad e implementación de crear Wikipedia en CD o DVD, enfocado en Wikipedia en español, aunque no limitada a ella (los aspectos técnicos tienen carácter universal). La discusión original (o su transcripción) se encuentra en Wikipedia:Encuentros/Encuentro de Wikipedistas en Rosario 2005#Wikipedia en CD/DVD.

Interesados[editar]

Participantes de la charla original[editar]


Voluntarios para el proyecto[editar]

Esta lista incluye a los wikipedistas que pueden prestar alguna colaboración en el desarrollo del proyecto y, en lo posible, el área en que podría colaborar.

  • Cinabrium. Ingeniería, algo de programación (dependiendo de la plataforma). Ideas sueltas.
  • Pilaf . Igual que arriba.
  • --Javier Carro Corrigiendo y dando formato a textos, y en lo que haga falta un poco de ayuda.
  • Platnides⋖discutirDiscusión 16:19 5 mar 2006 (CET)
  • seretbit de wikipedia.cl: Gestiones para crear Wikipedia en DVD para su distribucion en Chile, Apoyo tecnologico a sistemas de revision.
  • Gxl conocimientos de algo de ingeniería y programación. Ya he realizado un primer intento de volcar wiki y lo que hay es problemas solucionables

pero me le apunto.

  • Eloy SL: Ya había estado averiguando. Por lo pronto me parece que habría que revisar los artículos, aunque sea muy por encima.
  • Julinux
  • netomx : Probar CD o DVD.
  • deleatur 21:04 18 oct 2006 (CEST)
  • Almorca 22:02 28 nov 2006 (CET) Sé programar en C y diseño web ( xhtml y css). Además puedo ser betatester en SuSE Linux.
  • Baronti Puedo aportar el diseño gráfico de carátulas.
  • [LAGA Systems] se puede utilizar los programas de portable app apache y mysql para no tener que instalar y que funcione desde cd o en disco duro.
  • --Mahadeva (Mensajes) 03:27 9 dic 2006 (CET)
  • --Diego Grez (Mensajes) 12:07 9 dic 2006 (CET)
  • dSoto Sé programar en PHP, ASP, xHTML,CSS. He trabajado con servidores en Apache y MySQL. Puedo dar ideas. Puedo testear el cd en cualquier version de Windows (3.11 a Vista), en Linux (Ubuntu,Mandriva).
  • aruxek Me gustaria colaborar, He trabajado con python, php y me estoy metiendo con xul y xulrunner.
  • Usuario:ajo primeros passos intalnado wiki en intranet sin acceso a internet, problemas: despues del vocaldo de la bd, las busquedas solo se hacen por nombre exacto de articulo, enlaces externos aotros idiomas y a imagenes de commons.trabajando sobre ello.
  • AchedDamiman Todo lo que tenga que ver con programación y Wikipedia me interesa.
  • Alvaro qc Me gustaría ser un tester
  • Komputisto...Experto en informática 03:19 2 sep 2007 (CEST) Para lo que sea. Incluso distribucion si me mandais cedes.
  • Hernan Yapurasi Quelcahuanca He estado haciendo unos esbosos de lo que se nececitaria.
  • Carlos Longarela He realizado pruebas con la traducción de la interfaz de la wikipedia en CD al español, programación en php y diversos lenguajes (conocimientos MySQL, etc..).
  • Crescent Moon Programación en Visual Basic y conocimientos en SQLServer, puedo ayudar con algoritmos, controles activex y problemas sueltos, mi principal problema es la falta de tiempo libre.
  • Angel de Jesús Alvarado He creado un buscador en base a otro (Google Desktop), funciona perfecto, la desventaja es que se requiere instalar Google Desktop.
  • David Barquero C Tengo conocimientos de programacion en php, mysql, VB6, Bases de datos Access y conocimiento general de desarrollo de software. Puedo aportar algun tiempo de desarrollo y dar asesoria para otras ideas. De momento estoy haciendo una investigacion en especial de software libre a ver si existen motores de busqueda eficientes para archivos HTML
  • Lordblacksuca Programador Basic, HTML, CSS, aldo de PHP, diseño Gráfico, Webmaster.
  • Angel: Diseño de páginas. Distribución en Guatemala.
  • YahirAlejandroSaavedraGallardo: Me gustaría encargarme del programa de instalación, selección de artículos y distribución de Wikipedia en español y multilingüe por Internet. 13 ene 2014 17:09 (UTC-07)

Sobre la necesidad[editar]

Es necesario crear una versión en CD, con la base de datos completa, aunque esta contenga errores o la calidad de los artículos sea dispar. La necesidad nace de:

  • la falta de conectividad en escuelas de Latinoamérica.
  • crear una alternativa a otras enciclopedias comerciales o no libres distribuidas en CD.
    • Esto se suma a la necesidad de la comunidad del software libre de hacer frente a los planes de "PCs económicas" impulsados por Microsoft en algunos países, los cuales suelen incluir Encarta u otro software educativo propietario (nuestro CD se podría incluir en los portátiles de 100 dólares que se distribuyan en países de habla hispana).

Consideraciones sobre el contenido[editar]

Acordamos (informalmente) sobre la necesidad de establecer:

  • Una "lista de contenidos mínimos", para verificar qué artículos nos faltan, Por ejemplo, si la versión "estática" fuera para la Argentina, no debería faltar ningún artículo sobre los gobernantes (gobernadores del Río de la Plata, Virreyes, ..., presidentes)
  • Material instructivo acerca de cómo usar WP y "sacarle el jugo". Werner Westermann, de Educalibre (Chile) tiene un plan al respecto.

Es necesario indexar todos los artículos. Pero cómo hacerlo. La mejor manera me parece que es crear un robot que se "pasee" por los enlaces internos y pueda darnos las rutas de todos los artículos con su respectivo nombre, a partir de ello podríamos saber qué es lo que realmente falta. — El comentario anterior es obra de Hyapurasi (disc. · contr. · bloq.), quien olvidó firmarlo.

Sacar la lista de todas las páginas es sencillo. También ver a dónde apuntan los enlaces en rojo Especial:Wantedpages. ☆ Platonidesℂoпtẵcтaℛ 12:18 22 sep 2007 (CEST)

Consideraciones técnicas[editar]

Contenido XML con interfaz en PHP[editar]

La idea es que, por ejemplo, en una sala de cómputo de una escuela se pueda acceder a la enciclopedia a traves de una intranet.

Podria funcionar inclusive solo desde el CD mismo para computadoras personales, la que no cuentan con conexion a la una red local.

El tener "toda" la información en un archivo XML facilitaria que otros voluntarios lo utilicen para crear nuevas versiones del CD de Wikipedia.

Contenido HTML estático con buscador en JavaScript[editar]

Concursos en Santa Fe para emprendedores: idea para crear un CD. Opción liderada por Nicolás César y Juan José Conti y que puede ser la más viable:

  • 1 CD
  • Tipo WikiOnCD o wiki2static
  • Posibles problemas técnicos:
    • las imágenes de Commons (Solo las miniaturas necesarias para cada artículo).
    • el buscador: ¿JavaScript?

Ventajas:

  • Totalmente multiplataforma.

Desventajas:

Comentarios:

  • Hay dos alternativas para el buscador:
    1. Crear un único documento índice con todos los artículos del CD ordenados alfabéticamente y un campo de búsqueda (JavaScript) que sirva de filtro (búsqueda). Esto puede traer serios problemas de performance, considerando que la cantidad de artículos supere los 70.000 (los motores JavaScript no se caracterizan por su velocidad), sobre todo en máquinas viejas y si se pretenden usar expresiones regulares para mayor poder de búsqueda. Esto está sujeto a pruebas de todas formas.
    2. AJAX es una técnica en el desarrollo de aplicaciones web la cual permite obtener mediante JavaScript el contenido de una página desde otra y procesarlo a gusto. Esto se usa generalmente para hacer hablar a una página (normalmente estática) con un servidor HTTP, permitiéndole un grado de dinamismo mucho mayor (un ejemplo popular de esto es Gmail). Sin embargo, la tecnología AJAX puede utilizarse también con archivos locales (siempre y cuando la página que contiene el JavaScript sea también un archivo local, por cuestiones obvias de seguridad). Esto nos permtiría desde el script de búsqueda "consultar" archivos índice particionados por criterios de ordenación (orden alfabético), lo cual permitiría una búsqueda mucho más veloz y [posiblemente] mucho más dinámica (realizando un procesamiento previo sobre los documentos que genere índices apropiados).
  • Estoy interesado en realizar los experimentos necesarios para determinar la conveniencia de uno u otro método. Disculpen la tecnicidad. Pilaf 19:50 21 nov 2005 (CET)
  • Disculpa pero me parece que esto es muy inseguro, muy codigo abierto, en exceso, me "parece" que deberia ser algo mas cerrado, osea opensource, pero en otro Cd el codigo fuente, ya que cualquier lammer modifica HTML, o me equivoco?
    • Ssthormess, lo modifica... el que sabe. Como en todo. Si es un CD no van a poder cambiar su contenido. Tendrían que descargarlo, modificarlo, crear otro CD... Y en definitiva eso mismo podrían hacer cogiendo el código fuente, cambiándolo y recompilarlo. No creo que sea preocupante, tranquilo. ▩ Platnides⋖discutirDiscusión 15:53 23 sep 2006 (CEST)
      • Para evitar eso simplemente se distribuye mediante una imagen .iso con un md5 único de manera oficial

Contenido HTML estático con interfaz en XUL (Mozilla)[editar]

Ventajas:

  • Multiplataforma (con respecto al SO).
  • Más dinámico/rápido (??).

Desventajas:

  • Dependencia de Mozilla.

Comentarios:

Contenido HTML estático en funcion a un buscador externo[editar]

  • Creando una pagina modificada de Google Desktop, para el contenido de wikipedia en cd; eh "creado" reprogramando el original Angel de Jesús Alvaradoun buscador que se enfoca a puro contenido del wikipedia cd.

Ventajas

  • No requiere conocimientos tecnicos
  • Instalación en un "copia y pega".
  • Se puede empaquetar en un msi o crear un script de instalacion.
  • Respaldo de un buscador categoria "Google".
  • No requiere de modificación del original HTML de Wikipedia.

Desventajas

  • Requiere instalar software no libre, Google Desktop.

Comentarios

  • Yo mismo Angel de Jesús Alvarado ya eh empaqueta el contenido de la wikipedia junto con Google Desktop en un DVD, con un instalador para entorno Windows (sujeto a pruebas).

Información Adicional

  • Tuve que sustituir Google Desktop por Copernic Desktop Search, esto le da más potencia de busqueda. Empaquete a Wikipedia en dos CD's y los ofreci como Software Libre en mi Centro Educativo, las ventas son buenas, esto habla de la calidad. Si desean información por favor contactenme, esto ayudaría a difundir más wikipedia en lugar de su competencia.

CD booteable[editar]

Crear un CD booteable (LAMP o equivalentes)

Ventajas:

  • Libera del problema de la plataforma.

Desventajas:

  • Molesto, requiere reiniciar y esperar booteo.
  • Dependiente de la detección de hardware (no es infalible).
  • Imposibilidad de interactuar directamente con software instalado en el PC.
  • ¿Problemas con MySQL sobre un LiveCD?

Comentarios:

  • Habria una serie de problemas con el Mysql, pero es una buena opcion
  • Existe la Alternativa de sqlite y el componente xpcom para sarlo con xulrunner

Instalador[editar]

Crear un instalador que pueda actualizarse cada cierto tiempo a través de diffs.

Ventajas:

  • Mayor facilidad de uso
  • Multiples medios de actualizacion de las definiciones de la enciclopedia (CD, DISKETTES, ARCHIVOS, INTERNET, ETC.)

Desventajas:

  • Problemas con manejamiento de datos, más complejo.

Comentarios:

  • ¿Multiplataforma? Pilaf 19:35 21 nov 2005 (CET)
  • Si, totalmente, un installer para LINUX, otro para Mac OS X, otro para Solaris, otro para MSDOS (No creo, en fin), otro para Windows, etc. La actualizacion se haria mediante archivos de actualizacion mediante internet o CD como si fuere un Live Update
  • Existe el componente pyxpcom el cual agrega el soporte python a nuestro motor xulrunner mediante python se puede resolver el manejo de datos mas complejos.
  • ¿Puedo ayudar? YahirAlejandroSaavedraGallardo 13 ene 2014 17:20 (UTC-07)

Contenido guardado en una base de datos embebida (SQLite, Firebird, etc.) en un programa multiplataforma (Java)[editar]

La idea es pasar todos los artículos de Wikipedia a una base de datos a la que se llamará dentro de un programa. El programa sólo tendría que buscar en la base de datos y mostrar la página solicitada.

  • 1 CD ó 1 DVD
  • Posibles problemas técnicos:
    • las imágenes de Commons (¿reducidas?).
    • Se necesitan programadores con conocimientos de Java y de bases de datos.


Ventajas:

  • Totalmente multiplataforma.
  • Las búsquedas se pueden hacer fácil y rápidamente.

Desventajas:

  • El programa habría que hacerlo desde cero y para ello se necesitaría un grupo de programadores con conocimientos de Sqlite.

Comentarios:

Tiene buena pinta. Pero el mayor problema no es el programa que trabaje con los datos, sino la conversión de wikitexto a visualización en pantalla. Dado que está pensado para un ordenador personal, la eficiencia no tiene tanta importancia. ▩ Platnides⋖discutirDiscusión 12:17 29 nov 2006 (CET)
Ya existen parsers que se encargan de pasar de formato Wiki a html.
Ninguno de ellos es perfecto. O dicho de otro modo, la mayoría son proyectos empezados en un momento pero no terminados / obsoletos / no coinciden con todas las característics de MediaWiki. ▩ Platnides⋖discutirDiscusión 19:04 3 dic 2006 (CET)

Consideraciones de costo[editar]

  • Costos bajos, creo que lo máximo que se podría invertir es en un servidor web. Mas nada, que hasta yo lo podría proporcionar ahora mismo!


Un ejemplo de wiki en cd[editar]

encontre este enlace una wikipedia en cd , los articulos estan en ingles pero ya es un avance.

--ajo 00:06 17 feb 2007 (CET)

  • He estado trabajando un poco con la versión Kiwix, es fácil traducir la interface de kiwix al español modificando archivos de la interface (sin tocar el código y recompilando). Para ser totalmente funcional me haría falta saber como craer los índices para las búsquedas. ¿Alguien tiene mayor conocimiento sobre el proyecto Kiwix?. Fotodng 12:18 13 feb 2008 (UTC)[responder]
Screenshot 0.9 alpha1 (screencast)
Yo tengo información, estoy trabajando en ello, creo que es super sencillo utilizarlo, el problema es que necesitamos seleccionar los artículos que deseamos introducir en el CD, ya que kiwix almacena los indices en la memoria RAM y no serviría introducir toda la Wikipedia en español entera. He hablado con los desarrolladores y me comentan que para finales de año habrá una versión que podría almacenar partes del index en el disco duro, esto facilitaría agregar mayor número de artículos. Por ahora pienso que es la mejor opción, necesitamos abrir una sección para seleccionar los artículos que vamos a incluir en la Wikipedia en CD, también necesitamos un sitio donde subir el CD para que sea descargado. --Wilfredo Rodríguez 13:26 26 mar 2008 (UTC)[responder]
Ya esto fue superado, pueden incluirse todos los artículos y no solamente wikipedia sino también cualquier proyecto de la fundación :). Ya está disponible para su descarga :), abajo coloqué el enlace. Está disponible para Linux, MacOS y Windows --Wilfredo Rodríguez 17:39 13 dic 2008 (UTC)[responder]

Selección del contenido[editar]

La lista de contenido debería definirse como modulable, la idea es que pueda decidirse exactamente y de forma particular que contenido formaría parte del CD a base de módulos predefinidos. La modularaidad permitiría que en casos de tener que determinar la cabida en un determinado espacio (por ejemplo miniCD para un pocket-PC o similar) siga manteniendo cierta calidad y que incluye el contenido que uno estime de interés. Sería una pena que si uno sólo pueda albergar 400Mb. y uno está interesado por ejemplo en matemáticas, no se hayan podido cargar artíclos de esa temática y en cambio haya espacio ocupado por artículos que en cambio no responden a su interés).

A continuación se detalla un poco acerca de los módulos.

Contenido global[editar]

Sería un volcado completo de wikipedia. Posiblemente ocupe varios CD (sobretodo por las imágenes) sería la solución ideal cuando no haya problemas de espacio para el medio.

Contenido modular[editar]

  • Módulo base: llamado más arriba contenido mínimo, calificaría al CD con cierta calidad. Este contenido debería entenderse como contenido base e imprescincible. Deberían crearse una categóría CD que sería la forma de indicar que el artículo forma parte del módulo base, y otra categoría candidato a CD queriendo especificar que el artículo es preciso que se incluya en el CD pero que debido a su estado actual, no cumple los requisitos de calidad... (esbozo, errores, vandalizado, falta de neutralidad en exceso).
  • Módulos temáticos: determinadas áreas (quizas basada en los wikiproyectos o wikiportales) serían colecciones de artículos específicos comunes a un tema
  • Módulos regionales: aparte de los temáticos, siempre habrá artículos con contenidos regonales con mayor profundidad de detalles que lo harían óptimo por ejemplo para escuelas. Lo dotarían de utilidad para una zona concreta, interesada en su propia cultura, geografía, historia, etc...

Todos los módulos, pero especialmente el módulo base deberían tener un consenso. Todos los módulos que no son el base serían como paquete opcional que permitiría a casa usuario descargarse y grabar su CD, al seleccionar los paquetes debería reflejar el tamaño aproximado de cada paquete.

Esto dividiría el trabajo, con

  • operadores (usuarios) encargados de seleccionar el Módulo base
  • operadores encargados se seleccionar el módulos temáticos y regionales se asume que los usuarios de los diferentes wikiproyectos serían los más idóneos pero no exclusivos) para seleccionar el contenido de las temáticas).(se asume que los nativos de una zona son los más indicados (pero no exclusivos) para llevar a cabo la tarea en temáticas regionales). Este contenido debería entenderse como

Sería conveniente determinar las temáticas basándonos o no en las cateórías existentes... Un problema que veo acerca del contenido seria obtener cada una de las imágenes asociadas a los artículos en wikipedia, que como sabeis se alojan en otro portal de wikimedia. --Crescent Moon (discusión) 23:18 5 abr 2008 (UTC)[responder]

Enlaces de interés[editar]