CKAN

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda
C-KAN
The open source data portal software
Desarrollador
Open Knowledge Foundation
ckan.org
Información general
Última versión estable 2.1[1]
13 de agosto de 2013; hace 2 años (2013-08-13)
Género ?
Programado en Python
Sistema operativo Multiplataforma
Licencia AGPL
En español
[editar datos en Wikidata]
CKAN

¿Qué es?[editar]

CKAN es un sistema de gestión de datos de gran alcance que hace que los datos sean accesibles - proporcionando herramientas para agilizar la publicación , el compartir, la búsqueda y el uso de datos . CKAN está dirigido a editores de datos ( los gobiernos nacionales y regionales , empresas y organizaciones) que quieran hacer sus datos abiertos y disponibles.

Se emplea para mejorar o crear portales de datos tanto oficiales como comunitarios, CKAN fue desarrollado por la organización no lucrativa “Open Knowledge Foundation”.

Es usado en más de 40 centros de datos en todo el mundo, incluyendo portales de gobiernos locales, nacionales e internacionales, como data.gov.uk del Reino Unido y publicdata.eu de la Unión Europea.

Estos portales son portales donde los usuarios pueden descargar datasets en distintos formatos. Pero además de descargarlos se pueden visualizar dependiendo del formato.

Características[editar]

Aquí se presentan las características que ofrece ckan, tanto para los administradores, usuarios y publicadores.

Publicación y manejo datos[editar]

Una interfaz web permite a los administradores de los ‘datasets’ registrar, actualizar y perfeccionar fácilmente los conjuntos de datos en un modelo de autorización distribuido llamado 'Organizaciones'. Las 'Organizaciones' permiten que cada editor tenga su propio proceso de participación y aprobación de los ‘datasets’ con numerosos miembros . Esto significa que la responsabilidad y el acceso pueden ser distribuidas.

Introducción de datos[editar]

Se pueden añadir, editar y eliminar los datos de distintas formas:

  • Usando la API JSON de CKAN, la api es potente y permite hacer todas las modificaciones posibles, desde subir un nuevo dataset a ingresar nuevo usuario, borrar grupos etc.
  • Desde hojas de cálculo, al introducir por hojas de cálculo CKAN parseará los datos y ofrecerá una pre visualización de estos.
  • Desde la interfaz web, la interfaz web es muy sencilla de utilizar permite introducir datos, usuarios, grupos de forma rápida e intuitiva.

Publisher tools[editar]

  • Panel de Control: manejar miembros y datasets, aprobar datasets para que sean públicos, manejar las fuentes de ‘harvest’.
  • Forms: Crear un portal especifico con forma y campos especifico que encaje con los requisitos individuales.

Harvesting[editar]

Muchas organizaciones tienen ya sus datos en repositorios con procesos y procedimientos ya determinados para manejar y publicar datos. Dado este caso estos datos pueden ser traídos (pull) en los repositorios de CKAN. Para facilitar este proceso CKAN ha desarrollado un proceso llamado Harvest (cosecha) con mecanismos que pueden importar registros desde otros diferentes repositorios, incluyendo:

  • Servidores geoespaciales CSW
  • Catálogos web existentes
  • Simple HTML index pages or Web Accessible Folders
  • ArcGIS, Servidores Geo-portal y bases de datos Z39.50


Esta funcionalidad es usada en el portal de datos de USA (http://data.gov) para conseguir datos de cientos de agencias. También se utiliza en el portal europeo (http://publicdata.eu) para importar datos de otros catálogos de CKAN.


Búsqueda de datos[editar]

CKAN ofrece la búsqueda de datasets al estilo de google, basada en búsqueda por palabras clave o tags. Los usuarios pueden ver enseguida todas todos los conjuntos de datos disponibles, en qué formatos están y cuál es su licencia. Se pueden buscar todos los atributos de los datasets, toda su metadata, desde el título hasta el nombre del publicador. También se puede buscar los datos por la api .


Metadata[editar]

CKAN ofrece un conjunto de metadatos para cada uno de los conjuntos de datos.

  • Título
  • Identificador único – URL única que es editable.
  • Grupos –facilita publicar, compartir y enlazar datos con usuarios en el mismo campo.
  • Descripción –información adicional.
  • Pre visualización de los datos –pre visualización de los datos, tablas, mapas etc.
  • Histórico– CKAN permite ver la historia de todos los cambios
  • Licencia – info sobre si el dataset es de licencia abierta o no.
  • Tags – Facilita la búsqueda de datasets similares.
  • Múltiples formatos– visualización rápida de los formatos en los que está disponible el dataset.
  • API key – permite el acceso a todos los campos del metadata vía la API
  • Campos Extra– para meter cualquier otro tipo de información, por ejemplo: localización


Geoespacial[editar]

CKAN dispone de avanzadas funciones de geoespaciales, así como pre visualización de los datos, búsqueda etc.

Pre Visualización

Cuando se meten datos de localización en CKAN, éste puede pre visualizarlos en un mapa interactivo, los datos geoespaciales son coordenadas de la latitud y longitud.

Búsqueda

Los usuarios pueden buscar datasets filtrando los resultados por localización.

Descubrimiento

Para asegurar que tus datasets son integrados en los de otros CKAN incluye herramientas para importar metadata geo-codificada en diferentes formatos y hacerlos consultables (que se puedan buscar) de acuerdo al estándar INSPIRE.

Visualización[editar]

CKAN ofrece varias formas de visualizar los datos dependiendo de su formato:


  • Table view: Si los datos se suben en formato .csv o tabla Excel, CKAN puede procesar los datos y dar una vista de tabla interactiva. El usuario puede ordenar los datos, filtrarlos etc.
  • Graphing data: También puedes mostrar datos en forma de gráficos.
  • Mapping data: Si una tabla tiene datos que CKAN pueda reconocer como latitud y longitud, puede parsear esos datos e insertarlos en un mapa interactivo. Al hacer clic sobre un dato en el mapa se mostraran todos los campos del dato.
  • Imagen data: La pre visualización de los datos no se restringen a datos tabulados, CKAN puede mostrar imágenes en los formatos más comunes. Si es un recurso web también se mostrará.
  • Tus propias vistas: Puedes construir tus propias vistas utilizando la API de CKAN.

Beneficios[editar]

CKAN tiene muchas ventajas si la comparamos con otras herramientas de publicación de datos. CKAN es de código abierto por lo que es gratis y muy flexible (está escrito en python). Te permite editar el código para adaptarlo a tus necesidades. Ofrece muchas posibilidades para los gobiernos e instituciones que quieran ofrecer sus datos de forma abierta. Utilizando el Harvest puedes compartir datos con otros portales de datos que utilicen CKAN.

CKAN es completamente gratis, totalmente editable. Pero, además, la empresa ofrece apoyo y asesoramiento, que se puede contratar. Para ello dispone de tarifas personalizadas.


Integración[editar]

CKAN puede integrarse en los CMS más usados. CKAN ofrece la integración en distintos CMS de manera sencilla. Por ejemplo se puede integrar con Drupal y Wordpress. Utilizando la API este paso se puede hacer de manera bastante directa.


Aunque hay muchas formas de integrar una CMS (como Drupal) y CKAN, es recomendable hacer una integración en la cual CKAN y la CMS “vivan” side by side y que las dos sean partes diferentes de la página.

Esto es mucho más recomendable que un enfoque vertical en la que una aplicación esta oculta/contenida detrás/dentro de la otra. Esto da una gran cantidad de trabajo para reproducir las características de uno u otro sistema.


Un ejemplo de cómo se haría esto es instalar CKAN en el servidor, luego en el portal ya creado añadir una nueva página o pestaña que redirija a la dirección de CKAN. Para hacer esto lo mejor sería cambiar el tema de CKAN para que sea igual que la del portal, lo cual es mucho más sencillo que reprogramar toda la funcionalidad. Un ejemplo útil es la página europea: http://www.publicdata.eu

¿Qué no es CKAN?[editar]

  • CKAN no es un servidor de datos, como puede ser Virtuoso.
  • CKAN no es una base de datos.
  • CKAN no es un CMS completo, es decir, no ofrece TODAS las características de un CMS. Se puede considerar una CMS muy capada.
  • CKAN no es un host.


Instalando CKAN[editar]

Instalar los paquetes necesarios[editar]

1.Actualizar el apt:

sudo apt-get update

2.Instalar los paquetes que necesita CKAN

sudo apt-get install -y nginx apache2 libapache2-mod-wsgi libpq5

3.Descargar el paquete de CKAN

wget http://packaging.ckan.org/python-ckan_2.4_amd64.deb

4.Instalar el paquete:

sudo dpkg -i python-ckan_2.4_amd64.deb

Insalar PostgreSQL y Solr[editar]

1.Install PostgreSQL and Solr, run this command in a terminal:

sudo apt-get install -y postgresql solr-jetty


Setup Solr[editar]

1.Edita el archive de configuración de jetty (/etc/default/jetty) . Edita las siguientes variables:


NO_START=0            # (line 4)
JETTY_HOST=127.0.0.1  # (line 15)
JETTY_PORT=8983       # (line 18)

Inicia el servidor:

sudo service jetty start

Ahora deberias ver la página de inicio de Solr cuando abras http://localhost:8983/solr/ en tu navegador.(cambia localhost por la dirección de tu servidor, si es necesario).

Si en vez de la página de inicio se muestra un error “…JSP support no configured…” tendréis que hacer lo siguiente:

Descarga el archivo jsp-2.1-6.0.2.jar y muevelo a la siguiente carpeta:

sudo mv jsp-2.1-6.0.2.jar /usr/share/jetty/lib/.

Cambia el owner:

sudo chown root:root /usr/share/jetty/lib /jsp-2.1-6.0.2.jar

Reinicia el service Jetty:

sudo service jetty restart


2.Remplaza el archive por defecto schema.xml con un symlink al archive schema de CKAN .

sudo mv /etc/solr/conf/schema.xml /etc/solr/conf/schema.xml.bak

sudo ln -s /usr/lib/ckan/default/src/ckan/ckan/config/sol/schema.xml /etc/solr/conf/schema.xml

3.Ahora reinicia solr

sudo service jetty restart

4.Para terminar cambia a variable solr_url en el archivo de configuración de CKAN

solr_url=http://127.0.0.1:8983/solr

Setup PostgreSQL Database[editar]

Tendrás que crear un usuario de la base de datos si no existe. Crea uno nuevo que se llame ckan_default, introduce una contraseña cuando la pida (necesitarás esta contraseña más tarde):

sudo -u postgres createuser -S -D -R -P ckan_default

Crea una nueva base de datos, llámala ckan_default y que el propietario sea el que acabas de crear:

sudo -u postgres createdb -O ckan_default ckan_default -E utf-8

Ahora tienes que cambiar el archivo de configuración de ckan  /etc/ckan/default/production.ini o  /etc/ckan/default/development.ini. Modifica la variable sqlalchemy.url con este formato:

sqlalchemy.url = postgres://USERNAME:PASSWORD@HOST/DBNAME

Un ejemplo:

sqlalchemy.url = postgres://ckan_default:1234@localhost/ckan_default

Actualizar la configuración e iniciar la base de datos[editar]

1.Edita el archivo (/etc/ckan/default/production.ini) con las siguientes opciones:

site_id

Cada sitio CKAN debería tener su propio site_id, por ejemplo:

ckan.site_id = default

site_url

Proporciona una URL para tu sitio:

ckan.site_url = http://demo.ckan.org

2.Inicializa la base de datos de CKAN con el siguiente comando:

sudo ckan db init

3.Opcionalmente puedes configurar el DataStore y DataPusher siguiendo el tutorial aquí: http://docs.ckan.org/en/latest/maintaining/datastore.html.

4.También puedes habilitar la subida de archivos con las instrucciones que puedes encontrar aquí: http://docs.ckan.org/en/latest/maintaining/filestore.html

Referencias[editar]

Enlaces externos[editar]