Saltar la navegación

3. Formatos y conversiones.

Fuente: http://5stardata.info/Supongamos que partimos de un documento en PDF que contiene una tabla de datos. Según el sistema de calificación de 5 estrellas definido por la W3C para Open Data, el fichero PDF tendría 1 estrella ya que no puede ser tratado fácilmente por computadoras.

Podemos entonces buscar la información original con la que se creó el PDF, en un formato estructurado y fácilmente procesable por un computador, por ejemplo una hoja de datos en formato Excel. Con ello obtendríamos 2 estrellas.

A continuación, en Excel, podemos guardar el archivo en formato CSV, con la opción "guardar como" y eligiendo este tipo de formato. El fichero CSV resultante tendría 3 estrellas porque este formato no es propietario de ninguna empresa en particular, es un formato de datos abierto.

Para obtener 4 estrellas debemos crear un fichero que cumpla los estándares abiertos de la W3C como RDF a partir del CSV anterior y/o usar URIs para denotar los datos.

Aunque puede requerir de ciertas habilidades informáticas, existen herramientas para convertir a formatos RDF. Algunas de ellas las podemos encontrar recopiladas en la página: http://www.w3.org/wiki/ConverterToRdf.

Finalmente si algunos de nuestros datos son enlaces externos que proveen más información (por ejemplo enlazar los países a información de wikidata) nuestro conjunto de datos tendrá 5 estrellas.