lunes, 7 de abril de 2014

Open Data Aragón: vamos a hacer algunas consultas SPARQL

Después de mucho hablar de Madrid, en nuestro post de hoy hemos decidido viajar un poco, ahora que empieza el buen tiempo, e irnos a Aragón.

Aragón Open DataLa andadura de esta comunidad autónoma con los datos abiertos comenzó hace ya algo más de un año. De hecho, hace un par de meses (el 6 de febrero) hubo una jornada en la que se presentaron varias novedades en su portal de datos abiertos.

Una de estas novedades fue la Aragopedia, creada por la gente de Idearium Consultores. Esta wiki, cuyos contenidos se ofrecen también mediante una API, ha sido generada a partir de datos de los que dispone el Gobierno de Aragón sobre cada uno de sus municipios, comarcas y provincias, así como de toda la comunidad autónoma.

Y otra de las novedades fue la AragoDBpedia, en cuya construcción participamos nosotros. A partir de los datos anteriores generamos datos en RDF correspondientes a cada uno de los municipios, comarcas y provincias, utilizando el mismo proceso que se sigue para la generación de la DBpedia, así como de la DBpedia española. Y, ¿cómo no?, los exponemos también en un punto de consulta SPARQL (detalles aquí) y a través de una API.

Hoy os vamos a contar algunas cosas que se pueden hacer con el punto de consulta SPARQL, y ya dejaremos el uso de la API para algún otro post.

En primer lugar, y para entender bien los tipos de datos con los que nos vamos a encontrar en este punto de consulta, nuestra recomendación es la de empezar leyendo un poco sobre el vocabulario en el que se basan estos datos. Como se puede ver se recogen conceptos como el de municipio, comarca, provincia y comunidad autónoma. Hemos decidido reutilizar todo lo posible de la ontología de DBpedia, por eso del enfoque que hemos seguido para la generación de estos datos y API, pero no descartamos que en un futuro no muy lejano todos estos conceptos se unifiquen en algún vocabulario de uso común para todas las autonomías y municipios en España. También usamos DataCube, un vocabulario propuesto por el W3C para la representación de datos estadísticos, que se había publicado definitivamente como estándar el 16 de enero.

Una vez vistos los vocabularios, es hora de empezar a consultar al punto de consulta SPARQL. En la documentación sobre SPARQL que aparece en la Web de Aragón Open Data, y que os aconsejamos leer antes de continuar, tenemos algunas consultas sencillas:
  • Dame la lista de comarcas de Aragón (aquí), así como su número (aquí).
  • Dame todos los detalles de un municipio como Albelda (aquí).
  • Dame las plazas hoteleras de la provincia de Huesca en el año 2011 (aquí).
  • Ordena de mayor a menor los municipios de Aragón por la superficie dedicada a aeropuertos dentro de su término municipal (aquí), así como por el número total de kilogramos de vidrio reciclados (aquí).
Una última consulta antes de terminar este post... Esta me la pidió un periodista recientemente, que quería la lista de los nombres de los alcaldes de una comarca. La consulta se escribiría de la siguiente manera, por ejemplo, para la comarca de Cuencas Mineras:

PREFIX aragodef: <http://opendata.aragon.es/def/Aragopedia#>
PREFIX dbpedia: <http://dbpedia.org/ontology/>
SELECT DISTINCT ?uriMunicipio ?nombreMunicipio ?alcalde
WHERE {
 ?uriMunicipio a dbpedia:Municipality .
 ?uriMunicipio rdfs:label ?nombreMunicipio .
 ?uriMunicipio aragodef:mayor ?alcalde .
 ?uriMunicipio aragodef:enComarca <http://opendata.aragon.es/recurso/territorio/Comarca/Cuencas_Mineras>
}



El resultado lo podéis comprobar vosotros mismos aquí. Si necesitáis ayuda para hacer uso de este dataset, no dudéis en contactar con nosotros, y si queréis aportar vuestras propias consultas, hacedlo como un comentario a este post, que estaremos encantados de darle publicidad.