viernes, 3 de mayo de 2013

Consultas sparQL para obtener datos de Wikipedia

Consultas SparQL



En la entrada anterior se recopilaron todos los ingredientes, ahora empezamos a cocinar, para ello preparamos la consulta para obtener los datos necesarios de la web semántica e importar el grafo en Gephi. No voy a entrar en profundidad en cómo hacerlo porque si miráis en las referencias podéis encontrar toda la información de cómo instalar el plugin y configurarlo. 

Utilizando el gestor de consultas de Web Semantic Import se introduce la siguiente consulta:

prefix gephi:<http://gephi.org/>
prefixfoaf: <http://xmlns.com/foaf/0.1/>
CONSTRUCT{
  ?a gephi:label ?an .
  ?b gephi:label ?bn .
  ?a <http://dbpedia.org/ontology/stylisticOrigin> ?b
}
WHERE {
?a a <http://dbpedia.org/ontology/MusicGenre>.
?b a <http://dbpedia.org/ontology/MusicGenre>.
?a <http://dbpedia.org/ontology/stylisticOrigin> ?b.
?a foaf:name ?an.
?b foaf:name ?bn.
}

La consulta tiene dos partes principales, la primera es Construct, que le indica a Gephi como construir la estructura de datos. La segunda es la cláusula Where que conlleva la lógica de la consulta sobre la web semántica de DBpedia

De esta forma obtenemos entidades a y b que son estilos musicales cuya relación es el origen estilístico, “http://dbpedia.org/ontology/stylisticOrigin”. A parte utilizamos el prefijo foaf para decirle a Gephi que sustituya el nombre en formato de enlace por su nombre real. De esta forma nos queda una tabla con los siguientes campos ya en formato de grafo dirigido e importado cómodamente en Gephi.

Tabla de nodos
Tabla de nodos

Tabla de aristas
Tabla de aristas


En la próxima entrega empezaremos con el análisis de los datos en Gephi.
Referencias: 
Related Posts Plugin for WordPress, Blogger...