Canonicalisation of SPARQL Queries

Magíster en Ciencias, Mención Computación. Ingeniero Civil en Computación === SPARQL es el lenguaje de consulta estándar para RDF, definido por el World Wide Web Consortium. Presentemente, hay una gran cantidad de servicios de consulta de SPARQL en la Web. También hay una gran demanda por estos ser...

Full description

Bibliographic Details
Main Author: Salas Trejo, Jaime Osvaldo
Other Authors: Hogan, Aidan
Language:en
Published: Universidad de Chile 2019
Subjects:
RDF
Online Access:http://repositorio.uchile.cl/handle/2250/168379
id ndltd-UCHILE-oai-repositorio.uchile.cl-2250-168379
record_format oai_dc
spelling ndltd-UCHILE-oai-repositorio.uchile.cl-2250-1683792019-11-29T09:25:05Z Canonicalisation of SPARQL Queries Salas Trejo, Jaime Osvaldo Hogan, Aidan Gutiérrez Gallardo, Claudio Pérez Rojas, Jorge Reutter de la Maza, Juan Web semantica Bases de datos RDF SPARQL Magíster en Ciencias, Mención Computación. Ingeniero Civil en Computación SPARQL es el lenguaje de consulta estándar para RDF, definido por el World Wide Web Consortium. Presentemente, hay una gran cantidad de servicios de consulta de SPARQL en la Web. También hay una gran demanda por estos servicios diariamente. Debido a la gran cantidad de consultas que deben procesar estos servicios, los procesadores sufren una sobrecarga que podría ser reducida si fuésemos capaces de detectar consultas equivalentes. Nuestra propuesta consiste en el diseño y la implementación de un algoritmo de canonicalización eficiente, el cual nos permitirá computar una forma canónica para las consultas. Las consultas que sean equivalentes deben tener la misma forma canónica, lo cual haría posible detectar un mayor número de consultas duplicadas. Hemos cubierto una parte significante de SPARQL 1.0 con nuestro trabajo; principalmente consultas que tengan la forma de uniones de consultas conjuntivas. El algoritmo que hemos desarrollado realiza una canonicalización completa de las consultas que contienen estas operaciones. Para las otras operaciones, realizamos una canonicalización parcial, pues estas otras operaciones son usadas popularmente en consultas reales. Hemos diseñado experimentos para probar la correctitud y el desempeño de nuestro algoritmo en comparación contra otros métodos sintácticos. Realizamos nuestros experimentos sobre consultas reales extraídas de bitácoras de bases de datos de RDF, y también sobre consultas sintéticas que diseñamos para forzar un mal comportamiento del algoritmo. Los resultados de nuestros experimentos son excitosos, pues la mayoría de las consultas reales son procesables en un tiempo corto, menor a un segundo. El número de consultas duplicadas encontradas es considerablemente superior que las encontradas por el algoritmo base definido. Finalmente, el algoritmo deja de funcionar únicamente para las consultas sintéticas diseñadas por nosotros, y de una gran complejidad, las cuales no ocurren en la práctica. El siguiente documento presenta el trabajo hecho. 2019-05-02T14:06:23Z 2019-05-02T14:06:23Z 2018 Tesis http://repositorio.uchile.cl/handle/2250/168379 en Attribution-NonCommercial-NoDerivs 3.0 Chile http://creativecommons.org/licenses/by-nc-nd/3.0/cl/ Universidad de Chile
collection NDLTD
language en
sources NDLTD
topic Web semantica
Bases de datos
RDF
SPARQL
spellingShingle Web semantica
Bases de datos
RDF
SPARQL
Salas Trejo, Jaime Osvaldo
Canonicalisation of SPARQL Queries
description Magíster en Ciencias, Mención Computación. Ingeniero Civil en Computación === SPARQL es el lenguaje de consulta estándar para RDF, definido por el World Wide Web Consortium. Presentemente, hay una gran cantidad de servicios de consulta de SPARQL en la Web. También hay una gran demanda por estos servicios diariamente. Debido a la gran cantidad de consultas que deben procesar estos servicios, los procesadores sufren una sobrecarga que podría ser reducida si fuésemos capaces de detectar consultas equivalentes. Nuestra propuesta consiste en el diseño y la implementación de un algoritmo de canonicalización eficiente, el cual nos permitirá computar una forma canónica para las consultas. Las consultas que sean equivalentes deben tener la misma forma canónica, lo cual haría posible detectar un mayor número de consultas duplicadas. Hemos cubierto una parte significante de SPARQL 1.0 con nuestro trabajo; principalmente consultas que tengan la forma de uniones de consultas conjuntivas. El algoritmo que hemos desarrollado realiza una canonicalización completa de las consultas que contienen estas operaciones. Para las otras operaciones, realizamos una canonicalización parcial, pues estas otras operaciones son usadas popularmente en consultas reales. Hemos diseñado experimentos para probar la correctitud y el desempeño de nuestro algoritmo en comparación contra otros métodos sintácticos. Realizamos nuestros experimentos sobre consultas reales extraídas de bitácoras de bases de datos de RDF, y también sobre consultas sintéticas que diseñamos para forzar un mal comportamiento del algoritmo. Los resultados de nuestros experimentos son excitosos, pues la mayoría de las consultas reales son procesables en un tiempo corto, menor a un segundo. El número de consultas duplicadas encontradas es considerablemente superior que las encontradas por el algoritmo base definido. Finalmente, el algoritmo deja de funcionar únicamente para las consultas sintéticas diseñadas por nosotros, y de una gran complejidad, las cuales no ocurren en la práctica. El siguiente documento presenta el trabajo hecho.
author2 Hogan, Aidan
author_facet Hogan, Aidan
Salas Trejo, Jaime Osvaldo
author Salas Trejo, Jaime Osvaldo
author_sort Salas Trejo, Jaime Osvaldo
title Canonicalisation of SPARQL Queries
title_short Canonicalisation of SPARQL Queries
title_full Canonicalisation of SPARQL Queries
title_fullStr Canonicalisation of SPARQL Queries
title_full_unstemmed Canonicalisation of SPARQL Queries
title_sort canonicalisation of sparql queries
publisher Universidad de Chile
publishDate 2019
url http://repositorio.uchile.cl/handle/2250/168379
work_keys_str_mv AT salastrejojaimeosvaldo canonicalisationofsparqlqueries
_version_ 1719299370860412928