Canonicalisation of SPARQL Queries
Magíster en Ciencias, Mención Computación. Ingeniero Civil en Computación === SPARQL es el lenguaje de consulta estándar para RDF, definido por el World Wide Web Consortium. Presentemente, hay una gran cantidad de servicios de consulta de SPARQL en la Web. También hay una gran demanda por estos ser...
Main Author: | |
---|---|
Other Authors: | |
Language: | en |
Published: |
Universidad de Chile
2019
|
Subjects: | |
Online Access: | http://repositorio.uchile.cl/handle/2250/168379 |
id |
ndltd-UCHILE-oai-repositorio.uchile.cl-2250-168379 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-UCHILE-oai-repositorio.uchile.cl-2250-1683792019-11-29T09:25:05Z Canonicalisation of SPARQL Queries Salas Trejo, Jaime Osvaldo Hogan, Aidan Gutiérrez Gallardo, Claudio Pérez Rojas, Jorge Reutter de la Maza, Juan Web semantica Bases de datos RDF SPARQL Magíster en Ciencias, Mención Computación. Ingeniero Civil en Computación SPARQL es el lenguaje de consulta estándar para RDF, definido por el World Wide Web Consortium. Presentemente, hay una gran cantidad de servicios de consulta de SPARQL en la Web. También hay una gran demanda por estos servicios diariamente. Debido a la gran cantidad de consultas que deben procesar estos servicios, los procesadores sufren una sobrecarga que podría ser reducida si fuésemos capaces de detectar consultas equivalentes. Nuestra propuesta consiste en el diseño y la implementación de un algoritmo de canonicalización eficiente, el cual nos permitirá computar una forma canónica para las consultas. Las consultas que sean equivalentes deben tener la misma forma canónica, lo cual haría posible detectar un mayor número de consultas duplicadas. Hemos cubierto una parte significante de SPARQL 1.0 con nuestro trabajo; principalmente consultas que tengan la forma de uniones de consultas conjuntivas. El algoritmo que hemos desarrollado realiza una canonicalización completa de las consultas que contienen estas operaciones. Para las otras operaciones, realizamos una canonicalización parcial, pues estas otras operaciones son usadas popularmente en consultas reales. Hemos diseñado experimentos para probar la correctitud y el desempeño de nuestro algoritmo en comparación contra otros métodos sintácticos. Realizamos nuestros experimentos sobre consultas reales extraídas de bitácoras de bases de datos de RDF, y también sobre consultas sintéticas que diseñamos para forzar un mal comportamiento del algoritmo. Los resultados de nuestros experimentos son excitosos, pues la mayoría de las consultas reales son procesables en un tiempo corto, menor a un segundo. El número de consultas duplicadas encontradas es considerablemente superior que las encontradas por el algoritmo base definido. Finalmente, el algoritmo deja de funcionar únicamente para las consultas sintéticas diseñadas por nosotros, y de una gran complejidad, las cuales no ocurren en la práctica. El siguiente documento presenta el trabajo hecho. 2019-05-02T14:06:23Z 2019-05-02T14:06:23Z 2018 Tesis http://repositorio.uchile.cl/handle/2250/168379 en Attribution-NonCommercial-NoDerivs 3.0 Chile http://creativecommons.org/licenses/by-nc-nd/3.0/cl/ Universidad de Chile |
collection |
NDLTD |
language |
en |
sources |
NDLTD |
topic |
Web semantica Bases de datos RDF SPARQL |
spellingShingle |
Web semantica Bases de datos RDF SPARQL Salas Trejo, Jaime Osvaldo Canonicalisation of SPARQL Queries |
description |
Magíster en Ciencias, Mención Computación.
Ingeniero Civil en Computación === SPARQL es el lenguaje de consulta estándar para RDF, definido por el World Wide Web Consortium. Presentemente, hay una gran cantidad de servicios de consulta de SPARQL en la Web. También hay una gran demanda por estos servicios diariamente.
Debido a la gran cantidad de consultas que deben procesar estos servicios, los procesadores sufren una sobrecarga que podría ser reducida si fuésemos capaces de detectar consultas equivalentes. Nuestra propuesta consiste en el diseño y la implementación de un algoritmo de canonicalización eficiente, el cual nos permitirá computar una forma canónica para las consultas. Las consultas que sean equivalentes deben tener la misma forma canónica, lo cual haría posible detectar un mayor número de consultas duplicadas.
Hemos cubierto una parte significante de SPARQL 1.0 con nuestro trabajo; principalmente consultas que tengan la forma de uniones de consultas conjuntivas. El algoritmo que hemos desarrollado realiza una canonicalización completa de las consultas que contienen estas operaciones. Para las otras operaciones, realizamos una canonicalización parcial, pues estas otras operaciones son usadas popularmente en consultas reales.
Hemos diseñado experimentos para probar la correctitud y el desempeño de nuestro algoritmo en comparación contra otros métodos sintácticos. Realizamos nuestros experimentos sobre consultas reales extraídas de bitácoras de bases de datos de RDF, y también sobre consultas sintéticas que diseñamos para forzar un mal comportamiento del algoritmo.
Los resultados de nuestros experimentos son excitosos, pues la mayoría de las consultas reales son procesables en un tiempo corto, menor a un segundo. El número de consultas duplicadas encontradas es considerablemente superior que las encontradas por el algoritmo base definido. Finalmente, el algoritmo deja de funcionar únicamente para las consultas sintéticas diseñadas por nosotros, y de una gran complejidad, las cuales no ocurren en la práctica.
El siguiente documento presenta el trabajo hecho. |
author2 |
Hogan, Aidan |
author_facet |
Hogan, Aidan Salas Trejo, Jaime Osvaldo |
author |
Salas Trejo, Jaime Osvaldo |
author_sort |
Salas Trejo, Jaime Osvaldo |
title |
Canonicalisation of SPARQL Queries |
title_short |
Canonicalisation of SPARQL Queries |
title_full |
Canonicalisation of SPARQL Queries |
title_fullStr |
Canonicalisation of SPARQL Queries |
title_full_unstemmed |
Canonicalisation of SPARQL Queries |
title_sort |
canonicalisation of sparql queries |
publisher |
Universidad de Chile |
publishDate |
2019 |
url |
http://repositorio.uchile.cl/handle/2250/168379 |
work_keys_str_mv |
AT salastrejojaimeosvaldo canonicalisationofsparqlqueries |
_version_ |
1719299370860412928 |