Vues et requêtes sur les graphes de données : déterminabilité et réécritures

Les graphes de données sont naturellement utilisés dans de nombreux contextes incluant par exemple les réseaux sociaux ou le Web sémantique. L'information contenue dans la base de données se trouve alors aussi bien dans les données mêmes que dans la topologie du graphe, c'est-à-dire dans l...

Full description

Bibliographic Details
Main Author: Francis, Nadime
Other Authors: Université Paris-Saclay (ComUE)
Language:en
Published: 2015
Subjects:
Online Access:http://www.theses.fr/2015SACLN015/document
id ndltd-theses.fr-2015SACLN015
record_format oai_dc
spelling ndltd-theses.fr-2015SACLN0152020-02-03T15:25:30Z Vues et requêtes sur les graphes de données : déterminabilité et réécritures View-based query determinacy and rewritings over graph databases Graphes de données Vues Déterminabilité Réécriture Requêtes de chemin Graph databases Views Determinacy Rewriting Path queries Les graphes de données sont naturellement utilisés dans de nombreux contextes incluant par exemple les réseaux sociaux ou le Web sémantique. L'information contenue dans la base de données se trouve alors aussi bien dans les données mêmes que dans la topologie du graphe, c'est-à-dire dans la manière dont les données sont connectées. Cela implique donc de considérer les questions traditionnelles en théorie des bases de données pour des langages de requêtes capables de parler des chemins connectant les nœuds du graphe. Nous nous intéressons en particulier aux problèmes de la déterminabilité et de la réécriture d'une requête à l'aide de vues. Il s'agit alors de décider si une vue de la base de données contient suffisamment d'information pour répondre entièrement à une requête sans consulter la base de données directement, et dans ce cas, d'exprimer explicitement la réponse à la requête à partir de la vue. Ce cadre rencontre de nombreuses applications, notamment pour l'intégration de données et l'optimisation de requêtes. Nous commençons par comparer ces deux questions aux autres problèmes de décision classiques dans ce contexte : calcul des réponses certaines, test de cohérence et mise à jour d'une instance de vue. Nous améliorons ensuite ces résultats dans deux cas spécifiques. Tout d'abord, nous montrons que pour les requêtes régulières de chemin, l'existence d'une réécriture monotone coïncide avec l'existence d'une réécriture dans Datalog. Puis, nous montrons que pour des vues s'intéressant uniquement aux longueurs des chemins du graphe, une notion plus faible de déterminabilité, appelée déterminabilité asymptotique, est décidable et résulte en des réécritures du premier ordre. Graph databases appear naturally in various scenarios, such as social networks and the semantic Web. In these cases, the information contained in the database lies as much in the data itself as in the topology of the graph, that is, in how the data points are linked together. This leads to considering traditional database theory questions for query languages that return data nodes based on the paths of the graph connecting them. We focus our attention on the view-based query determinacy and rewriting problems. They ask the question whether a view of the database contains enough information to fully answer a query without accessing the database directly. If so, we then want to express the answer to the query directly with regards to the view. This setting occurs in many applications, such as data integration and query optimization. We start by comparing these two tasks to other common task in this setting: computing certain answers, checking consistency of a view instance and updating it. We then build on these results in two specific cases. First, we show that for regular path queries, the existence of a monotone rewriting coincides with the existence of a rewriting expressible in Datalog. Then, we show that for views that only consider the lengths of the path in the graph, we can decide a weaker form of determinacy, called asymptotic determinacy, and produce first-order rewritings for the queries that are asymptotically determined. Electronic Thesis or Dissertation Text en http://www.theses.fr/2015SACLN015/document Francis, Nadime 2015-12-08 Université Paris-Saclay (ComUE) Segoufin, Luc
collection NDLTD
language en
sources NDLTD
topic Graphes de données
Vues
Déterminabilité
Réécriture
Requêtes de chemin
Graph databases
Views
Determinacy
Rewriting
Path queries

spellingShingle Graphes de données
Vues
Déterminabilité
Réécriture
Requêtes de chemin
Graph databases
Views
Determinacy
Rewriting
Path queries

Francis, Nadime
Vues et requêtes sur les graphes de données : déterminabilité et réécritures
description Les graphes de données sont naturellement utilisés dans de nombreux contextes incluant par exemple les réseaux sociaux ou le Web sémantique. L'information contenue dans la base de données se trouve alors aussi bien dans les données mêmes que dans la topologie du graphe, c'est-à-dire dans la manière dont les données sont connectées. Cela implique donc de considérer les questions traditionnelles en théorie des bases de données pour des langages de requêtes capables de parler des chemins connectant les nœuds du graphe. Nous nous intéressons en particulier aux problèmes de la déterminabilité et de la réécriture d'une requête à l'aide de vues. Il s'agit alors de décider si une vue de la base de données contient suffisamment d'information pour répondre entièrement à une requête sans consulter la base de données directement, et dans ce cas, d'exprimer explicitement la réponse à la requête à partir de la vue. Ce cadre rencontre de nombreuses applications, notamment pour l'intégration de données et l'optimisation de requêtes. Nous commençons par comparer ces deux questions aux autres problèmes de décision classiques dans ce contexte : calcul des réponses certaines, test de cohérence et mise à jour d'une instance de vue. Nous améliorons ensuite ces résultats dans deux cas spécifiques. Tout d'abord, nous montrons que pour les requêtes régulières de chemin, l'existence d'une réécriture monotone coïncide avec l'existence d'une réécriture dans Datalog. Puis, nous montrons que pour des vues s'intéressant uniquement aux longueurs des chemins du graphe, une notion plus faible de déterminabilité, appelée déterminabilité asymptotique, est décidable et résulte en des réécritures du premier ordre. === Graph databases appear naturally in various scenarios, such as social networks and the semantic Web. In these cases, the information contained in the database lies as much in the data itself as in the topology of the graph, that is, in how the data points are linked together. This leads to considering traditional database theory questions for query languages that return data nodes based on the paths of the graph connecting them. We focus our attention on the view-based query determinacy and rewriting problems. They ask the question whether a view of the database contains enough information to fully answer a query without accessing the database directly. If so, we then want to express the answer to the query directly with regards to the view. This setting occurs in many applications, such as data integration and query optimization. We start by comparing these two tasks to other common task in this setting: computing certain answers, checking consistency of a view instance and updating it. We then build on these results in two specific cases. First, we show that for regular path queries, the existence of a monotone rewriting coincides with the existence of a rewriting expressible in Datalog. Then, we show that for views that only consider the lengths of the path in the graph, we can decide a weaker form of determinacy, called asymptotic determinacy, and produce first-order rewritings for the queries that are asymptotically determined.
author2 Université Paris-Saclay (ComUE)
author_facet Université Paris-Saclay (ComUE)
Francis, Nadime
author Francis, Nadime
author_sort Francis, Nadime
title Vues et requêtes sur les graphes de données : déterminabilité et réécritures
title_short Vues et requêtes sur les graphes de données : déterminabilité et réécritures
title_full Vues et requêtes sur les graphes de données : déterminabilité et réécritures
title_fullStr Vues et requêtes sur les graphes de données : déterminabilité et réécritures
title_full_unstemmed Vues et requêtes sur les graphes de données : déterminabilité et réécritures
title_sort vues et requêtes sur les graphes de données : déterminabilité et réécritures
publishDate 2015
url http://www.theses.fr/2015SACLN015/document
work_keys_str_mv AT francisnadime vuesetrequetessurlesgraphesdedonneesdeterminabiliteetreecritures
AT francisnadime viewbasedquerydeterminacyandrewritingsovergraphdatabases
_version_ 1719311464185987072