Provenance et Qualité dans les Workflows Orientés Données : application à la plateforme WebLab

La plateforme Weblab est un environnement de définition et d’exécution de chaines de traitements média-mining développé par le service IPCC1 d’Airbus Defence and Space. Il s’agit d’une plateforme ouverte d’intégration de composants externes dont la richesse permet aux concepteurs de construire des c...

Full description

Bibliographic Details
Main Author: Caron, Clément
Other Authors: Paris 6
Language:fr
Published: 2015
Subjects:
004
Online Access:http://www.theses.fr/2015PA066568/document
id ndltd-theses.fr-2015PA066568
record_format oai_dc
spelling ndltd-theses.fr-2015PA0665682019-12-22T04:45:19Z Provenance et Qualité dans les Workflows Orientés Données : application à la plateforme WebLab Provenance and Quality in Data Oriented Workflows : application to the WebLab Platform Workflow Boite noires WebLab Qualité Provenance Données Provenance Quality Black boxes 004 La plateforme Weblab est un environnement de définition et d’exécution de chaines de traitements média-mining développé par le service IPCC1 d’Airbus Defence and Space. Il s’agit d’une plateforme ouverte d’intégration de composants externes dont la richesse permet aux concepteurs de construire des chaines média-mining très complexes, mais pose également des problèmes liés à la sensibilité de la qualité des résultats par rapport aux composants utilisés. Avant le début de cette thèse, aucun outil n’existait pour l’analyse et l’amélioration de la qualité de workflows WebLab. La problématique principale de la thèse repose sur le fonctionnement dit boite noire des services WebLab. L’approche choisie est non-intrusive : nous complétons la définition du workflow WebLab par des règles de provenance et de propagation de qualité. Les règles de provenance génèrent des liens de dépendance dit grains-fins entre les données et les services après l’exécution d’une chaine de traitements WebLab. Les règles de propagation de qualité profitent des liens inférés précédemment pour raisonner sur l’influence de la qualité d’une donnée utilisée par un service sur la qualité d’une donnée produite... The WebLab platform is an application used to define and execute media-mining workflows. It is an open source platform, developed by the IPCC1 section of Airbus Defence and Space, for the integration of external components. A designer can create complex media-mining workflows using components, whose operation is not always known (black-boxes services). These complex workflows can lead to a problem of data quality, however, and before this work, no tool existed to analyse and improve the quality of WebLab workflows. To deal with black-box services, we choose to tackle this quality problem with a non-intrusive approach: we enhance the definition of the WebLab workflow with provenance and quality propagation rules. Provenance rules generate fine-grained data dependency links between data and services after the execution of a WebLab workflow. Then the quality propagation rules use these links to reason on the influence that the quality of the data used by a component has on the quality of the output data… Electronic Thesis or Dissertation Text fr http://www.theses.fr/2015PA066568/document Caron, Clément 2015-11-03 Paris 6 Amann, Bernd Constantin, Camélia
collection NDLTD
language fr
sources NDLTD
topic Workflow
Boite noires
WebLab
Qualité
Provenance
Données
Provenance
Quality
Black boxes
004
spellingShingle Workflow
Boite noires
WebLab
Qualité
Provenance
Données
Provenance
Quality
Black boxes
004
Caron, Clément
Provenance et Qualité dans les Workflows Orientés Données : application à la plateforme WebLab
description La plateforme Weblab est un environnement de définition et d’exécution de chaines de traitements média-mining développé par le service IPCC1 d’Airbus Defence and Space. Il s’agit d’une plateforme ouverte d’intégration de composants externes dont la richesse permet aux concepteurs de construire des chaines média-mining très complexes, mais pose également des problèmes liés à la sensibilité de la qualité des résultats par rapport aux composants utilisés. Avant le début de cette thèse, aucun outil n’existait pour l’analyse et l’amélioration de la qualité de workflows WebLab. La problématique principale de la thèse repose sur le fonctionnement dit boite noire des services WebLab. L’approche choisie est non-intrusive : nous complétons la définition du workflow WebLab par des règles de provenance et de propagation de qualité. Les règles de provenance génèrent des liens de dépendance dit grains-fins entre les données et les services après l’exécution d’une chaine de traitements WebLab. Les règles de propagation de qualité profitent des liens inférés précédemment pour raisonner sur l’influence de la qualité d’une donnée utilisée par un service sur la qualité d’une donnée produite... === The WebLab platform is an application used to define and execute media-mining workflows. It is an open source platform, developed by the IPCC1 section of Airbus Defence and Space, for the integration of external components. A designer can create complex media-mining workflows using components, whose operation is not always known (black-boxes services). These complex workflows can lead to a problem of data quality, however, and before this work, no tool existed to analyse and improve the quality of WebLab workflows. To deal with black-box services, we choose to tackle this quality problem with a non-intrusive approach: we enhance the definition of the WebLab workflow with provenance and quality propagation rules. Provenance rules generate fine-grained data dependency links between data and services after the execution of a WebLab workflow. Then the quality propagation rules use these links to reason on the influence that the quality of the data used by a component has on the quality of the output data…
author2 Paris 6
author_facet Paris 6
Caron, Clément
author Caron, Clément
author_sort Caron, Clément
title Provenance et Qualité dans les Workflows Orientés Données : application à la plateforme WebLab
title_short Provenance et Qualité dans les Workflows Orientés Données : application à la plateforme WebLab
title_full Provenance et Qualité dans les Workflows Orientés Données : application à la plateforme WebLab
title_fullStr Provenance et Qualité dans les Workflows Orientés Données : application à la plateforme WebLab
title_full_unstemmed Provenance et Qualité dans les Workflows Orientés Données : application à la plateforme WebLab
title_sort provenance et qualité dans les workflows orientés données : application à la plateforme weblab
publishDate 2015
url http://www.theses.fr/2015PA066568/document
work_keys_str_mv AT caronclement provenanceetqualitedanslesworkflowsorientesdonneesapplicationalaplateformeweblab
AT caronclement provenanceandqualityindataorientedworkflowsapplicationtotheweblabplatform
_version_ 1719305583045115904