Données confidentielles : génération de jeux de données synthétisés par forêts aléatoires pour des variables catégoriques
La confidentialité des données est devenue primordiale en statistique. Une méthode souvent utilisée pour diminuer le risque de réidentification est la génération de jeux de données partiellement synthétiques. On explique le concept de jeux de données synthétiques, et on décrit une méthode basée sur...
Main Author: | |
---|---|
Other Authors: | |
Format: | Dissertation |
Language: | French |
Published: |
Université Laval
2015
|
Subjects: | |
Online Access: | http://hdl.handle.net/20.500.11794/25935 |