Améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs

L'omniprésence des ordinateurs et la demande de toujours plus de puissance poussent les architectes processeur à chercher des moyens d'augmenter les performances de ces processeurs. La tendance actuelle est de répliquer sur une même puce plusieurs c\oe urs d'exécution pour parallélise...

Full description

Bibliographic Details
Main Author: Prémillieu, Nathanaël
Language:FRE
Published: Université Rennes 1 2013
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00914898
http://tel.archives-ouvertes.fr/docs/00/91/80/15/PDF/Nathanael_Premillieu.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00914898
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-009148982013-12-14T03:20:27Z http://tel.archives-ouvertes.fr/tel-00914898 http://tel.archives-ouvertes.fr/docs/00/91/80/15/PDF/Nathanael_Premillieu.pdf Améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs Prémillieu, Nathanaël [INFO:INFO_AR] Computer Science/Hardware Architecture [INFO:INFO_AR] Informatique/Architectures Matérielles Architecture des processeurs prédiction de branchements reconvergence indépendance de contrôle instructions prédiquées rejeu sélectif L'omniprésence des ordinateurs et la demande de toujours plus de puissance poussent les architectes processeur à chercher des moyens d'augmenter les performances de ces processeurs. La tendance actuelle est de répliquer sur une même puce plusieurs c\oe urs d'exécution pour paralléliser l'exécution. Si elle se poursuit, les processeurs deviendront massivement multic\oe urs avec plusieurs centaines voire un millier de c\oe urs disponibles. Cependant, la loi d'Amdahl nous rappelle que l'augmentation de la performance séquentielle sera toujours nécessaire pour améliorer les performances globales. Une voie essentielle pour accroître la performance séquentielle est de perfectionner le traitement des branchements, ceux-ci limitant le parallélisme d'instructions. La prédiction de branchements est la solution la plus étudiée, dont l'intérêt dépend essentiellement de la précision du prédicteur. Au cours des dernières années, cette précision a été continuellement améliorée et a atteint un seuil qu'il semble difficile de dépasser. Une autre solution est d'éliminer les branchements et de les remplacer par une construction reposant sur des instructions prédiquées. L'exécution des instructions prédiquées pose cependant plusieurs problèmes dans les processeurs à exécution dans le désordre, en particulier celui des définitions multiples. Les travaux présentés dans cette thèse explorent ces deux aspects du traitement des branchements. La première partie s'intéresse à la prédiction de branchements. Une solution pour améliorer celle-ci sans augmenter la précision est de réduire le coût d'une mauvaise prédiction. Cela est possible en exploitant la reconvergence de flot de contrôle et l'indépendance de contrôle pour récupérer une partie du travail fait par le processeur sur le mauvais chemin sur les instructions communes aux deux chemins pour éviter de le refaire sur le bon chemin. La deuxième partie s'intéresse aux instructions prédiquées. Nous proposons une solution au problème des définitions multiples qui passe par la prédiction sélective de la valeur des prédicats. Un mécanisme de rejeu sélectif est utilisé pour réduire le coût d'une mauvaise prédiction de prédicat. 2013-12-03 FRE PhD thesis Université Rennes 1
collection NDLTD
language FRE
sources NDLTD
topic [INFO:INFO_AR] Computer Science/Hardware Architecture
[INFO:INFO_AR] Informatique/Architectures Matérielles
Architecture des processeurs
prédiction de branchements
reconvergence
indépendance de contrôle
instructions prédiquées
rejeu sélectif
spellingShingle [INFO:INFO_AR] Computer Science/Hardware Architecture
[INFO:INFO_AR] Informatique/Architectures Matérielles
Architecture des processeurs
prédiction de branchements
reconvergence
indépendance de contrôle
instructions prédiquées
rejeu sélectif
Prémillieu, Nathanaël
Améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs
description L'omniprésence des ordinateurs et la demande de toujours plus de puissance poussent les architectes processeur à chercher des moyens d'augmenter les performances de ces processeurs. La tendance actuelle est de répliquer sur une même puce plusieurs c\oe urs d'exécution pour paralléliser l'exécution. Si elle se poursuit, les processeurs deviendront massivement multic\oe urs avec plusieurs centaines voire un millier de c\oe urs disponibles. Cependant, la loi d'Amdahl nous rappelle que l'augmentation de la performance séquentielle sera toujours nécessaire pour améliorer les performances globales. Une voie essentielle pour accroître la performance séquentielle est de perfectionner le traitement des branchements, ceux-ci limitant le parallélisme d'instructions. La prédiction de branchements est la solution la plus étudiée, dont l'intérêt dépend essentiellement de la précision du prédicteur. Au cours des dernières années, cette précision a été continuellement améliorée et a atteint un seuil qu'il semble difficile de dépasser. Une autre solution est d'éliminer les branchements et de les remplacer par une construction reposant sur des instructions prédiquées. L'exécution des instructions prédiquées pose cependant plusieurs problèmes dans les processeurs à exécution dans le désordre, en particulier celui des définitions multiples. Les travaux présentés dans cette thèse explorent ces deux aspects du traitement des branchements. La première partie s'intéresse à la prédiction de branchements. Une solution pour améliorer celle-ci sans augmenter la précision est de réduire le coût d'une mauvaise prédiction. Cela est possible en exploitant la reconvergence de flot de contrôle et l'indépendance de contrôle pour récupérer une partie du travail fait par le processeur sur le mauvais chemin sur les instructions communes aux deux chemins pour éviter de le refaire sur le bon chemin. La deuxième partie s'intéresse aux instructions prédiquées. Nous proposons une solution au problème des définitions multiples qui passe par la prédiction sélective de la valeur des prédicats. Un mécanisme de rejeu sélectif est utilisé pour réduire le coût d'une mauvaise prédiction de prédicat.
author Prémillieu, Nathanaël
author_facet Prémillieu, Nathanaël
author_sort Prémillieu, Nathanaël
title Améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs
title_short Améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs
title_full Améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs
title_fullStr Améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs
title_full_unstemmed Améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs
title_sort améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs
publisher Université Rennes 1
publishDate 2013
url http://tel.archives-ouvertes.fr/tel-00914898
http://tel.archives-ouvertes.fr/docs/00/91/80/15/PDF/Nathanael_Premillieu.pdf
work_keys_str_mv AT premillieunathanael ameliorerlaperformancesequentiellealeredesprocesseursmassivementmulticœurs
_version_ 1716616727102488576