Améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs

L'omniprésence des ordinateurs et la demande de toujours plus de puissance poussent les architectes processeur à chercher des moyens d'augmenter les performances de ces processeurs. La tendance actuelle est de répliquer sur une même puce plusieurs c\oe urs d'exécution pour parallélise...

Full description

Bibliographic Details
Main Author:	Prémillieu, Nathanaël
Language:	FRE
Published:	Université Rennes 1 2013
Subjects:	[INFO:INFO_AR] Computer Science/Hardware Architecture [INFO:INFO_AR] Informatique/Architectures Matérielles Architecture des processeurs prédiction de branchements reconvergence indépendance de contrôle instructions prédiquées rejeu sélectif
Online Access:	http://tel.archives-ouvertes.fr/tel-00914898 http://tel.archives-ouvertes.fr/docs/00/91/80/15/PDF/Nathanael_Premillieu.pdf

id	ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00914898
record_format	oai_dc
spelling	ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-009148982013-12-14T03:20:27Z http://tel.archives-ouvertes.fr/tel-00914898 http://tel.archives-ouvertes.fr/docs/00/91/80/15/PDF/Nathanael_Premillieu.pdf Améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs Prémillieu, Nathanaël [INFO:INFO_AR] Computer Science/Hardware Architecture [INFO:INFO_AR] Informatique/Architectures Matérielles Architecture des processeurs prédiction de branchements reconvergence indépendance de contrôle instructions prédiquées rejeu sélectif L'omniprésence des ordinateurs et la demande de toujours plus de puissance poussent les architectes processeur à chercher des moyens d'augmenter les performances de ces processeurs. La tendance actuelle est de répliquer sur une même puce plusieurs c\oe urs d'exécution pour paralléliser l'exécution. Si elle se poursuit, les processeurs deviendront massivement multic\oe urs avec plusieurs centaines voire un millier de c\oe urs disponibles. Cependant, la loi d'Amdahl nous rappelle que l'augmentation de la performance séquentielle sera toujours nécessaire pour améliorer les performances globales. Une voie essentielle pour accroître la performance séquentielle est de perfectionner le traitement des branchements, ceux-ci limitant le parallélisme d'instructions. La prédiction de branchements est la solution la plus étudiée, dont l'intérêt dépend essentiellement de la précision du prédicteur. Au cours des dernières années, cette précision a été continuellement améliorée et a atteint un seuil qu'il semble difficile de dépasser. Une autre solution est d'éliminer les branchements et de les remplacer par une construction reposant sur des instructions prédiquées. L'exécution des instructions prédiquées pose cependant plusieurs problèmes dans les processeurs à exécution dans le désordre, en particulier celui des définitions multiples. Les travaux présentés dans cette thèse explorent ces deux aspects du traitement des branchements. La première partie s'intéresse à la prédiction de branchements. Une solution pour améliorer celle-ci sans augmenter la précision est de réduire le coût d'une mauvaise prédiction. Cela est possible en exploitant la reconvergence de flot de contrôle et l'indépendance de contrôle pour récupérer une partie du travail fait par le processeur sur le mauvais chemin sur les instructions communes aux deux chemins pour éviter de le refaire sur le bon chemin. La deuxième partie s'intéresse aux instructions prédiquées. Nous proposons une solution au problème des définitions multiples qui passe par la prédiction sélective de la valeur des prédicats. Un mécanisme de rejeu sélectif est utilisé pour réduire le coût d'une mauvaise prédiction de prédicat. 2013-12-03 FRE PhD thesis Université Rennes 1
collection	NDLTD
language	FRE
sources	NDLTD
topic	[INFO:INFO_AR] Computer Science/Hardware Architecture [INFO:INFO_AR] Informatique/Architectures Matérielles Architecture des processeurs prédiction de branchements reconvergence indépendance de contrôle instructions prédiquées rejeu sélectif
spellingShingle	[INFO:INFO_AR] Computer Science/Hardware Architecture [INFO:INFO_AR] Informatique/Architectures Matérielles Architecture des processeurs prédiction de branchements reconvergence indépendance de contrôle instructions prédiquées rejeu sélectif Prémillieu, Nathanaël Améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs
description	L'omniprésence des ordinateurs et la demande de toujours plus de puissance poussent les architectes processeur à chercher des moyens d'augmenter les performances de ces processeurs. La tendance actuelle est de répliquer sur une même puce plusieurs c\oe urs d'exécution pour paralléliser l'exécution. Si elle se poursuit, les processeurs deviendront massivement multic\oe urs avec plusieurs centaines voire un millier de c\oe urs disponibles. Cependant, la loi d'Amdahl nous rappelle que l'augmentation de la performance séquentielle sera toujours nécessaire pour améliorer les performances globales. Une voie essentielle pour accroître la performance séquentielle est de perfectionner le traitement des branchements, ceux-ci limitant le parallélisme d'instructions. La prédiction de branchements est la solution la plus étudiée, dont l'intérêt dépend essentiellement de la précision du prédicteur. Au cours des dernières années, cette précision a été continuellement améliorée et a atteint un seuil qu'il semble difficile de dépasser. Une autre solution est d'éliminer les branchements et de les remplacer par une construction reposant sur des instructions prédiquées. L'exécution des instructions prédiquées pose cependant plusieurs problèmes dans les processeurs à exécution dans le désordre, en particulier celui des définitions multiples. Les travaux présentés dans cette thèse explorent ces deux aspects du traitement des branchements. La première partie s'intéresse à la prédiction de branchements. Une solution pour améliorer celle-ci sans augmenter la précision est de réduire le coût d'une mauvaise prédiction. Cela est possible en exploitant la reconvergence de flot de contrôle et l'indépendance de contrôle pour récupérer une partie du travail fait par le processeur sur le mauvais chemin sur les instructions communes aux deux chemins pour éviter de le refaire sur le bon chemin. La deuxième partie s'intéresse aux instructions prédiquées. Nous proposons une solution au problème des définitions multiples qui passe par la prédiction sélective de la valeur des prédicats. Un mécanisme de rejeu sélectif est utilisé pour réduire le coût d'une mauvaise prédiction de prédicat.
author	Prémillieu, Nathanaël
author_facet	Prémillieu, Nathanaël
author_sort	Prémillieu, Nathanaël
title	Améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs
title_short	Améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs
title_full	Améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs
title_fullStr	Améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs
title_full_unstemmed	Améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs
title_sort	améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs
publisher	Université Rennes 1
publishDate	2013
url	http://tel.archives-ouvertes.fr/tel-00914898 http://tel.archives-ouvertes.fr/docs/00/91/80/15/PDF/Nathanael_Premillieu.pdf
work_keys_str_mv	AT premillieunathanael ameliorerlaperformancesequentiellealeredesprocesseursmassivementmulticœurs
_version_	1716616727102488576

Améliorer la performance séquentielle à l'ère des processeurs massivement multicœurs

Similar Items