Master 2013 2014
Stages de la spécialité SAR
Le cellier : un nouveau ramasse-miette pour les grands volumes de données


Lieu :Laboratoire d'Informatique de Paris. 4, place Jussieu 75005 Paris
Encadrant : Gaël Thomas, gael.thomas@lip6.fr
Dates :01/04/02014 au 30/09/2014
Rémunération :Environ 400 euros/mois
Mots-clés : Parcours SAR autre qu’ATIAM, professionnel, Parcours SAR autre qu’ATIAM, rech./prof., Parcours SAR autre qu’ATIAM, recherche


Description

L’essor de l’informatique en nuage a permis aux administrations et entreprises de stocker d’énormes jeux de données. Aujourd’hui, l’un des goulots d’étranglement majeurs pour les performances de traitement de ces données est le ramasse-miette des machines virtuelles langage comme la machine virtuelle Java. Les ramasse-miettes doivent aujourd’hui scanner des tas de plusieurs dizaines de giga-octets de mémoire, ce qui engendre des temps de pause intolérable pour l’utilisateur. Une étude récente que nous avons menée conjointement avec l’université de Neuchatel a montré que la base de donnée NoSQL Cassandra pouvait présenter des temps de pause allant jusqu’à 6 minutes avec un tas d’un centaine de giga-octets.

Le but du stage est de proposer et d’étudier un nouvel algorithme de ramasse-miette pouvant supporter de grandes charges mémoire. L’algorithme part du principe que le ramasse-miette peut scanner les objets parallèlement à l’application si ces objets ne sont pas accédés par l’application en même temps. Le but du stage va donc être de trouver un algorithme permettant de séparer le tas en deux parties, l’une avec les objets accédés par l’application, l’autre avec les objets non-accédés.

Les développements seront effectués dans la machine virtuelle de recherche VMKit en C++. Il est donc demandé au candidat d’avoir un excellent niveau de programmation et des connaissances en collection mémoire.

Bibliographie

Lokesh Gidra, Gaël Thomas, Julien Sopena, and Marc Shapiro. A study of the scalability of stop-the-world garbage collectors on multicores. In Proceedings of the conference on Architectural Support for Programming Languages and Operating Systems, ASPLOS ’13, pages 229-240, Houston, Texas, USA, 2013. ACM.

Balaji Iyengar, Gil Tene, Michael Wolf, and Edward Gehringer. The Collie : a wait-free compacting collector. In Proceedings of the international symposium on Memory Management, ISMM ’12. pages 85-96, New York, NY, USA, 2012, ACM.