Bonjour à tous !
Je suis nouveau sur ce forum donc j'espère avoir posté au bon endroit (je pense sincèrement que oui).
Je suis actuellement stagiaire à l'INSERM en bioinformatique et biostatistiques.
Je travaille sur de la parallélisation de code R, je m'explique.
Mon maître de stage à codé un algorithme en langage R de prédiction statistique qui met un temps fou à être effectué par une seule machine (plusieurs jours non-stop de calcul intensif).
Mon objectif est de permettre une "division" du temps de calcul , en répartissant le travail sur plusieurs machines à la fois. Ces machines sont connectées sur un réseau local via un switch qui peut accueillir jusqu'à 8 cables ethernet.
J'ai réussit à créé une connection SSH entre chaque machine en supprimant le mot de passe d'accès.
J'ai également réussit à lancer mon code R sur tout les coeurs de ma machine principale.
En effet, mon code d'essai, en calcul séquentiel (c'est à dire sur un seul coeur de la machine) met environ 35 secondes à être effectué. Quand je parallélise mon calcul sur les 4 coeurs de ma machine, je passe à 8sec environ de temps de calcul. Ce qui prouve que ma parallélisation marche.
Cependant quand je décide de paralléliser en intégrant une machine externe connecté par ethernet via SSh, ça bloque, et ya rien qui se passe.
Je fais donc appel à une âme charitable qui aura déjà fait de la parallélisation de calcul sous R en utilisant la librairie Snow, Snowfall, Rmpi ou je ne sais quoi, pourvu que sa marche !
Merci de votre lecture !