Un environnement de data science à l’état de l’art
DIIT (Division Innovation et Instruction Technique) & SSP Lab
développement du projet de plateforme datascience Onyxia et gestion de l’instance SSP Cloud
accompagnement de projets open-data
diffusion des bonnes pratiques
,
L’infrastructure est souvent un frein à l’innovation
Mutualisation d’une infrastructure, de services et de connaissances
Un service de stockage distribué de données sous forme d’objets (S3)
Une infrastructure cloud-native, basée sur un orchestrateur de conteneurs (Kubernetes)
Un catalogue de services couvrant l’ensemble du cycle de vie des projets de data science, du libre service à la mise en production
Instance du projet Onyxia hébergée à l’Insee
Des ressources dimensionnées pour la data science (RAM, CPU, GPU)
Une plateforme qui vous est ouverte !
Auto-formation aux grands principes des architectures modernes de data science
Stockage cloud : élastique et donc plus économique
Portabilité : les objets sont mis à disposition via une API web
Découplage du stockage et du moteur de calcul
Légèreté : ils n’incluent que le strict nécessaire au fonctionnement de l’application
Portabilité : il est très facile de passer d’un environnement d’exécution à un autre
Reproductibilité : l’application s’exécute de la même manière quel que soit l’environnement sur lequel il est déployé
Déploiements reproductibles et automatisés
Adapter les ressources (scaler) selon les besoins
Monitoring de l’état de santé des applications
Présentation à l’ENSAI