- Accueil
- FR
- Étudier
- Offre de formation
- fcsante
-
Partager cette page
DATA-2.2 Techniques de science de données appliquées aux données biologiques en utilisant Python (Data science technique
Accroche introductive
Apprendre à utiliser et appliquer les techniques de data sciences aux données biologiques en utilisant Python
Accéder aux sections de la fiche
Call to actions
-
Intitulé du programmeDATA-2.2 Techniques de science de données appliquées aux données biologiques en utilisant Python (Data science technique
-
mnémonique du programmeFC-877
-
Programme organisé par
- Centre de Formation Continue en Santé et Sciences de la vie
- Université libre de Bruxelles
-
Type de titreformation continue
-
Accessible en reprise d'étudesoui
-
Type d'horaireEn journée
-
Langues d'enseignementfrançais
-
Durée de la formationcourte (2 à 5 jours)
-
Catégorie / ThématiqueSanté - Sciences biomédicales et pharmaceutiques
-
E-mail de contact
-
Téléphone de contact
Présentation
Détails
Informations générales
Type de titreformation continue
Durée de la formationcourte (2 à 5 jours)
Langue(s) d'enseignementfrançais
Type d'horaireEn journée
Catégorie(s) - Thématique(s)Santé - Sciences biomédicales et pharmaceutiques
Faculté(s) et université(s) organisatrice(s) Accessible en reprise d'étudesoui
Tarifs :- Tarif réduit pour les doctorants & instit. hospitalières ULB : 190 €
- Tarif réduit pour les institutions publiques, académiques et ASBL : 270 €
- Tarif plein : 380 €
Cette formation m'intéresse !
Vous faites partie du personnel ULB ? La formation pourrait correspond à votre parcours de carrière ? Contact : formations.drh@ulb.be
Intervenant :
- Matthieu Defrance
Université libre de Bruxelles
Contacts
02 555 85 17
Prochaine édition:
- à venir
Présentation
Objectifs de la formation
- Comprendre les concepts fondamentaux de l'analyse et de la visualisation de données biologiques.
- Apprendre à utiliser les techniques de science des données : clustering, classification supervisée, régression, sélection de variables
- Maitriser les bibliothèques Pandas, Matplotlib et scikitlearn.
- Acquérir des compétences pour effectuer des analyses supervisée et non supervisée sur les données biologiques à large échelle.
Horaire
En journée
- 2 sessions de 3 heures
Prochaine édition:
- à venir
Calendrier & inscriptions
Pré-requis
Nécessite soit des notions de programmation en Python OU Avoir suivi le module d’initiation au traitement de données en python DATA-2.1 (Analyse et visualisation de données biologiques à grande échelle avec Python).
Calendrier & inscriptions
Prochaine édition:
- à venir
Programme
1. Prétraitement et Exploration des Données
- Rappel sur les données et le prétraitement de données à large échelle
- Techniques de prétraitement : normalisation, imputation
2. Classification et régression avec scikit-learn
- Introduction à la classification et à la régression
- Construction de modèles avec scikitlearn
- Jeux d’entrainement et de validation. Techniques de cross validation
- Évaluation des performances : Accuracy, précision / recall
3. Clustering, réduction de dimension et visualisation
- Techniques de clustering (kmeans, clustering hiérarchique, …)
- Métriques associées aux méthodes non supervisées
- Réduction de dimensions avec PCA et tSNE
- Visualisation en 2 dimensions de données à large échelle
- Techniques avancées de clustering sur espace latent