-
Partager cette page
STIC-B545
Traitement automatique de corpus
Titulaire(s) du cours
Max DE WILDE (Coordonnateur)Crédits ECTS
5
Langue(s) d'enseignement
français
Contenu du cours
Le cours comprendra les éléments suivants: méthodes et outils divers pour la création d’un corpus textuel, notamment dans le contexte du Web; introduction à Python et NLTK pour la transformation de données; usage de diverses méthodes de type “machine learning”, à la fois supervisées (p. ex. linear regression) et non-supervisées (Word2Vec, Topic Modeling) pour la classification de l’information et l’extraction de concepts.
Objectifs (et/ou acquis d'apprentissages spécifiques)
Fournir à l'étudiant les connaissances conceptuelles et techniques en matière de gestion de corpus textuels numériques.
Méthodes d'enseignement et activités d'apprentissages
Combinaison d'exposés "ex cathedra" et de travaux pratiques.
Contribution au profil d'enseignement
Cet enseignement permet d'appréhender le traitement de corpus structurés et non-structurés de manière automatisée. Il complémente les autres cours du Master en STIC en se focalisant plus particulièrement sur la gestion de larges collections de documents textuels via des méthodes programmatiques.
Références, bibliographie et lectures recommandées
Le support de cours, disponible sur l'UV, propose des références bibliographiques.
Support(s) de cours
- Université virtuelle
Autres renseignements
Contacts
Max De Wilde (max.de.wilde@ulb.be)
Campus
Solbosch
Evaluation
Méthode(s) d'évaluation
- Travail pratique
- Examen oral
- Rapport écrit
Travail pratique
Examen oral
Rapport écrit
Construction de la note (en ce compris, la pondération des notes partielles)
50% pour l'examen oral, et 50% pour les travaux pratiques (y compris le rapport final)
Langue(s) d'évaluation
- français
- (éventuellement anglais )