
Ingénieur Informatique et Statistique
Data Analytics | Data Science | Big Data Intelligence Artificielle | Logiciel

Aujourd’hui, les machines connectées en réseau (ordinateurs, smartphones ou autres…) se comptent en milliards. Les capacités de stockage sont quasi sans limites, et les volumes de données produits augmentent de façon considérable : données scientifiques, médicales, réseaux sociaux, commerce électronique ou encore données collectées par les entreprises (tickets de caisse, enquêtes en ligne…). Stocker, analyser, visualiser ces données, les valoriser, en extraire des connaissances, tels sont les enjeux du Big Data, de l’Intelligence Artificielle et de la Data Science.
La formation IS, équilibrée entre informatique et statistique, forme des ingénieurs capables de répondre à ces nouveaux besoins.
Spécialiste du traitement de l’information, l’ingénieur Informatique et Statistique synthétise et optimise de grands ensembles de données, les analyse, en extrait de la connaissance (data mining, data science, machine learning, text mining, big data, data vizualisation…).
Il met en place des outils d’aide à la décision, de prévision, de gestion des risques dans l’entreprise. Il conçoit et met en œuvre les systèmes d’information des entreprises et conduit des projets logiciels. L’informatique et les statistiques étant des disciplines essentiellement transverses, les secteurs d’activités sont nombreux, principalement dans le tertiaire (banque, assurance, grande distribution, e-commerce, ESN, grands organismes publics…) sans exclure l’industrie.
Les principaux métiers visés par la formation sont : Data Engineer, Ingénieur Big Data, Data scientist, Data Miner, Ingénieur décisionnel, Data Analyst, Ingénieur Statisticien, Ingénieur risque, Ingénieur Informaticien, Chef de projet Informatique...
Spécialité accessible à différents profils de bac +2
DécouvrirCette spécialité est également accessible par la voie de l’apprentissage sur 3 ans
DécouvrirSecteurs d'activité
- Entreprise de Services du Numérique
- Banque, Finance, Assurance
- Grande distribution
- Conseil, cabinets d'études
- Recherche et développement
- Administrations publiques
Recherche
Quatre laboratoires associés :
- CRIStAL - Centre de Recherche en Informatique, Signal et Automatique de Lille
- Laboratoire de mathématiques Paul Painlevé -
- INRIA Lille - Nord Europe - Institut national de recherche en informatique et en automatique
- - Possibilité de poursuite en thèse
Stages
Tout au long de leur cursus, les élèves ingénieurs doivent effectuer des stages en France ou à l’étranger. Leur durée dépend de l’année de l’étudiant en cycle ingénieur.
Projets
L’élève ingénieur s’investit dans des projets concrets pour apprendre son futur métier.
Doubles Diplômes
IAE Lille : Master 2 de Management des Entreprises Technologiques et Industrielles
Ce cursus, se déroulant sur 18 mois, vise à offrir aux élèves ingénieurs en dernière année une formation complète au management stratégique et opérationnel.
Contrat d'apprentissage
L’élève ingénieur sous statut étudiant a aussi la possibilité d’effectuer sa 5e année en contrat d’apprentissage.
Programme
UE 5-1 Fondements Mathématiques
- Objectifs à atteindre :
* Revoir les notions fondamentales de mathématiques (partie 1) - Programme détaillé :
- Raisonnement et logique
- Limites, continuité, dérivation, intégration (sur un segment) [voir le changement de variable puis l'IPP]
- Fonctions exponentielle et logarithme
- Etude de fonctions
- Trigonométrie et nombres complexes
- Suites numériques - Bibliographie :
- Pré-requis :
111110
- Objectifs à atteindre :
* Revoir les notions fondamentales de mathématiques (partie 2) - Programme détaillé :
Partie Analyse
- Intégrales multiples (région bornée) [faire le parallèle avec le changement de variable en 1D]
- Coordonnées polaires
- Développements limités
Partie Algèbre
- Déterminant d'une matrice
- Inversion de matrices
- Résolution de systèmes d'équations linéaires - Bibliographie :
- Pré-requis :
111110|111120
- Objectifs à atteindre :
* Revoir les notions fondamentales de mathématiques (partie 3) - Programme détaillé :
Analyse
- Intégrales généralisées
- Séries numériques et séries entières
- Suites et séries de fonctions
Algèbre
- Espaces vectoriels normés
- Produit scalaire, norme euclidienne, orthogonalité
- Orthonormalisation de Gram-Schmidt
- Projection orthogonale
- Bibliographie :
- Objectifs à atteindre :
* Connaître des outils permettant de dénombrer (arrangements, permutations et combinaisons) des ensembles finis, notamment pour calculer des probabilités dans le cas équiprobable.
* Comprendre la notion d'espace probabilisé et ses propriétés élémentaires. Savoir utiliser le vocabulaire ensembliste pour décrire les événements.
* Comprendre la notion d'indépendance d'événements et savoir calculer des probabilités (conditionnelles) tenant compte d'informations supplémentaires. - Programme détaillé :
1 - Dénombrement
1.1 Introduction
1.2 Vocabulaire ensembliste
1.3 Ensembles finis et dénombrement
1.4 Séries
2 - Espace de Probabilité
2.1 Introduction
2.2 Événement
2.3 Probabilités comme fonction d’ensemble
3 - Conditionnement et Indépendance
3.1 Introduction
3.2 Conditionnement
3.3 Indépendance - Bibliographie :
10 h TD
1 h DS
- Pré-requis :
111140|111130|111250
- Objectifs à atteindre :
* Connaître les notions de variable aléatoire réelle et de loi de probabilité
* Savoir décrire et interpréter la fonction de répartition d'une variable
* Savoir décrire et interpréter les lois des variables discrètes par la fonction de masse et celles des variables continues par la densité
* Connaître les lois usuelles
* Savoir calculer l'espérance et les moments d'une variable
* Connaître la notion de fonction caractéristique d'une variable - Programme détaillé :
1. Définition d'une variable aléatoire (on considère connu la notion de sigma algebre et de probabilité).
2. Types de variables aléatoires : quantitatives, qualitatives.
3. Variables aléatoires réelles discretes et continues.
4. Distribution de probabilité d'une variable aléatoire discrète. Modèles de variables aléatoires discretes (Uniforme, Binomiale, Poisson, Géométrique)
5. Distribution de probabilité d'une variable aléatoire continue (densité). Modèles de variables aléatoires continue (Uniforme, exponentielle, Normale)
6. Fonction de repartition. Propriétés (quantiles, lien avec la densité, transformation d'une v.a.)
7. Caracterisation d'une v.a. : moments d'une variables aléatoires.
8. Propriétés de l'espérance et la variance. Inégalité de Markov. Illustration sur les principaux modèles.
9. Fonction caractéristique
- Bibliographie :
12 h TD
4 h TP
1 h DS
UE 5-2 Fondements Informatique
UE 5-3 Bases de données
UE 5-4 Sciences économiques, Développement Personnel
UE 5-5 Langues
UE 6-1 Probabilités et Statistique
UE 6-2 Aide à la décision
UE 6-3 Informatique
UE 6-4 Projets IS et Communication
UE 6-5 Langues
UE 7-1 Modélisation statistique
- Pré-requis :
112120
- Objectifs à atteindre :
* Savoir réaliser des analyses statistiques multivariées
* Savoir interpréter des résultats d'une analyse mulltivariée
* Avoir conscience du besoin des statistiques multivariées en grande dimension
* Savoir réaliser des applications en R et SPAD - Programme détaillé :
1 Analyse en composantes principales
2 Analyse factorielle des correspondances
3 Analyse des correspondantes multiples
4 Méthode de classification (partitionnement, classification hiérarchique)
5 Analyse discriminante linéaire - Bibliographie :
Gilbert Saporta: Probabilités, analyse des données et statistique (ed. Technip)
18 h TP
1 h DS
- Pré-requis :
112130
- Objectifs à atteindre :
* Savoir établir et évaluer un modèle statistique de classification supervisée
* Savoir réaliser des applications en R - Programme détaillé :
1-Introduction + Rappels sur les tests classiques (Chi2, Cramer, MANOVA)
2-Analyse discriminante factorielle
3-Analyse discriminante probabiliste (homo et hétéroscédastiques)
4-Evaluation des règles (Règle de Bayes, Courbe ROC)
5-Régression Logistique
(6-Forets aléatoires) - Bibliographie :
Gilbert Saporta, Probabilités, analyse de données et statistique (ed. Technip)
2 h TD
10 h TP
1 h DS
- Pré-requis :
112110
- Objectifs à atteindre :
* Savoir modélisation des systèmes dynamiques aléatoires markoviens en temps discret et en temps continu
* Savoir prédire leurs comportements en temps long
* Savoir réaliser des applications
- Programme détaillé :
Chaînes de Markov : définition, exemples et propriétés
Classification des états : classes irréductibles, récurrence et transience, périodicité
Mesures stationnaires et théorèmes limites
Propriétés de la loi exponentielle
Processus de Poisson : définition et propriétés
Processus markoviens de sauts : définition, taux de transition et générateur, mesures stationnaires et théorèmes limites
Files d'attente : notation de Kendall, exemple de la file M/M/1
Étude en projet du comportement en temps long de systèmes markoviens, avec une mise en valeur de ce comportement par des simulations numériques et études statistiques - Bibliographie :
B. Ycart, "Modèles et algorithmes markoviens", Springer, 2002
20 h TD
3 h DS
UE 7-2 Aide à la décision
UE 7-3 Ingénierie logicielle et systèmes d'information
UE 7-4 Sciences économiques, développement personnel
UE 7-5 Langues
UE 8-1 Statistiques et aide à la décision
UE 8-2 Ingénierie logicielle et système d'information
UE 8-3 Projets IS
UE 8-4 Stage
UE 8-5 Langues
UE 9-1 Spécialité IS
- Pré-requis :
112120|113110|113130
- Objectifs à atteindre :
* Savoir modéliser et analyser une série chronologique
* Savoir prédire son comportement
* Savoir réaliser des applications - Programme détaillé :
Description d'une série temporelle
Méthodes de lissages exponentiels
Tendances et saisonnalités
Modélisation séries stationnaires ARMA
Modélisation séries non stationnaires SARIMA
Introduction aux processus ARCH - GARCH - Bibliographie :
* Gourieroux C. et Monfort A. : Cours de Séries Temporelles, Economica.
* Applications réalisées à l'aide du logiciel R.
14 h TP
1 h DS
- Pré-requis :
113340
- Objectifs à atteindre :
* Etre capable de créer une ontologie pour modéliser les concepts et relations d'un domaine de connaissance.
* Savoir utiliser une ontologie pour créer une base de connaissances.
* Savoir manipuler et requêter des données sous forme de graphes. - Programme détaillé :
- Introduction à la notion d'ontologie en informatique et aux bases de connaissances
- Modélisation et création d'ontologie en OWL
- Bases de données graphe, graphes de connaissances - Bibliographie :
1 h DS
- Pré-requis :
113340|114130
- Objectifs à atteindre :
* Connaître les méthodes pour ingérer de la données depuis plusieurs type de source différentes
* Connaître les méthodes de manipulation de données et savoir préparer la données selon l'utilisation finale
* Connaître les différents espaces de stockage de la donnée - Programme détaillé :
Si le Data Engineer ne créer pas directement de la valeur à partir de la données, il n'en ai pas moins un profil essentiel pour toutes les équipe data, car c'est lui/elle qui mets en place les outils et processus techniques nécéssaire à la préparation et la manipulation de la données par les autres corps de métier (Data Scientist, Data Analyst, etc...) des équipes. Les objectifs du module d'initiation à l'ingénierie de la données et d'aborder à la fois théoriquement et pratiquement les grands concepts et outils de ce métier, notamment en abordant les points suivants:
- la récupération de la données : Comment ingérer de la données depuis plusieurs type de source différentes ? Quelle méthode d'ingestion pour quel type de données (ingestion par lot, temps réel, etc...)
- la transformation de la données : Comment manipuler la données pour la standardiser et la préparer aux différentes utilisation en entreprise ?
- le stockage de la données : Comment stocker la données dans des espaces de stockage de type Data Lake et Data Warehouse pour la rendre exploitable pour les autres corps de métiers des équipes data ? - Bibliographie :
10 h TP