Ingénieur Informatique et Statistique

Data Analytics | Data Science | Big Data  Intelligence Artificielle | Logiciel

Benjamin, Directeur de Projet - ADEO Services

Aujourd’hui, les machines connectées en réseau (ordinateurs, smartphones ou autres…) se comptent en milliards. Les capacités de stockage sont quasi sans limites, et les volumes de données produits augmentent de façon considérable : données scientifiques, médicales, réseaux sociaux, commerce électronique ou encore données collectées par les entreprises (tickets de caisse, enquêtes en ligne…). Stocker, analyser, visualiser ces données, les valoriser, en extraire des connaissances, tels sont les enjeux du Big Data, de l’Intelligence Artificielle et de la Data Science.

La formation IS, équilibrée entre informatique et statistique, forme des ingénieurs capables de répondre à ces nouveaux besoins.

Spécialiste du traitement de l’information, l’ingénieur Informatique et Statistique synthétise et optimise de grands ensembles de données, les analyse, en extrait de la connaissance (data mining, data science, machine learning, text mining, big data, data vizualisation…).

Il met en place des outils d’aide à la décision, de prévision, de gestion des risques dans l’entreprise. Il conçoit et met en œuvre les systèmes d’information des entreprises et conduit des projets logiciels. L’informatique et les statistiques étant des disciplines essentiellement transverses, les secteurs d’activités sont nombreux, principalement dans le tertiaire (banque, assurance, grande distribution, e-commerce, ESN, grands organismes publics…) sans exclure l’industrie.

Les principaux métiers visés par la formation sont : Data Engineer, Ingénieur Big Data, Data scientist, Data Miner, Ingénieur décisionnel, Data Analyst, Ingénieur Statisticien, Ingénieur risque, Ingénieur Informaticien, Chef de projet Informatique...

Secteurs d'activité

  • Entreprise de Services du Numérique
  • Banque, Finance, Assurance
  • Grande distribution
  • Conseil, cabinets d'études
  • Recherche et développement
  • Administrations publiques

Programme

UE 5-1 Fondements Mathématiques

90h
ECTS
Vol. Horaire
111100
UE 5-1 Fondements Mathématiques
7
90 h
111110
Remédiation Mathématiques 1
 
  • Objectifs à atteindre :
    * Revoir les notions fondamentales de mathématiques (partie 1)
  • Programme détaillé :
    - Raisonnement et logique
    - Limites, continuité, dérivation, intégration (sur un segment) [voir le changement de variable puis l'IPP]
    - Fonctions exponentielle et logarithme
    - Etude de fonctions
    - Trigonométrie et nombres complexes
    - Suites numériques
  • Bibliographie :



16 h TD
111120
Remédiation Mathématiques 2
 
  • Pré-requis :
    111110
  • Objectifs à atteindre :
    * Revoir les notions fondamentales de mathématiques (partie 2)
  • Programme détaillé :
    Partie Analyse
    - Intégrales multiples (région bornée) [faire le parallèle avec le changement de variable en 1D]
    - Coordonnées polaires
    - Développements limités

    Partie Algèbre
    - Déterminant d'une matrice
    - Inversion de matrices
    - Résolution de systèmes d'équations linéaires
  • Bibliographie :

16 h TD
111130
Bases Mathématiques
3
40 h
  • Pré-requis :
    111110|111120
  • Objectifs à atteindre :
    * Revoir les notions fondamentales de mathématiques (partie 3)
  • Programme détaillé :
    Analyse
    - Intégrales généralisées
    - Séries numériques et séries entières
    - Suites et séries de fonctions

    Algèbre
    - Espaces vectoriels normés
    - Produit scalaire, norme euclidienne, orthogonalité
    - Orthonormalisation de Gram-Schmidt
    - Projection orthogonale
  • Bibliographie :

1 h DS
111140
Probabilités 1
2
20 h
  • Objectifs à atteindre :
    * Connaître des outils permettant de dénombrer (arrangements, permutations et combinaisons) des ensembles finis, notamment pour calculer des probabilités dans le cas équiprobable.
    * Comprendre la notion d'espace probabilisé et ses propriétés élémentaires. Savoir utiliser le vocabulaire ensembliste pour décrire les événements.
    * Comprendre la notion d'indépendance d'événements et savoir calculer des probabilités (conditionnelles) tenant compte d'informations supplémentaires.
  • Programme détaillé :
    1 - Dénombrement
    1.1 Introduction
    1.2 Vocabulaire ensembliste
    1.3 Ensembles finis et dénombrement
    1.4 Séries
    2 - Espace de Probabilité
    2.1 Introduction
    2.2 Événement
    2.3 Probabilités comme fonction d’ensemble
    3 - Conditionnement et Indépendance
    3.1 Introduction
    3.2 Conditionnement
    3.3 Indépendance
  • Bibliographie :




10 h cours
10 h TD
1 h DS
111150
Probabilités 2
2
30 h
  • Pré-requis :
    111140|111130|111250
  • Objectifs à atteindre :
    * Connaître les notions de variable aléatoire réelle et de loi de probabilité
    * Savoir décrire et interpréter la fonction de répartition d'une variable
    * Savoir décrire et interpréter les lois des variables discrètes par la fonction de masse et celles des variables continues par la densité
    * Connaître les lois usuelles
    * Savoir calculer l'espérance et les moments d'une variable
    * Connaître la notion de fonction caractéristique d'une variable
  • Programme détaillé :
    1. Définition d'une variable aléatoire (on considère connu la notion de sigma algebre et de probabilité).
    2. Types de variables aléatoires : quantitatives, qualitatives.
    3. Variables aléatoires réelles discretes et continues.
    4. Distribution de probabilité d'une variable aléatoire discrète. Modèles de variables aléatoires discretes (Uniforme, Binomiale, Poisson, Géométrique)
    5. Distribution de probabilité d'une variable aléatoire continue (densité). Modèles de variables aléatoires continue (Uniforme, exponentielle, Normale)
    6. Fonction de repartition. Propriétés (quantiles, lien avec la densité, transformation d'une v.a.)
    7. Caracterisation d'une v.a. : moments d'une variables aléatoires.
    8. Propriétés de l'espérance et la variance. Inégalité de Markov. Illustration sur les principaux modèles.
    9. Fonction caractéristique
  • Bibliographie :



14 h cours
12 h TD
4 h TP
1 h DS

UE 5-2 Fondements Informatique

114h

UE 5-3 Bases de données

64h

UE 5-4 Sciences économiques, Développement Personnel

72h

UE 5-5 Langues

48h

UE 6-1 Probabilités et Statistique

110h

UE 6-2 Aide à la décision

94h

UE 6-3 Informatique

174h

UE 6-4 Projets IS et Communication

60h

UE 6-5 Langues

48h

UE 7-1 Modélisation statistique

100h
ECTS
Vol. Horaire
113100
UE 7-1 Modélisation statistique
8
100 h
113110
Statistique exploratoire
3
38 h
  • Pré-requis :
    112120
  • Objectifs à atteindre :
    * Savoir réaliser des analyses statistiques multivariées
    * Savoir interpréter des résultats d'une analyse mulltivariée
    * Avoir conscience du besoin des statistiques multivariées en grande dimension
    * Savoir réaliser des applications en R et SPAD
  • Programme détaillé :
    1 Analyse en composantes principales
    2 Analyse factorielle des correspondances
    3 Analyse des correspondantes multiples
    4 Méthode de classification (partitionnement, classification hiérarchique)
    5 Analyse discriminante linéaire
  • Bibliographie :


    Gilbert Saporta: Probabilités, analyse des données et statistique (ed. Technip)
20 h cours
18 h TP
1 h DS
113120
Classification supervisée
2
20 h
  • Pré-requis :
    112130
  • Objectifs à atteindre :
    * Savoir établir et évaluer un modèle statistique de classification supervisée
    * Savoir réaliser des applications en R
  • Programme détaillé :
    1-Introduction + Rappels sur les tests classiques (Chi2, Cramer, MANOVA)
    2-Analyse discriminante factorielle
    3-Analyse discriminante probabiliste (homo et hétéroscédastiques)
    4-Evaluation des règles (Règle de Bayes, Courbe ROC)
    5-Régression Logistique
    (6-Forets aléatoires)
  • Bibliographie :
    Gilbert Saporta, Probabilités, analyse de données et statistique (ed. Technip)
8 h cours
2 h TD
10 h TP
1 h DS
113130
Modèles aléatoires markoviens
3
42 h
  • Pré-requis :
    112110
  • Objectifs à atteindre :
    * Savoir modélisation des systèmes dynamiques aléatoires markoviens en temps discret et en temps continu
    * Savoir prédire leurs comportements en temps long
    * Savoir réaliser des applications
  • Programme détaillé :
    Chaînes de Markov : définition, exemples et propriétés

    Classification des états : classes irréductibles, récurrence et transience, périodicité

    Mesures stationnaires et théorèmes limites

    Propriétés de la loi exponentielle

    Processus de Poisson : définition et propriétés

    Processus markoviens de sauts : définition, taux de transition et générateur, mesures stationnaires et théorèmes limites

    Files d'attente : notation de Kendall, exemple de la file M/M/1

    Étude en projet du comportement en temps long de systèmes markoviens, avec une mise en valeur de ce comportement par des simulations numériques et études statistiques
  • Bibliographie :
    B. Ycart, "Modèles et algorithmes markoviens", Springer, 2002
22 h cours
20 h TD
3 h DS

UE 7-2 Aide à la décision

72h

UE 7-3 Ingénierie logicielle et systèmes d'information

104h

UE 7-4 Sciences économiques, développement personnel

78h

UE 7-5 Langues

42h

UE 8-1 Statistiques et aide à la décision

82h

UE 8-2 Ingénierie logicielle et système d'information

50h

UE 8-3 Projets IS

100h

UE 8-4 Stage

120h

UE 8-5 Langues

42h

UE 9-1 Spécialité IS

62h
ECTS
Vol. Horaire
115100
UE 9-1 Spécialité IS
5
62 h
115110
Séries temporelles
2
24 h
  • Pré-requis :
    112120|113110|113130
  • Objectifs à atteindre :
    * Savoir modéliser et analyser une série chronologique
    * Savoir prédire son comportement
    * Savoir réaliser des applications
  • Programme détaillé :
    Description d'une série temporelle
    Méthodes de lissages exponentiels
    Tendances et saisonnalités
    Modélisation séries stationnaires ARMA
    Modélisation séries non stationnaires SARIMA
    Introduction aux processus ARCH - GARCH
  • Bibliographie :
    * Gourieroux C. et Monfort A. : Cours de Séries Temporelles, Economica.

    * Applications réalisées à l'aide du logiciel R.
10 h cours
14 h TP
1 h DS
115120
Ontologies
1
16 h
  • Pré-requis :
    113340
  • Objectifs à atteindre :
    * Etre capable de créer une ontologie pour modéliser les concepts et relations d'un domaine de connaissance.
    * Savoir utiliser une ontologie pour créer une base de connaissances.
    * Savoir manipuler et requêter des données sous forme de graphes.
  • Programme détaillé :
    - Introduction à la notion d'ontologie en informatique et aux bases de connaissances
    - Modélisation et création d'ontologie en OWL
    - Bases de données graphe, graphes de connaissances
  • Bibliographie :



8 h TP
1 h DS
115130
Ingénierie des données
2
22 h
  • Pré-requis :
    113340|114130
  • Objectifs à atteindre :
    * Connaître les méthodes pour ingérer de la données depuis plusieurs type de source différentes
    * Connaître les méthodes de manipulation de données et savoir préparer la données selon l'utilisation finale
    * Connaître les différents espaces de stockage de la donnée
  • Programme détaillé :
    Si le Data Engineer ne créer pas directement de la valeur à partir de la données, il n'en ai pas moins un profil essentiel pour toutes les équipe data, car c'est lui/elle qui mets en place les outils et processus techniques nécéssaire à la préparation et la manipulation de la données par les autres corps de métier (Data Scientist, Data Analyst, etc...) des équipes. Les objectifs du module d'initiation à l'ingénierie de la données et d'aborder à la fois théoriquement et pratiquement les grands concepts et outils de ce métier, notamment en abordant les points suivants:
    - la récupération de la données : Comment ingérer de la données depuis plusieurs type de source différentes ? Quelle méthode d'ingestion pour quel type de données (ingestion par lot, temps réel, etc...)
    - la transformation de la données : Comment manipuler la données pour la standardiser et la préparer aux différentes utilisation en entreprise ?
    - le stockage de la données : Comment stocker la données dans des espaces de stockage de type Data Lake et Data Warehouse pour la rendre exploitable pour les autres corps de métiers des équipes data ?
  • Bibliographie :


12 h cours
10 h TP

UE 9-2 Options IS - 4 au choix

88h

UE 9-3 Gestion, Management, Communication

75h

UE 9-4 Projet ingénieur

100h

UE 9-4 Contrats Pro - Challenge Entreprendre

35h

UE 9-6 Contrats Pro - Situation de travail formative

22h

UE 9-5 Langues

40h

UE 10-1 Stage

400h

UE 10-2 Contrats Pro - Situation de travail formative

49h

@ Polytech-Lille