Intelligence Artificielle

Contrôler la qualité d'un modèle prédictif

Imaginons la conception d'un modèle prédictif H de classification des tumeurs cancéreuses en fonction de la taille de la tumeur et de l'âge du patient.

H est une fonction mathématique prenant en argument deux paramètres: t et a: où

  • t = taille de la tumeur
  • a = âge du patient,

et renvoie la probabilité H(t,a) que le patient soit atteint d'un cancer.

Un patient sera prédit cancéreux si h(t,a) >= 0.5 et non cancéreux si h(t,a) < 0.5.

L'idée de l'apprentissage supervisé (supervised learning)

Imaginons que nous disposions d'une grande série de données sur les élèves scolarisés en an 2000, dans laquelle il est indiqué s'ils ont réussi leur examen final.
Il nous parrait bien naturel de tenter de lier les résultats scolaires de ces élèves à leur réussite, mais imaginons que nous tentions d'étudier l'influence de la catégorie socio-professionnelle de leurs parents et de leurs établissements de scolarisation sur leur réussite:

Série étudiée:

Estimations par régression linéaire et polynômiale

Régression Linéaire

Supposons que nous disposions des chiffres d'affaire bi-mensuel d'une entreprise constatés au cours des 5 derniers mois.

Nous cherchons une bonne estimation du C.A. les mois suivants

La régression linéaire est un modèle prédictif consistant à déterminer l'évolution linéaire "la plus proche" des relevés déjà obtenus, et d'en déduire une prédiction lors des mois à venir.