Introduction

Les données collectées ici concernent une population de 768 femmes. Une étude statistique sur les différents paramètres liés à la maladie de diabète va permettre de caractériser cette dernière et de déterminer une meilleure façon de prévention.

Problématique

  1. Comment les différents facteurs, génétiques, immunitaires, physiologiques ou environnementaux interviennent-ils dans le développement du diabète ?
  2. Après avoir analysé les données dont je dispose, une autre approche à caractère prévisionnel a été réalisée. Il s'agit alors de formuler un critère permettant de prédire pour une femme donnée, dont on a mesuré les différents indices, a ce que on peut prévoir le diagnostic.

Méthodes statistiques

J’ai recherché, une fonction discriminante linéaire permettant d'estimer les probabilités avec lesquelles la variable qualitative diagnostic prend chacune de ses modalités (positif et négatif) en fonction des autres variables quantitatives. Analyse préliminaire des données Pima Indians

  1. Analyse discriminante


* Méthode des moments

  • Méthode de validation croisée
  • Méthode des Maximum de
  • Vraisemblance (MVE)

Logiciel Logiciel R