Définition

Données et informations

  • Données : Toute observation recueillie à propos d’une caractéristique ou d’un événement s’appelle une donnée.
  • Information
  • Les données brutes n’ont que peu de sens lorsqu’elles sont considérées isolément.
  • Les données sont minimisées : traitées/analysées, puis présentées de manière systématique.
  • Elles sont converties en informations.
  • Les données qui ne sont pas converties en informations ont peu de valeur pour l’évaluation et la planification et ne peuvent pas être utilisées par les personnes impliquées dans la prise de décision. être utilisées par les personnes impliquées dans la prise de décision.

Les données de classification peuvent être divisées en deux types

  • Les données quantitatives (numériques (intervalle, ratio)) ;
  • les données qualitatives (descriptives (), catégoriques/comptes de fréquence (nominales, ordinales)).

Nettoyage des données La qualité des données est un problème majeur qui se pose partout dans les systèmes d’information. Ces problèmes peuvent être résolus par le nettoyage des données :

  • est un processus utilisé pour déterminer les données inexactes, incomplètes ou déraisonnables
  • et d’en améliorer la qualité en corrigeant les erreurs détectées.
  • réduit les erreurs et améliore la qualité des données. Le nettoyage des données peut être un processus long et fastidieux, mais il ne peut être ignoré. Critères de qualité des données :
  • exactitude, intégrité, exhaustivité, validité, cohérence, unicité

Analyse en python