Statistique > >Hole-Count
dernière mise à jour : 3/04/2015 09:43:30

Avertissement

Ce programme a été écrit avec Visual Studio 2010.
Il a donc besoin d'un environnement Dot Net correspondant pour être exécuté.

Cette page n'est pas conçue pour être visionnée sur de petits écrans, tels que des téléphones ou smartphones.

Hole-Count

Fonction

Ce programme d'Hole-Count sert à visualiser de manière résumée les données statistiques contenues dans un fichier de données ASCII.

Ses deux principales utilisations en étude de marché sont :

  1. vérifier que la description ou la compréhension de celle-ci correspont bien aux données contenues dans le fichier.
  2. vérifier lors de manipulations des données dans un fichier si les modifications attendues ont été correctement effectuées.

Description

Ce programme effectue des comptages sur un fichier de données sous format ASCII tel que fréquemment utilisé dans les études de marchés. Ce format est souvent préféré à des versions plus "modernes" tel que "XML" pour deux raisons principales :

  1. pour des raisons historiques (certains diront par habitude), ce format est utilisé depuis très longtemps, simple et parfaitement maitrisé.
  2. par gain de place (lorsque l'on traite des centaines de questions et des milliers de répondants, on y fait attention), une ligne d'un fichier XML contenant souvent plus d'informations de description des données que de données.
    Il n'est pas rare d'avoir plus des 3 quarts de l'espace nécessaire pour un enregistrement pris par des informations de description, complétement inutiles car exactement les mêmes que celles de l'enregistrement précédant.

On se retrouve dont souvent avec un fichier de données ASCII et un fichier de description spécifiant quelle information se trouve en quelle colonne.

Ce programme est sensé être exécuté en mode ligne de commande, par exemple au moyen d'un fichier batch tel que "go.bat"

Hct data.dat data.out param.txt

ou :

Hct: le programme à exécuter.
data.dat: le fichier de données à compter.
data.out: le fichier résultat ou écrire les comptages.
param.txt: le fichier optionel de paramétrisation des comptages.

Par défault, le programme prend en compte (comptage de type HCT) toutes les colonnes du fichier de données.

Le fichier de paramétrisation du comptage : param.txt

Le fichier de paramtrisation donné en exemple commence par une zone commentaire qui sert d'aide mémoire pour les encodages futurs.

// 1 2 3 //123456789012345678901234567890123456789 //HCT ddddd lg //TXT ddddd lg nom //MONO ddddd nbmod nom //MULT ddddd nbmod nom //MONONUM ddddd nbmod lgnum nom //MULTNUM ddddd nbmod lgnum nbnum nom //INT ddddd lg nom //REEL ddddd lg nom //WEIGHT ddddd lg univers nom // // ddddd : colonne de debut // nbmod : nombre de modalités // lg : longueur du champs // lgnum : longueur d'une donnée numérique // nbnum : nombre maximum de données numériques

Plusieurs types de comptage peuvent être demandés :

  1. On peut limiter les colonnes prisent en compte en HCT en spécifiant un ou plusieurs compatages Hct.

    Par exemple :

    HCT 40 18
    HCT 62 3
      ou l'on a :
    • le type de comptage
    • la colonne de début
    • le nombre de colonnes à prendre en compte

    Résultat :

    Holes Count (c) Guy Delestienne, Version :1.0.0.0 Total = 50 Col Alpha 0 1 2 3 4 5 6 7 8 9 Blank ------------------------------------------------------------------------------------------------------- 40 | 0,0 15,0 35,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 | 30,0% 70,0% 41 | 0,0 32,2 17,8 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 | 64,4% 35,6%

  2. Une zone texte ou l'on veut compter les occurence des différents textes rencontrés.

    Par exemple :

    TXT 65 3 Essai Texte
      ou l'on a
    • le type de comptage
    • la colonne de début
    • le nombre de colonnes à regarder
    • le nom donné au comptage

    Résultat :

    Holes Count (c) Guy Delestienne, Version :1.0.0.0 Essai Texte Total = 50,00, Colonne 65, longueur 3 : 11,00 non : 23,20 oui : 15,80

  3. Une zone ou est codé un entier ou l'on veut connaître les fréquaence des différents nombres.

    Par exemple :

    INT 68 3 Nom du comptage
      ou l'on a
    • le type de comptage
    • la colonne de début
    • le nombre de colonne à regarder
    • le nom donné au comptage

    Résultat :

    Holes Count (c) Guy Delestienne, Version :1.0.0.0 Premier entier Total = 50,00, Colonne 68, longueur 3 1 : 16,80 2 : 17,60 3 : 15,60

  4. Une zone ou est codé un réel.

    Par exemple :

    REEL 68 3 Nom du comptage
      ou l'on a
    • le type de comptage
    • la colonne de début
    • le nombre de colonne à regarder
    • le nom donné au comptage

    Résultat :

    Holes Count (c) Guy Delestienne, Version :1.0.0.0 Premier reel Total = 50,00, Colonne 68, longueur 3 1 : 16,80 2 : 17,60 3 : 15,60

  5. Une zone ou est codée une question binaire, codée sous une suite de zéro et de 1.

    Par exemple :

    MONO 77 7 Nom du Comptage Libellé de la première Modalité Libellé de la deuxième Modalité Libellé de la troisième Modalité Libellé de la quatrième Modalité Libellé de la cinquième Modalité Libellé de la sixième Modalité Libellé de la septième Modalité
      ou l'on a
    • le type de comptage
    • la colonne de début
    • le nombre de colonne à regarder qui équivaut au nombre de modalités
    • le nom donné au comptage

    Suivi d'une ligne par modalité avec le libellé à utiliser pour celle-ci.

    Dans le cas d'une binaire mono (une seule réponse par personne interrogée, le type de comptage sera MONO.
    Dans le cas d'une binaire multi (plusieurs réponses possible par personne interrogée, le type de comptage sera MULT.

    Résultat :

    Holes Count (c) Guy Delestienne, Version :1.0.0.0 Question binaire : Teste Mono Total = 50,00, Colonne : 77, Nombre de modalité(s) : 7 Modalite1 : 6,20 12,40% Modalite2 : 5,60 11,20% Modalite3 : 16,60 33,20% Modalite4 : 5,20 10,40% Modalite5 : 8,40 16,80% Modalite6 : 3,80 7,60% Modalite7 : 4,20 8,40%

  6. Une question binaire multi, ou les réponses sont codées sous une suite des numéros correspondant aux modalités auxquelles le personne interrogée a répondu.

    Par exemple :

    MULTNUM 68 7 3 3 Nom du comptage Libellé de la première Modalité Libellé de la deuxième Modalité Libellé de la troisième Modalité Libellé de la quatrième Modalité Libellé de la cinquième Modalité Libellé de la sixième Modalité Libellé de la septième Modalité
      ou l'on a
    • le type de comptage
    • la colonne de début
    • le nombre de modalités
    • la longueur d'une réponse numérique donnée
    • le nombre max de réponses numériques
    • le nom donné au comptage

    Suivi d'une ligne par modalité avec le libellé à utiliser pour celle-ci.

    Résultat :

    Holes Count (c) Guy Delestienne, Version :1.0.0.0 Question binaire : Teste MultiNum Total = 50,00, Colonne : 68, Nombre de modalité(s) : 7 Modal1 : 16,80 33,60% Modal2 : 28,80 57,60% Modal3 : 23,80 47,60% Modal4 : 18,60 37,20% Modal5 : 19,40 38,80% Modal6 : 32,20 64,40% Modal7 : 0,00 0,00%

  7. Une question binaire mono, codée sous forme d'une numérique.

    Par exemple :

    MONONUM 68 7 3 Nom du comptage Libellé de la première Modalité Libellé de la deuxième Modalité Libellé de la troisième Modalité Libellé de la quatrième Modalité Libellé de la cinquième Modalité Libellé de la sixième Modalité Libellé de la septième Modalité
      ou l'on a
    • le type de comptage
    • la colonne de début
    • le nombre de modalités
    • la longueur d'une réponse numérique donnée
    • le nom donné au comptage

    Suivi d'une ligne par modalité avec le libellé à utiliser pour celle-ci.

    Résultat :

    Holes Count (c) Guy Delestienne, Version :1.0.0.0 Question binaire : Teste MonoNum Total = 50,00, Colonne : 68, Nombre de modalité(s) : 7 Modal1 : 16,80 33,60% Modal2 : 17,60 35,20% Modal3 : 15,60 31,20% Modal4 : 0,00 0,00% Modal5 : 0,00 0,00% Modal6 : 0,00 0,00% Modal7 : 0,00 0,00%

  8. Ici ce n'est pas vraiment un comptage, mais une modification de la méthode de comptage, en effet le comptage effectué en pondéré avec la commande suivante:

    Par exemple :

    WEIGHT 87 4 50 Nom de l'univers
      ou l'on a
    • le type de comptage
    • la colonne de début
    • la longueur
    • l'univers vers lequel extrapoler
    • le nom de cet univers

Ceci termine les possibilités de paramétrage des types de comptage, et cela permet déjà bien de visualiser le contenu d'un fichier de données ASCII tel que souvent rencontré dans les échanges de données classiques dans le mondes des études de marché.

Adaptation des sorties

Les textes utilisés dans les sorties de résultat ou lors de messages d'erreur éventuels peuvent être adapté à la langue de l'utilisateur en traduisant le contenu du fichier "Hct.ini".
La préférence a été donnée à un fichier de paramétrage au format 'INI' par rapport à de l'XML car celui-ci est plus facilement compréhensible par un utilisateur lambda qui n'est pas forcément issu du monde informatique. Le format bien que plus limité que l'XML est plus que suffissant pour l'introduction de quelques libellés.

Le fichier comprend quatres sections :

General
Presque vide contient juste le nom du programme
Words
Les libellés de texte utilisés dans les sorties de résultat, c'est une des deux sections à traduire si besoin.
Formats
Les formats utilisés lors des sorties de résultat. Réservé aux experts, mieux vaut ne pas y toucher.
Errors
Les messages d'erreurs pouvant être détectées par le programme, c'est la deuxième section à traduire si besoin.

Téléchargement

le fichier comprimé contient les fichiers suivants :

Data.dat: un très petit fichier de données pour tester le programme
data.out: le résultat de l'exécution du programme
go.bat: un exemple de fichier "batch" de lancement du programme
Hct.exe: le petit programme en question
Hct.exe.config: un petit copain qui va avec l'exe
Hct.ini: le fichier ini pour les libellés
Hct.log: un fichier log de messages sortis par le programme
Lisez-moi.txt: un petit résumé des explications
param.txt: un exemple de paramétrage de type de comptage

Pour télécharger le programme c'est ici --->>>Fichier comprimé (zippé)<<<---

Testé sous Firefox
©Guy Delestienne
V3.2 (Mars 2015)