Statistiques d'utilisation xo : Différence entre versions

De OLPC France Wiki
Aller à : navigation, rechercher
(Développement !)
(draft)
Ligne 1 : Ligne 1 :
 
= Objectif =
 
= Objectif =
L'objectif de ce projet est avant tout d'analyser l'utilisation des XO à Nosy Komba. Le XS récupère les données de chaque XO, contenant la date de dernière utilisation de chaque activité.
+
L'objectif de ce projet est avant tout d'analyser l'utilisation des XO mais aussi des activités Sugar à Nosy Komba.
  
 
Aucune information personnelle ne sera disponible, hormis les date de dernière utilisation des différentes activités. Il est tout à fait possible de relier ses données à des numéros de XO et non pas à des nom d'élèves.
 
Aucune information personnelle ne sera disponible, hormis les date de dernière utilisation des différentes activités. Il est tout à fait possible de relier ses données à des numéros de XO et non pas à des nom d'élèves.
  
Les données doivent permettre de visualiser rapidement l'utilisation des XO afin de se rendre compte de problème d'utilisation (alimentation électrique ?) ou au contraire, pour vérifier que les ordinateurs sont exploités au maximum.
+
D'un côté il est intéressant d'obtenir ces statistiques, d'un autre les production effectives des élèves peuvent servir aux enseignants.
 +
Nous différencions ce projet en 4 étapes :
 +
 
 +
# générer les sauvegardes. Ceci peut être fait à la main (2010 te 2011) ou par le serveur XS. (TODO link). Ces sauvegardes génèrent une archive contenant le journal Sugar et les données associées ;
 +
# passer les archives à la Moulinette qui nous sortira les productions des élèves au bon format d'un côté, et les statitiques dans un format facilement utilisable (CSV) ;
 +
# traitement du fichier brut CSV généré à l'étape précédente avec un outil plus approfondit pour génerer des graphiques et autres (feuille de calcul, R…) ;
 +
# retour d'expérience afin d'améliorer l'étape 1, pourquoi pas en ajoutant un log de démarrage des XO pour connaître leur temps d'utilisation.
 +
 
 +
= Générer les sauvegardes =
 +
 
 +
 
 +
= Passer les archives à la Moulinette =
 +
 
 +
 
 +
= Traitement du fichier brut =
 +
 
 +
= Retour d'expérience =
 +
'' Prochain retour en septembre ''
 +
 
  
'''Le projet doit être terminé pour le ???'''
 
  
 
= Propositions de solution =
 
= Propositions de solution =

Version du 25 février 2012 à 09:20

Objectif

L'objectif de ce projet est avant tout d'analyser l'utilisation des XO mais aussi des activités Sugar à Nosy Komba.

Aucune information personnelle ne sera disponible, hormis les date de dernière utilisation des différentes activités. Il est tout à fait possible de relier ses données à des numéros de XO et non pas à des nom d'élèves.

D'un côté il est intéressant d'obtenir ces statistiques, d'un autre les production effectives des élèves peuvent servir aux enseignants. Nous différencions ce projet en 4 étapes :

  1. générer les sauvegardes. Ceci peut être fait à la main (2010 te 2011) ou par le serveur XS. (TODO link). Ces sauvegardes génèrent une archive contenant le journal Sugar et les données associées ;
  2. passer les archives à la Moulinette qui nous sortira les productions des élèves au bon format d'un côté, et les statitiques dans un format facilement utilisable (CSV) ;
  3. traitement du fichier brut CSV généré à l'étape précédente avec un outil plus approfondit pour génerer des graphiques et autres (feuille de calcul, R…) ;
  4. retour d'expérience afin d'améliorer l'étape 1, pourquoi pas en ajoutant un log de démarrage des XO pour connaître leur temps d'utilisation.

Générer les sauvegardes

Passer les archives à la Moulinette

Traitement du fichier brut

Retour d'expérience

Prochain retour en septembre


Propositions de solution

Apparement, il y a deux méthodes d'enregistrement des journaux.

  • Quels sont les données sauvegardées par le XS ? Conservation du propriétaire des fichiers pour identification de l'XO (sinon, revoire le rsync ou le cp..) ?

Format des données à exploiter

Sur les XO récents (ou OS mis à jour), le datastore qui contient les informations utiles est sous cette forme. Chaque répertoire correspond à une activité particulière (le nom est haché, ~aléatoire), dans lequel on trouve le répertoire qui nous intéresse, metadata. Ce qui nous intéresse au minimum :

  • timestamp correspond à la date de dernière utilisation (format timestamp, le nombre de secondes passées depuis le 01/01/1970).
  • title est le nom de l'activité
  • filesize est la taille des données enregistrées dans cette activité (là je m'avance, à vérifier). Ça évite de prendre en compte une activité qu'on ouvre mais dont on ne se sert pas.


Dans l'archive envoyée par françois, tout est dans des dossier dont le nom correspond à un timestamp. C'est juste ?


Note : si on ne se base que sur la date d'utilisation des dernières activités, on ne peut pas être certain qu'elles n'ont pas été utilisée avant.. Si tous font la même chose, nos stats deviennent incorrectes.

Voir sauvegarde d'un log de démarrage/extinction afin de connaitre également la durée d'utilisation (/var/log, attention log rotatif, gérer les sauvegardes en fonction).

Idées de réalisation

Plusieurs choix possibles, ajoutez votre idée, nous trierons ensuite.

Centralisation des données

  • Ajout de toutes les données dans une base de donnée sur le XS, exploitation ensuite
  • Traitement de toutes les données dans un fichier brut format ASCII pour exploitation ensuite (CSV ou autre)

Exploitation des données

  • Au format qui va bien pour exploitation avec l'outil de statistiques R
  • Au format Open Document pour visualisation avec Excel ou équivalent (corréler les données et créer des graphique doit être possible sans trop de problème)
  • Au format HTML ou PDF
  • Au format brut ASCII pour qu'une personne courageuse fasse du copier coller dans un tableau Excel... (CSV ou autre)
  • CSV pour les intégrer dans un tableau sur org-mode puis export HTML et traitement R => tuto

Au final, on devrait pouvoir corréler les données pour voir quand sont utilisés les XO, combien simultanément, quelles activités simultanément (on suit le professeur, on travaille sur ce qu'il nous demande), tris suivant les horaires (école/maison)). Combien de temps le xo a été utilisé sur une année, par mois, par semaine... Quelles-sont les activités les plus utilisées (passé le plus de temps).

Développement !

(à venir une fois qu'on aura choisi la solution...)

à reprendre (gestion de backup + création d'un fichier de données)--Shaiton 1 décembre 2011 à 13:58 (PST)

Ressource

http://wiki.laptop.org/go/Journal_Entries

http://en.flossmanuals.net/make-your-own-sugar-activities/ch019_fun-with-the-journal/

http://git.paraguayeduca.org/gitweb/users/rgs/xs-scripts.git?js=1 (stats pour 0.84)