Demande #3929
ferméAméliorer/fiabiliser les statistiques des podcasts des émissions Libre à vous !
0%
Description
Questionnements¶
- Les statistiques proposés par Awstats pour les podcasts de « Libre à vous ! » sont-il « fiables » (correspondent-ils à une réalité de téléchargement) ?
- Si oui, mettre en place un outil (script ou autre) pour afficher les statistiques des podcasts ?
- Si non, mettre en place un outil de statistiques dédié ?
La page suivante explique la problématique des statistiques de podcast et une solution mise en place http://ewr.is/2015/07/1815-computing-podcast-stats-with-elasticsearch
Podcasts Libre à vous !¶
Les podcasts de l'émission « Libre à vous ! » sont hébergés sur https://media.april.org/audio/radio-cause-commune/libre-a-vous/emissions/ (VM lamp) au format OGG et MP3. Pour chaque émission il y a un podcast pour l'émission complète et un podcast par sujet traité.
Les logs du serveur web nginx (le frontal) se trouvent sur bastion dans /var/log/nginx/media.april.org/
Comme c'est du streaming, un grep des logs du serveur web ne donne pas un résultat fiable (il y a visiblement peut être plusieurs hits pour un même visionnage). Il y a aussi la question problématique des robots d'indexation.
L'outil de statistiques web est awstats. L'accès web se fait sur https://stats.april.org/awstats.media.april.org.downloads.html L'accès aux fichiers texte d'awstats sur fait sur bastion dans /var/lib/awstats les fichiers étant nommés awstatsMMAAAA.media.april.org.txt où MM correspond au mois en chiffre et AAAA à l'année.
Awstats indique le nombre de downloads complets et les partial downloads (appelés « 206 hits »). J'ai trouvé une vidéo "What's the Difference Between Hits and 206 Hits in AWStats in Cpanel" https://www.youtube.com/watch?v=7vTHiBRD-u4 qui explique ça.
Exemple :
grep 'audio/radio-cause-commune/libre-a-vous/emissions/20191008/libre-a-vous-20191008.*\.\(ogg\|mp3\) ' awstats102019.media.april.org.txt
La première ligne affichée est (le premier nombre correspond aux downloads complets, le second aux downloads partiels, le troisième au nombre d'octets transférés) :
/audio/radio-cause-commune/libre-a-vous/emissions/20191008/libre-a-vous-20191008-logiciel-libre-et-seniors-alain-casier-et-claude-guedj.ogg 981 356 3754419331