Plan de l'article
Méthodologie : espérance de vie et courbe de survie
1. Espérance de vie en minutes
Méthodologie : espérance de vie et courbe de survie
Calculer l'espérance de vie en années des personnages ? « Pfff, trop classique » vous répondront-ils. Ils ont en effet l’objectif de calculer une espérance de vie en minutes (durée de vie moyenne entre la minute d'apparition du personnage et l’éventuelle minute où celui-ci décède). S’ils y parviennent, ils pourraient ainsi dire qu’un personnage de Game of Thrones peut espérer survivre x minutes. Mieux ! Ils pourraient décliner le calcul selon les caractéristiques des personnages (« un personnage masculin peut espérer survivre x minutes de plus qu’un personnage féminin »).
Mais comment calculer l’espérance de vie ?
Prenons l’exemple des six personnages suivants : Robb Stark
proba décès :
99%, Daenerys Targaryen
proba décès :
17%, Stannis Barathéon
proba décès :
99%, Brienne de Tarth
proba décès :
0%, Loras Tyrell
proba décès :
94% et Euron Greyjoy
proba décès :
66% (Fig. 1).
Bien sûr, ces personnages ne sont pas représentatifs de l'ensemble des personnages nommés : faisant partie des personnages principaux ils sont très loin du personnage normal et peu connu (en plus Brienne est beaucoup trop cool).
Trois d’entre eux décèdent : Robb, Stannis et Loras – pardon de vous rappeler que nous ne reverrons jamais plus les fesses de Robb. Chronomètre en main, voici les résultats obtenus par les auteurs pour ces six personnages (Fig. 2).
Pour calculer la durée de vie moyenne de ces six personnages, certains seraient tentés de faire une moyenne toute simple : en moyenne, ces six personnages vivent 37h et 30min. Pas faux mais cela serait trop facile… et surtout trop biaisé ! La faute d'Euron Greyjoy (entre autres). Celui-ci n’a en effet fait son entrée dans la série qu'à la sixième saison. Par conséquent, il n'a survécu qu’à deux saisons. Est-il donc juste de dire que son espérance de vie était faible ? Non. Et d'ailleurs, à cause de lui, la moyenne est biaisée car tirée vers le bas.
Vous l'aurez compris (et si ce n'est pas le cas on vous l'affirme) le calcul de la durée moyenne de survie est compliqué par le fait que l'on est incapable d'observer les personnages sur une même durée (ça aurait été vachement cool de suivre Lyanna Mormont
proba décès :
16% pendant 67 épisodes). Alors comment faire ?
Faisons comme si tous les personnages étaient apparus en même temps dans la série. On dit que l’on « synchronise les horloges » (Fig. 3).
Accrochez-vous, vous avez fait le plus dur... Ou presque.
Reprenons l'exemple d’Euron Greyjoy. Nous ne savons pas ce qu'il advient de lui après 17 épisodes. C'est là que le modèle de durée non paramétrique intervient (de son petit nom... Kaplan-Meier).
Une fois les horloges synchronisées, le modèle permet d’appliquer à Euron les risques de mourir de Loras, Robb, Daenerys, et de Brienne que l'on suit durant plus de 17 épisodes. Le modèle est donc en mesure d’estimer les risques qu’a un personnage de mourir compte tenu de ce que nous avons observé chez d’autres personnages. Les sept premières saisons de Game of Thrones durent 65 heures. Passée cette durée, il nous est impossible d'appliquer ce modèle puisqu'aucun personnage n’est observé plus longtemps.
Mais finalement, quel genre de résultat obtient-on ? Celui-ci par exemple : l’espérance de vie des personnages féminins est de 29 heures contre 22 heures et 30 minutes pour les personnages masculins. Ces quelques chiffres ne vous suffisent pas ? N'hésitez pas à consulter le dossier de « suivi des biographies »Cliquez ici accéder aux dossiers universitaires qui en regorge !
Vous êtes-encore là vous ? Coriaces... Nous allons tenter de vous assommer définitivement.
Donc, l’espérance de vie ça vous parle maintenant. Par contre, les courbes de survie que vous avez croisées sur notre site (dossier de « suivi des biographies »Cliquez ici accéder aux dossiers universitaires, dossier « cohorte »Cliquez ici accéder aux dossiers universitaires, l'article « Une cohorte plus à l'abri ? », dictionnaire des variables) ça, vous ne connaissez pas encore. Normal, on entre encore un peu plus dans la tambouille du démographe !
Rien de tel qu'un exemple.
Tout à l’heure, nous avons calculé un risque de mourir pour chaque heure de survie (mais siiiiii, grâce au modèle de Kaplan-Meier).
La courbe de survie découle de ce premier calcul. Pour comprendre la courbe de survie, il faut faire comme si nous suivions dès la première minute (synchronisation des horloges oblige) 1.000 personnages masculins et 1.000 personnages féminins. Et après ? Bah, c’est simple ! On fait ce que l’on fait de mieux ! On regarde les personnages mourir les uns après les autres en mangeant du pop-corn.
Concrètement, comment se passe le calcul ? Si je vous dis qu’un personnage féminin a 30% de risque de mourir au cours des 15 premières heures de survie, combien de morts cela fait-il ? 30% de risque de mourir fois 1.000 personnages = 300 personnages féminins en moins sur les 15 premières heures ! Après 15h, il ne reste donc plus que 700 survivantes théoriques (Fig. 4). Au passage, nous parlons de survivants théoriques car nous partons de 1.000 personnages fictifs. Mais ça, c’est de la poésie !
Alors ça y est, vous l’avez ? Un dernier calcul pour en être certain. Au cours des 15 heures de survie qui suivent, un personnage féminin a 43% de risque de mourir. 43% fois 700 personnages encore en vie = 300 morts supplémentaires entre la quinzième et la trentième heure de survie (voir Fig. 4).
Voilà, vous avez compris ! Maintenant il ne vous reste plus qu’à vous amuser en comparant les courbes de survie des personnages féminins et des personnages masculins. Sur la première heure de survie, la différence de mortalité est impressionnante : 8% des personnages féminins décèdent (il reste environ 920 survivantes) contre plus de 20% des personnages masculins (il reste 800 survivants).
Mais à la trentième heure de survie, il reste quasiment autant de personnages masculins que de personnages féminins. Les courbes de survie nous renseignent donc bien sur l’évolution des risques de mortalité dans le temps.
Afin de déterminer si deux courbes de survie sont différentes entre elles, nous nous appuierons sur la statistique du LogRank et celle de Wilcoxon. Que de noms aussi barbares que les Dothrakis ! Si les auteurs se gardent bien de vous expliquer ces tests, c’est parce qu’ils ne les comprennent pas dans le détail. Ils se contentent d’étudier le résultat calculé par l’ordinateur. Celui-ci sort un pourcentage qui est le risque à prendre pour rejeter l’égalité entre les courbes de survie. Par exemple, si le risque est de 4%, on peut affirmer que les courbes de survie sont différentes : juré craché, nous en sommes certains… Avec un doute de 4% ! Pour différencier ou non les courbes, le test de Wilcoxon accorde plus d’importance aux décès précoces. Il nous sera utile puisque de nombreux personnages décèdent rapidement dans Game of Thrones.
Ce modèle non paramétrique a toutefois une limite majeure. Il se concentre sur l’impact des modalités d’une variable (personnage masculin/féminin) sans prendre en compte l’influence potentielle d’autres variables (les personnages masculins sont en proportion plus souvent des combattants tandis que les personnages féminins sont plus souvent des prostituées : on parle d’effets de composition). Pour une analyse plus fine, l’emploi de régressions logistiquesCliquez ici pour en savoir plus sur cet outil mathématique dont Romane est amoureuse est alors nécessaire.
Nous pouvons juger que certaines variables prédéterminent le futur des personnages : un personnage qui a trahi a dû vivre en moyenne plus longtemps pour le faire (de la même manière pour un personnage qui a tué par exemple). Le personnage ne vit pas longtemps parce qu’il a tué ou trahi mais il a tué ou trahi parce qu’il en a eu le temps et parce qu’il a vécu longtemps (Fig. 5).
Ainsi, nous ne pouvons analyser correctement de telles courbes de survivants car celles-ci n’ont pas de sens. En effet, la démarche est aussi absurde que celle d’un démographe qui ferait deux courbes de survie : une pour les personnes qui ont vécu en maison de retraite, une pour celles qui n’y sont jamais allées. Il en résultera automatiquement que les personnes qui sont allées en maison de retraite dans leur vie auront une espérance de vie plus longue mais quel sens donner à ce résultat ? Est-ce que Théo, 5 ans, n'a vécu que 5 ans parce qu'il n'est pas allé en EHPADUn EHPAD est un établissement d'hébergement pour personnes âgées dépendantes dédié à l'accueil des personnes en perte d'autonomie.. Mais non, gros béta ! Il n'est pas allé en EHPAD parce qu'il a la vie devant lui...
Par contre les variables prédéterminées pourront être exploitées dans les régressions logistiques. Celles-ci permettent en effet de contrôler l’épisode de vie du personnage : à épisode de vie égal, avoir trahi ou tué impacte-t-il la survie au cours d’un épisode ?
Modèle Logit | Modèle Kaplain-Meier | |
Régression logistique | Espérance de vie | Courbes de survie |
« Si personnages féminins et personnages masculins avaient les mêmes caractéristiques, auraient-ils un risque de décéder différent ? » | « Combien de temps un personnage survit-il en moyenne à partir de son apparition à l’écranOn peut aussi le faire à partir du début de la série (espérance de vie telle qu’elle est calculée dans l’article « Devenir démographe grâce à GoT : l’espérance de vie) ou du début de sa vie (espérance de vie comme le calcule l’INSEE). ? » | « Comment varient les risques de décès des personnages au cours du temps ? » |
Calcule des Odds Ratios qui permettent d’établir les liens « purs » entre les modalités d’une variable et le risque de mourir toutes choses égales par ailleurs. Calcule une probabilité de décès pour chaque personnage. | Calcule une durée de survie moyenne pour des groupes d’individus. Limite : ne tient pas compte des effets de composition |
Trace une courbe de survie pour des groupes d’individus qui permet de suivre l’évolution des risques de décès au cours du temps. |
Alberti, C. et all (2005). « Analyse de survie : le test du logrank ». [En ligne] : http://www.biomedicale.parisdescartes.fr/enseignement/toxico/M2THERV_2013_2014/documents/C1/Roudot%20logrank.pdf [Consulté le 13 avril 2018]
Laporte, S. (2005). « Comment lire une courbe de survie ? ». In : mt, vol. 11, n° 6, pp419-423. [En ligne] : https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=2ahUKEwiN7YT05uLfAhXt0eAKHfgaCZMQFjAAegQIChAB&url=http%3A%2F%2Fwww.jle.com%2Fen%2Frevues%2Fmet%2Fe-docs%2Fcomment_lire_une_courbe_de_survie__267528%2Farticle.phtml%3Ftab%3Ddownload%26pj_key%3Ddoc_attach_2917&usg=AOvVaw2QvD6gXnA0ndIs1sbPqndd [Consulté le 18/04/2018]
Dans nos articles, et dans ceux d'autres études, nous étudions le temps de survie des personnages en minutes. L'évènement étudié est la mort. On peut ainsi montrer que, dans Game of Thrones, les personnages dont nous avons recensé un handicap survivent significativement plus longtemps et en plus grand nombre que les autres. (vous ne le saviez pas ? Cliquez ici pour le voir de vos propres yeux !). Mais nous pouvons également étudier la survie à d'autres événements que la mort et selon d'autres caractéristiques que le handicap. Comme par exemple :
Le temps de survie à la reprise de l'emploi (c'est-à-dire le temps que mettent les individus à retrouver un emploi) selon la durée d’indemnisation du chômage pour les chômeurs de plus de 45 ans : Amable, B. et, Françon, B. (2015) « Quels effets des baisses de durée d’indemnisation sur la durée de chômage et le type d’emploi repris ? Le cas des lois Hartz ». In : Travail et emploi, (n° 142), p. 85-98. [En ligne] : https://www.cairn.info/revue-travail-et-emploi-2015-2-page-85.htm [Consulté le 11 décembre 2018]
Survie à l'évènement « réhospitalisation » selon des caractéristiques individuelles : Plancke, L., Amariei, A., Flament, C. et al. (2017) « La réhospitalisation en psychiatrie. Facteurs individuels, facteurs organisationnels ». In : Santé Publique, (Vol. 29), p. 829-836. DOI : 10.3917/spub.176.0829. [En ligne] : https://www.cairn.info/revue-sante-publique-2017-6-page-829.htm [Consulté le 11 décembre 2018]
Pour voir d'autres études qui ont mené des modèles de durée sur le sujet de Game of Thrones, cliquez ici. Sinon, vous pouvez rester sur notre site :
Beaufort, R. et Melissent, L. (2018). « Dictionnaire des variables ». In : When demographers play the Game of Thrones. [En ligne] : https://www.demographie-got.com/dico_var.html [Consulté le 18 novembre 2018]
Beaufort, R. et Melissent, L. (2018). « Une cohorte plus à l'abri ? ». In : When demographers play the Game of Thrones. [En ligne] : https://www.demographie-got.com/r_cohorte.html [Consulté le 18 novembre 2018]
Beaufort, R. et Melissent, L. (2018). « Dossier de suivi de biographies ». In : When demographers play the Game of Thrones. [En ligne] : https://www.demographie-got.com/pdf_site/dossiers/dossier_biographie.pdf [Consulté le 18 novembre 2018]
Beaufort, R. et Melissent, L. (2018). « Qui du Lion, du Loup ou du Dragon meurt le plus ? ». In : When demographers play the Game of Thrones. [En ligne] : https://www.demographie-got.com/r_all.html [Consulté le 18 novembre 2018]
Beaufort, R. et Melissent, L. (2018). « Devenir un démographe grâce à GoT : les courbes de survie ». In : When demographers play the Game of Thrones. [En ligne] : https://www.demographie-got.com/demo_courbes.html [Consulté le 18 novembre 2018]
Beaufort, R. et Melissent, L. (2018). « Devenir un démographe grâce à GoT : l'espérance de vie ». In : When demographers play the Game of Thrones. [En ligne] : https://www.demographie-got.com/demo_ev.html [Consulté le 18 novembre 2018]