GLM
3 participants
La Doua Dans l'Oeil :: Biologie :: Biométrie & Bioinformatique :: Questions & Débats :: Modélisations
Page 1 sur 1
GLM
Quelle est la différence entre le modèle linéaire et le modèle linéaire généralisé?
tania- Bavard
- Nombre de messages : 77
Age : 40
Niveau et domaine de formation : master 2 écologie évolution biométrie
Etablissement : ucbl
Date d'inscription : 27/10/2007
Re: GLM
Salut tania,
Si tu as des questions sur les glms il est plus simple de passer au labo je te donnerais les explications dont tu as besoin.
Le thésard du bureau d'en face
Si tu as des questions sur les glms il est plus simple de passer au labo je te donnerais les explications dont tu as besoin.
Le thésard du bureau d'en face
nik- Bavard
- Nombre de messages : 57
Niveau et domaine de formation : Doctorat Ecologie
Etablissement : UCB Lyon1
Date d'inscription : 22/09/2008
Re: GLM
Je ne pense rien t'apprendre, mais la conversation peut se lancer et d'autres completeront ce post...
Le modèle linéaire général est utilisable si la variable à expliquer suit une loi normale,
Si celle-ci suit une autre loi de distribution (binom, poisson, gamma...) on doit alors généraliser en linéarisant la variable à expliquer.
C'est bien ça ou je n'ai rien compris ?
Le modèle linéaire général est utilisable si la variable à expliquer suit une loi normale,
Si celle-ci suit une autre loi de distribution (binom, poisson, gamma...) on doit alors généraliser en linéarisant la variable à expliquer.
C'est bien ça ou je n'ai rien compris ?
Re: GLM
Donc tania, pour lancer la discussion
Il n'y a pas de différence entre un lm et un glm, tout simplement car le second est la généralisation du premier. Un lm est un glm dont la variable prédite suit une loi normale et que l'on utilise avec un lien identité.
Traduction :
un glm se caractérise par :
-une variable à prédire (réponse) suivant une certaine loi de distribution
-une fonction de lien qui sert à linéarisé la relation entre réponse et prédicteur
-une variable explicative (prédicteur)
Dans le cas de la régression logistique par exemple, la réponse suit une loi binomiale (family=binomial dans le logiciel R) et pour linéarisé on utilise le lien logit (log(p/(1-p)). Lorsque l'on cherche à prédire des données de comptage alors on admet que l'erreur est plutôt de type poisson et la plupart du temps c'est un lien log qui est employé.
Il y a un tout un tas de choix possible pour les famille et les liens mais à chaque fois il faut bien appréhender quelles sont les hypothèses sous-jacentes à chaque distribution et c'est là où sont commises la plupart des erreurs.
Du fait de la généralisation, on n'estime plus les paramètres du modèle selon le critère des moindres carrés mais on dit que l'on estime au maximum de vraissemblance (probabilité du jeu de données d'après les paramètres). Les moindres carrés est un cas particulier de l'estimation au maximu de vraissemblance.
Une bonne lecture voire même quasiment indispensable dès que l'on doit s'attaquer au monde des glms :
-McCullagh & Nelder. "Generalized Linear Models" (1989)
Il faut aussi préciser que l'on est pas obligé d'avoir un lien linéaire si cela semble ne pas convenir. Dans ce cas on peut alors basculer sur les Generalized Additive Models (GAMs) mais c'est encore différent.
Donc tout est imbriqué mais les outils que l'ont peut utiliser pour interpréter les différents modèles ne sont pas toujours applicable...
Il n'y a pas de différence entre un lm et un glm, tout simplement car le second est la généralisation du premier. Un lm est un glm dont la variable prédite suit une loi normale et que l'on utilise avec un lien identité.
Traduction :
un glm se caractérise par :
-une variable à prédire (réponse) suivant une certaine loi de distribution
-une fonction de lien qui sert à linéarisé la relation entre réponse et prédicteur
-une variable explicative (prédicteur)
Dans le cas de la régression logistique par exemple, la réponse suit une loi binomiale (family=binomial dans le logiciel R) et pour linéarisé on utilise le lien logit (log(p/(1-p)). Lorsque l'on cherche à prédire des données de comptage alors on admet que l'erreur est plutôt de type poisson et la plupart du temps c'est un lien log qui est employé.
Il y a un tout un tas de choix possible pour les famille et les liens mais à chaque fois il faut bien appréhender quelles sont les hypothèses sous-jacentes à chaque distribution et c'est là où sont commises la plupart des erreurs.
Du fait de la généralisation, on n'estime plus les paramètres du modèle selon le critère des moindres carrés mais on dit que l'on estime au maximum de vraissemblance (probabilité du jeu de données d'après les paramètres). Les moindres carrés est un cas particulier de l'estimation au maximu de vraissemblance.
Une bonne lecture voire même quasiment indispensable dès que l'on doit s'attaquer au monde des glms :
-McCullagh & Nelder. "Generalized Linear Models" (1989)
Il faut aussi préciser que l'on est pas obligé d'avoir un lien linéaire si cela semble ne pas convenir. Dans ce cas on peut alors basculer sur les Generalized Additive Models (GAMs) mais c'est encore différent.
Donc tout est imbriqué mais les outils que l'ont peut utiliser pour interpréter les différents modèles ne sont pas toujours applicable...
nik- Bavard
- Nombre de messages : 57
Niveau et domaine de formation : Doctorat Ecologie
Etablissement : UCB Lyon1
Date d'inscription : 22/09/2008
La Doua Dans l'Oeil :: Biologie :: Biométrie & Bioinformatique :: Questions & Débats :: Modélisations
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum