
Régression avec R
Description
Alles über E-Books | Antworten auf Fragen rund um E-Books, Kopierschutz und Dateiformate finden Sie in unserem Info- & Hilfebereich.
More details
Persons
Pierre-André Cornillon est Maître de Conférences à l'université Rennes-2-Haute-Bretagne. Hengartner Nicolas:
Nicolas Hengartner est du Los Alamos National Laboratory (USA)Matzner-Løber Eric:
Eric Matzner-Løber est Professeur à l'université Rennes-2-Haute-Bretagne.Rouvière Laurent:
Laurent Rouvière est Maître de Conférences à l'université Rennes-2-Haute-Bretagne.
Content
- Intro
- Remerciements
- Avant-Propos
- Régression avec R
- I Introduction au modèle linéaire
- La régression linéaire simple
- Introduction
- Un exemple : la pollution de l'air
- Un second exemple : la hauteur des arbres
- Modélisation mathématique
- Choix du critère de qualité et distance à la droite
- Choix des fonctions à utiliser
- Modélisation statistique
- Estimateurs des moindres carrés
- Calcul des estimateurs de j, quelques propriétés
- Résidus et variance résiduelle
- Prévision
- Interprétations géométriques
- Représentation des individus
- Représentation des variables
- Inférence statistique
- Exemples
- Exercices
- La régression linéaire multiple
- Introduction
- Modélisation
- Estimateurs des moindres carrés
- Calcul de
- Interprétation
- Quelques propriétés statistiques
- Résidus et variance résiduelle
- Prévision
- Interprétation géométrique
- Exemples
- Exercices
- Validation du modèle
- Analyse des résidus
- Les différents résidus
- Ajustement individuel au modèle, valeur aberrante
- Analyse de la normalité
- Analyse de l'homoscédasticité
- Analyse de la structure des résidus
- Analyse de la matrice de projection
- Autres mesures diagnostiques
- Effet d'une variable explicative
- Ajustement au modèle
- Régression partielle : impact d'une variable
- Résidus partiels et résidus partiels augmentés
- Exemple : la concentration en ozone
- Exercices
- Extensions : non-inversibilité et (ou) erreurs corrélées
- Régression ridge
- Une solution historique
- Minimisation des MCO pénalisés
- Equivalence avec une contrainte sur la norme des coefficients
- Propriétés statistiques de l'estimateur ridge ridge
- Erreurs corrélées : moindres carrés généralisés
- Erreurs hétéroscédastiques
- Estimateur des moindres carrés généralisés
- Matrice inconnue
- Exercices
- II Inférence
- Inférence dans le modèle gaussien
- Estimateurs du maximum de vraisemblance
- Nouvelles propriétés statistiques
- Intervalles et régions de confiance
- Prévision
- Les tests d'hypothèses
- Introduction
- Test entre modèles emboîtés
- Applications
- Exercices
- Notes
- Intervalle de confiance : bootstrap
- Test de Fisher pour une hypothèse linéaire quelconque
- Propriétés asymptotiques
- Variables qualitatives : ANCOVA et ANOVA
- Introduction
- Analyse de la covariance
- Introduction : exemple des eucalyptus
- Modélisation du problème
- Hypothèse gaussienne
- Exemple : la concentration en ozone
- Exemple : la hauteur des eucalyptus
- Analyse de la variance à 1 facteur
- Introduction
- Modélisation du problème
- Interprétation des contraintes
- Estimation des paramètres
- Hypothèse gaussienne et test d'influence du facteur
- Exemple : la concentration en ozone
- Une décomposition directe de la variance
- Analyse de la variance à 2 facteurs
- Introduction
- Modélisation du problème
- Estimation des paramètres
- Analyse graphique de l'interaction
- Hypothèse gaussienne et test de l'interaction
- Exemple : la concentration en ozone
- Exercices
- Note : identifiabilité et contrastes
- III Réduction de dimension
- Choix de variables
- Introduction
- Choix incorrect de variables : conséquences
- Biais des estimateurs
- Variance des estimateurs
- Erreur quadratique moyenne
- Erreur quadratique moyenne de prévision
- Critères classiques de choix de modèles
- Tests entre modèles emboîtés
- Le `39`42`"613A``45`47`"603AR2
- Le `39`42`"613A``45`47`"603AR2 ajusté
- Le `39`42`"613A``45`47`"603ACp de Mallows
- Vraisemblance et pénalisation
- Liens entre les critères
- Procédure de sélection
- Recherche exhaustive
- Recherche pas à pas
- Exemple : la concentration en ozone
- Variables explicatives quantitatives
- Intégration de variables qualitatives
- Exercices
- Note : `39`42`"613A``45`47`"603ACp et biais de sélection
- Régularisation des moindres carrés : Ridge, Lasso et elastic-net
- Introduction
- Problème du centrage-réduction des variables
- Ridge, lasso et elastic-net
- Régressions avec la package glmnet
- Interprétation géométrique
- Simplification quand les X sont orthogonaux
- Choix du paramètre de régularisation
- Intégration de variables qualitatives
- Exercices
- Note : lars et lasso
- Régression sur composantes: PCR et PLS
- Régression sur composantes principales (PCR)
- Changement de base
- Estimateurs des MCO
- Choix de composantes/variables
- Retour aux données d'origine
- La régression sur composantes en pratique
- Régression aux moindres carrés partiels (PLS)
- Algorithmes PLS
- Choix de composantes/variables
- Retour aux données d'origine
- La régression PLS en pratique
- Exercices
- Notes
- ACP et changement de base
- Colinéarité parfaite : |X'X|=0
- Comparaison des différentes méthodes, étude de cas réels
- Erreur de prévision et validation croisée
- Analyse de l'ozone
- Préliminaires
- Méthodes et comparaison
- Pour aller plus loin
- Conclusion
- IV Le modèle linéaire généralisé
- Régression logistique
- Présentation du modèle
- Exemple introductif
- Modélisation statistique
- Variables explicatives qualitatives, interactions
- Estimation
- La vraisemblance
- Calcul des estimateurs : l'algorithme IRLS
- Propriétés asymptotiques de l'EMV
- Intervalles de confiance et tests
- IC et tests sur les paramètres du modèle
- Test sur un sous-ensemble de paramètres
- Prévision
- Adéquation du modèle
- Le modèle saturé
- Tests d'adéquation de la déviance et de Pearson
- Analyse des résidus
- Choix de variables
- Tests entre modèles emboîtés
- Procédures automatiques
- Exercices
- Régression de Poisson
- Le modèle linéaire généralisé (GLM)
- Exemple : modélisation du nombre de visites
- Régression Log-linéaire
- Le modèle
- Estimation
- Tests et intervalles de confiance
- Choix de variables
- Exercices
- Régularisation de la vraisemblance
- Régressions ridge, lasso et elastic-net
- Choix du paramètre de régularisation
- Group-lasso
- Exercices
- Comparaison en classification supervisée
- Prévision en classification supervisée
- Performance d'une règle
- Erreur de classification et accuracy
- Sensibilité (recall) et taux de faux négatifs
- Spécificité et taux de faux positifs
- Mesure sur les tables de contingence
- Performance d'un score
- Courbe ROC
- Courbe lift
- Choix du seuil
- Respect des proportions initiales
- Maximisation d'indices ad hoc
- Maximisation d'un coût moyen
- Analyse des données chd
- Les données
- Comparaison des algorithmes
- Pour aller plus loin
- Application : détection d'images publicitaires sur internet
- Les données
- Ajustement des modèles
- Exercices
- Données déséquilibrées
- Données déséquilibrées et modèle logistique
- Un exemple
- Rééquilibrage pour le modèle logistique
- Exemples de schéma de rééquilibrage
- Stratégies pour données déséquilibrées
- Quelques méthodes de rééquilibrage
- Critères pour données déséquilibrées
- Choisir un algorithme de rééquilibrage
- Rééquilibrage et validation croisée
- Application aux données d'images publicitaires
- Exercices
- V Introduction à la régression non paramétrique
- Introduction à la régression spline
- Introduction
- Régression spline
- Introduction
- Spline de régression
- Spline de lissage
- Exercices
- Estimateurs à noyau et k plus proches voisins
- Introduction
- Estimateurs par moyennes locales
- Estimateurs à noyau
- Les k plus proches voisins
- Choix des paramètres de lissage
- Ecriture multivariée et fléau de la dimension
- Ecriture multivariée
- Biais et variance
- Fléau de la dimension
- Exercices
- Rappels
- Rappels d'algèbre
- Rappels de probabilités
- Bibliographie
- Index
- Notations
- Fonctions et packages R
System requirements
File format: PDF
Copy protection: Watermark-DRM (Digital Rights Management)
System requirements:
- Computer (Windows; MacOS X; Linux): Use the free software Adobe Reader, Adobe Digital Editions, or any other PDF viewer of your choice (see eBook Help).
- Tablet/Smartphone (Android; iOS): Install the free app Adobe Digital Editions or another reading app for eBooks, e.g., PocketBook (see eBook Help).
- E-reader: Bookeen, Kobo, Pocketbook, Sony, Tolino and many more (only limited: Kindle).
The file format PDF always displays a book page identically on any hardware. This makes PDF suitable for complex layouts such as those used in textbooks and reference books (images, tables, columns, footnotes). Unfortunately, on the small screens of e-readers or smartphones, PDFs are rather annoying, requiring too much scrolling.
This eBook uses Watermark-DRM, a „soft” copy protection. This means that there are no technical restrictions to prevent illegal distribution. However, there is a personalised watermark embedded in the eBook that can be used to identify the purchaser of the eBook in the event of misuse and to provide evidence for legal purposes.
For more information, see our eBook Help page.