AVIS: Le groupe de consultation IDRE Statistical migrera le site Web vers le WordPress CMS en février pour faciliter la maintenance et la création de nouveaux contenus. Certaines de nos anciennes pages seront supprimées ou archivées de sorte qu'elles ne seront plus conservées. Nous essaierons de maintenir les redirections afin que les anciennes URL continuent à fonctionner de la meilleure façon possible. Bienvenue à l'Institut pour la recherche et l'éducation numériques Aider le Stat Consulting Group en donnant un cadeau Stata Exemples Analyse de régression appliquée par John Fox Chapitre 2: Qu'est-ce que l'analyse de régression Cette page montre comment obtenir les résultats de Foxs chapitre 2 en utilisant Stata. Certains des graphiques semblent quelque peu différents de ceux montrés dans Fox. Dans certains cas, le programme Stata fait quelque chose de similaire, mais pas exactement le même que, ce qui est illustré par Fox. Page 20, figure 2.3. Ces graphiques utilisent des médianes plutôt que des moyens. Mais les commandes produisent facilement des parcelles très semblables. Bandes (5) demande à Stata de diviser l'échantillon en 5 groupes pour calculer les médianes. Page 21, figure 2.4 Ce graphique représente les médianes faisant un chiffre semblable à 2.4. En raison des options choisies par Stata, le graphe semble un peu différent. Page 26, figure 2.6. La commande lowess est utilisée pour obtenir des moyens lissés. Dans Fox, la moyenne locale est basée sur 20 observations. La commande bwidth (.2) indique d'utiliser 20 des données (.20 101 20) pour chaque moyenne locale. Page 27, figure 2.7. Nous utilisons la commande Statas lowess pour effectuer et représenter graphiquement la régression non paramétrique. Page 29, figure 2.9 Fox montre la figure 2.6, mais en utilisant la fonction de poids tricube. Sélectionnés en utilisant les moyennes pondérées localement. À la page 30, la figure 2.10 montre la régression à l'aide de la régression robuste, à l'aide de la commande rreg. Nous générons les valeurs prédites à l'aide de la commande predict, puis en utilisant la commande line graph pour afficher le scatterplot et la droite de régression. Le contenu de ce site Web ne doit pas être interprété comme un endossement d'un site Web, d'un livre ou d'un produit logiciel par l'Université de Californie. Modèles linéaires, modèles linéaires généralisés et modèles non linéaires sont des exemples de modèles de régression. Paramétrique parce que nous connaissons la fonction qui décrit la relation entre la réponse et les variables explicatives. Dans de nombreuses situations, cette relation n'est pas connue. L'objectif principal de ce court cours est de guider les chercheurs qui ont besoin d'intégrer des relations inconnues, flexibles et non linéaires entre les variables dans leurs analyses de régression. La régression non paramétrique diffère de la régression paramétrique en ce que la forme des relations fonctionnelles entre la réponse (dépendante) et les variables explicatives (indépendantes) n'est pas prédéterminée mais peut être ajustée pour saisir des caractéristiques inhabituelles ou inattendues des données. Lorsqu'on connaît la relation entre la réponse et les variables explicatives, on doit utiliser des modèles de régression paramétrique. Si la relation est inconnue et non linéaire, des modèles de régression non paramétriques devraient être utilisés. Dans le cas où nous connaissons la relation entre la réponse et une partie des variables explicatives et ne connaissons pas la relation entre la réponse et l'autre partie des variables explicatives, nous utilisons des modèles de régression semiparmetrique. Toute zone d'application qui utilise l'analyse de régression peut potentiellement bénéficier d'une régression paramétrique séminon. R sera utilisé dans ce cours. Différences entre les modèles de régression paramétrique et semi-paramétrique. Comment puis-je savoir si je devrais utiliser le modèle de régression non paramétrique pour mes données? Une comparaison entre la régression paramétrique et non paramétrique en termes de critères d'ajustement et de prédiction. Méthodes d 'ajustement des modèles de régression paramétrique. Nous commençons par un ensemble de données classiques tirées de Pagan et Ullah (1999, p.155) qui considèrent les données salariales transversales canadiennes comme un échantillon aléatoire tiré des bandes d'utilisation publique du Recensement de 1971 pour les hommes ayant une éducation commune (13e année). Sont n 205 observations au total et 2 variables, le logarithme du salaire individuel (logwage) et leur âge (âge). Il est disponible dans le progiciel R. Ensemble de données sur le Prestige de Canadiens. Ces données ont 6 variables: l'éducation, le revenu, les femmes, le prestige, le recensement et le type. Source: Canada (1971) Recensement du Canada. Vol. 3, partie 6. Statistique Canada, pp. 19-17, 19-21. Il est également disponible en R. Les données sur les salaires transversaux sont constituées d'un échantillon aléatoire tiré de l'enquête sur la population des États-Unis pour l'année 1076. Il y a 526 observations au total. Disponible dans la bibliothèque de logiciels R (np), data (salaire1) Ci-dessous est un exemple de relation non linéaire inconnue entre l'âge et le salaire logarithmique et certains types différents de lignes de régression paramétriques et non paramétriques. On peut voir que les régressions non paramétriques surpassent les régressions paramétriques en ajustant la relation entre les deux variables et la régression linéaire simple est la pire. Nous allons couvrir ces méthodes et plus encore. Matériel de cours
No comments:
Post a Comment