[Retour à la page du cours]

Discussion

Cette discussion porte sur le premier travail pratique. Je ne répondrai qu'aux questions posées sur ce forum: je ne répondrai pas aux questions posées par courriel.

  • Vous pouvez ajouter une question ou répondre à un de vos camarades. Pour répondre, cliquez sur… “Répondre”.
  • Si vous désirez être informé des réponses à votre question, sélectionnez “Suivre les commentaires”.
  • Vous devez écrire votre nom et votre adresse de courriel pour pouvoir participer à la discussion. Votre adresse de courriel ne sera pas visible sur cette page.

Premier travail pratique

Chantal Boivin, 2014/09/16 18:25
Bonsoir,

J'ai quelques questions au sujet du TP1:

Question 1

e) Sous les mêmes hypothèses, calculez la p-valeur par simulations. Utilisez M=10 000 échantillons simulés. Comment avez-vous fait sur Excel pour calculer la probabilité marginale de rejet d'un test? Je ne trouve pas la formule P-valeur dans mes options dans Excel.

f) Supposez maintenant que la population est uniformément distribuée entre 0 et 1. Quelles sont l'espérance et la variance d'une variable uniforme ? (Note : Consultez Wikipedia) Calculez la p-valeur en utilisant le théorème central limite. Ici est-ce avec Excel ou je fais les calculs sur papier ?

g) Sous les mêmes hypothèses, calculez la p-valeur par simulations. Utilisez M=10 000 échantillons simulés. Comment avez-vous fait sur Excel pour calculer la probabilité marginale de rejet d'un test? Je ne trouve pas la formule P-valeur dans mes options dans Excel.


Question 2. Exercice A.7.
Calculez les probabilités :

d Comment calculer la probabilité avec le Khi-deux et le degré de liberté? Dans l'annexe A A4.2 Il n'y a pas vraiment d'exemple.
e , f, i, j, m ? Pourriez-vous m'expliquer comment faire svp pour calculer les probabilités? un exemple serait très apprécié avec


Question 3. Exercice empiriques 1.1 et 2.1 (données et leur des description ) Je ne comprends pas la question ? Qu'est que vous voulez comme travail?
a) Exercice empirique 1.1
b) Exercice empirique 2.1

Question 4. Exercices empiriques 1.2 et 2.2 (données et leur description) Je ne comprends pas la question ? Qu'est que vous voulez comme travail?



a) Exercice empirique 1.2
b) Exercice empirique 2.2
Sebastien Blais, 2014/09/17 06:02
Q1e) Utilisez la fonction RANG.POURCENTAGE.EXCLURE tel qu'illustré à la section "Quelques fonctions MsExcel utiles" des compléments de notes de cours .

Q1f) Les deux: Vous m'écrivez votre réponse en termes de la fonction Phi(x) puis vous calculez la valeur numérique avec Excel.

Q1g) voir Q1e)

Q2d,e,f,i,j,m) Vous avez l'exemple pour la normale. Pour une Khi2, une t ou une F, vous procédez de la même manière. Vous utilisez la fonction Excel appropriée (LOI.KHI.N, LOI.STUDENT.N, LOI.N.F). Une fonction de répartition donne toujours la probabilité que X soit plus petit ou égal à une certaine valeur x: F(x)=Prob(X<=x). Les arguments des fonctions varient légèrement: utilisez l'aide de Excel au besoin. Par exemple, les paramètres d'une normale sont son espérance et sa variance de sorte que les arguments de la fonction Excel sont (x;espérance;écart-type;répartition/densité=vrai/faux). Le seul paramètre d'une t est le nombre de degrés de liberté de sorte que les argments sont (x,degrés de liberté,répartition/densité=vrai/faux).

Q3) Faites les exercices empiriques 1.1 (page 40 du manuel) et 2.1 (page 75 du manuel)

Q4) voir Q3)
stephane, 2014/09/18 11:39
Bonjour,

Nous avons un problème à calculer Phi? nous utilisons excel pour générer le résultat mais on arrive toujours à 1
procédé:
tobs = (Ybar - Ypop) / racine (var(YBar)/E(Ybar)) = tobs = - valAbs(tobs) = 47,76505
avec excel loi.normale(tobs;0;1;vrai) = 1

merci d'avance
Sebastien Blais, 2014/09/19 10:37
C'est votre tobs qui est erroné: la variance de la moyenne est var(Ybar)=var(Y)/N, où N est le nombre de valeurs dont on fait la moyenne. Votre statistique est alors (Ybar-Ypop)/racine(var(Ybar)).

En passant, faites attention (en particulier dans les travaux pratiques et les examens) quand vous écrivez des égalités. Vous écrivez "... = tobs = - valAbs(tobs) = 47,76505": c'est doublement faux. Vous vouliez probablement écrire "... = tobs, -valAbs(tobs) = -47,76505".
Carine Benimana, 2014/09/22 08:11
bonjour monsieur,

Q1e: on voulait savoir C'est quoi la probabilité et les variables pour calculer p-valeur? y a il un moyen de calculer la probabilité ou c'est donné?
Sebastien Blais, 2014/09/22 10:06
Voir ma réponse du 2014/09/17 06:02
Marie-Ève Drolet-Mailhot, 2014/09/22 13:29
Q1 d) Est-ce une distribution suivant la loi normale ou Student (puisque n = 20)?
e) Lorsque nous calculons la p-valeur avec RANG.POURCENTAGE.EXCLURE, la réponse ne fait pas de sens (environ 0,5...). Est-ce normale?
f)Est-ce qu'on doit prendre la loi uniforme discrète ou continue (les 2 ne calculent pas la variance de la même manière)?

Q3 1.1 Excel fournit 2 R carré. Lequel est celui qui est ajusté? Le premier ou le deuxième?

Q4 1.2 Excel fournit 2 erreurs-types. Laquelle doit-on utiliser? Celle avec la constante ou celle avec la variable?

Merci :)
Sebastien Blais, 2014/09/22 18:27
Q1d) "vous connaissez sigma^2"

Q1e) Remarquez que pour générer une variable aléatoire normale, vous devez spécifier l'écart-type (et non la variance) et que vous ne pouvez pas entrer une formule (vous devez entrer un nombre: soyez précis et utilisez une précision d'au moins 5 chiffres).

Q1f) Continue.

Q3 1.1) Vous devez trouvez la réponse à votre question à la Question 5...

Q4 1.2) L'erreur-type de régression (affichée dans les "Statistiques de la régression") ne doit pas être confondue avec l'erreur-type de l'estimateur de moindres carré ordinaires de la constante et de la pente.
Bruno Lavictoire, 2014/09/22 14:01
Bonsoir M. Blais,

J'ai des questionnements concernant la simulation des échantillons à la question Q1. De ce que je peux comprendre, nous avons un échantillon de 20 observations (20 variables aléatoires) et l'on souhaite simuler 10 000 échantillons. Est-ce que, dans le générateur de nombres aléatoires, le nombre de variables est = 20, le nombre d'échantillons = 10000 et la moyenne et l'écart-type sont ceux de la population? Si tel est le cas, vous avez expliqué précédemment l'utilisation de la formule RANG.POURCENTAGE.EXCLURE afin de déterminer la p-valeur. Devons-nous utiliser comme matrice nos 10 000 échantillons, ou bien calculer le Ybarre des 10 000 échantillons et plutôt utliser cette matrice?

Je vous remercie pour votre temps et je vous souhaite une bonne fin de journée.

Bruno
Sebastien Blais, 2014/09/22 18:35
Je pense que vous avez compris. Donc, "oui" à toutes vos questions, sauf la dernière.

Si vous vous intéressez à la probabilité que Ybarre soit inférieure à 0,4, il vaut mieux appliquer la fonction RANG.POURCENTAGE.EXCLURE à Ybarre, que vous aurez calculée 10 000 fois, en effet.
Bruno Lavictoire, 2014/09/22 19:48
Merci pour votre aide
Sabrina Couture, 2014/09/24 13:56
Bonjour M. Blais,

Pour le TP dans la question 1 e) j'avais une question. Si je me fit à votre fichier excel, il y a des calculs approximatif et exacts. Dans le devoir est-ce qu'on doit faire les deux ou juste un ?

De plus lorsque vous demandez de justifier, est-ce que la démarche de nos calculs est suffisant ?

Merci
Sebastien Blais, 2014/09/26 06:22
Je ne veux pas répondre directement à cette question. L'objectif du fichier MsExcel est d'illustrer la matière. Il montre comment approximer la distribution de la moyenne par une méthode de simulation et il quantifie la qualité de cette approximation en la comparant à la distribution exacte de la moyenne. N'essayez pas de faire reproduire tous les calculs présentés dans le fichier; répondez plutôt à la question du TP. Commencez par vous assurer que vous comprenez bien la question. La démarche suivra ensuite d'elle même.

Ce conseil s'applique de manière générale. Trop souvent, les étudiants lisent les questions en diagonale et commencent à faire des calculs en imaginant avoir deviné le sens de la question ou d'avoir reconnu une question qu'ils ont déjà rencontrée. Vous seriez surprise de voir combien d'étudiant répondent à une question comme "Sous quelles conditions l'estimateur des MCO est-il consistant?" par "Oui". La nervosité joue de mauvais tours à certains étudiants pendant les examens, mais on devrait toujours prendre le temps de lire une question 2 fois avant d'y répondre, ET UNE FOIS DE PLUS APRÈS y avoir répondu, pour s'assurer qu'on y a bien répondu.

Pour justifier, je veux connaître votre démarche, oui.
Alex, 2014/09/24 16:38
Bonjour,

Concernant la question e) des problèmes 2.1 et 2.2, pour déterminer si il y a une différence significative entre l'effet de l'âge sur les salaires selon que c'est une femme ou bien un homme (prenons le cas de 2.1e)), faut-il faire un test d'hypothèse sur la différence des taux de variation (pente) avec un niveau de confiance de 5%. J'imagine que seulement comparer les pentes des équation des hommes avec celui des femmes ne doit pas être suffisant ?
merci
Sebastien Blais, 2014/09/26 06:38
C'est une question difficile. On vous réfère au problème 2.15. On vous demande si la différence entre deux pentes estimées est significativement différente de 0. Je peux vous expliquer comment on teste si la différence entre deux moyennes est significativement différente de 0.

Supposons qu'on a Xbar et Ybar et qu'on veut savoir si Xbar est significativement différent de Ybar. La nulle est H0: Xbar-Ybar=0 contre H1: Xbar-Ybar<>0. On doit donc connaître la distribution de Xbar-Ybar. Comme les moyennes sont calculées sur des échantillons différents, Xbar et Ybar sont indépendantes. Puisque chaque échantillon est grand, on peut faire l'hypothèse qu'elles sont normalement distribuées. La différence est donc normalement distribuée. Sous la nulle, l'espérance de la différence est 0. Il ne reste qu'à calculer la variance, ce qui est simple parce que les moyennes sont indépendantes: Var[Xbar + (-1)*Ybar] = Var[Xbar] + (-1)^2*Var[Ybar] = Var[Xbar] + Var[Ybar]. L'erreur-type de la différence est donc simplement racine(Var[Xbar] + Var[Ybar]). La statistique t est t = ( Xbar^obs-Ybar^obs - 0 )/racine(Var[Xbar] + Var[Ybar]) et on rejette H0 à 5% si |t|>1,96.
carine , 2014/09/27 09:32
hello

pour la question 3, on ne peux pas acceder le lien : http://wps.pearson.fr/principes_econometrie_3

y'a t'il un moyen de nous envoyer les fishier
merci
Sebastien Blais, 2014/09/28 06:04
Tel que mentionné à plusieurs reprises en classe, les hyperliens donnés dans le manuel ne sont pas bons et c'est pour cette raison que je vous en ai donné d'autres avec l'énoncé des questions 3 et 4 du TP: les mots "données" et "description" sont ces hyperliens.
Chantal Boivin, 2014/09/27 10:27
Bonjour,

Question A-7f- Lorsque nous essayons de rentrer dans la formule Loi.F.N dans Excel le 2ième degré de liberté qui est infini cela ne fonctionne pas. On a essayé avec le symbole infini, l'écrire avec guillemet ou sans cela ne fonctionne pas. Auriez-vous une idée comment faire, on a aussi essayé avec l'aide et cela ne marche pas non plus?

A-7 J, K et L Nous savons que J et K devrait être la même réponse mais on n'arrive pas à ce résultat. Pour J dans Excel nous avons utilisé la Loi Student Bilatéral mais nous n'avons pas ce choix pour la Loi Normale. Est-ce que la Loi Normale bilatérale aurait un n'autre nom?

merci
Sebastien Blais, 2014/09/28 06:11
A.7.f. Prenez un grand nombre, 999999, par exemple.

A.7.j-l. N'utilisez que les fonctions loi.normale.n et loi.student.n. De manière générale, n'utilisez que les fonctions que je mentionne à la section "Quelques fonctions MsExcel utiles" des compléments de notes de cours.
carine, 2014/09/28 19:54
bonjour monsieur

Q1-e
pour calculer p-valeur, quand on utulise votre formule : =2*RANG.POURCENTAGE.EXCLURE(U5:U10004,-ABS(0.4),5) cela nous donne " erreur"
mais qd on utilise celle du ccomplement de notes de cours =RANG.POURCENTAGE.EXCLURE(U5:U10004, (0.4),5) cela donne un resultat,

la quelle des formules est juste??
Sebastien Blais, 2014/09/28 21:22
Plusieurs remarques. 1. Si votre MsExcel est en français, vous devriez utiliser "," pour les décimales et";" pour séparer les arguments de la fonction. 2. La seule différence notable entre les deux formules est la valeur absolue et le signe négatif. Si la formule vous retourne "erreur", c'est parce que -0,4=-abs(0,4) est plus petit que min(u5:u10004) ou plus grand que max(u5:u10004). 3. Ces formules calculent la p-valeur de tests d'hypothèse différents et c'est à vous de choisir la bonne.
valerie, 2014/09/29 17:55
Bonjour Monsieur,
question empirique 2.1 question e

Est-ce différent pour les bacheliers et pour les diplômés d'université.. Dans le problème, on fait référence au bachelor degree qui est bachelier et au high school degree qui est diplôme secondaire et non diplôme d'université, donc je ne voit pas comment nous pouvons répondre à ce problème.

Merci de vore aide
Sebastien Blais, 2014/09/29 18:26
2.1.c) Prenez bachelor=0, soit les travailleurs avec un diplôme secondaire.
2.2.d) Prenez bachelor=1, soit les travailleurs avec un diplôme universitaire.
Si vous avez fait le contraire, ce n'est pas la fin du monde.
Marie-Ève Drolet-Mailhot, 2014/10/02 12:09
Bonjour,

Votre réponse à la première question à la question 1 a) est : Pour que la moyenne soit une variable aléatoire, elle doit porter sur un échantillon. Si j'ai bien compris, l'échantillon ne doit pas nécessairement avoir été déterminé de façon aléatoire?

Merci
Sebastien Blais, 2014/10/03 11:33
C'est une question compliquée, presque philosophique. La réponse courte: oui, l'échantillon doit avoir été généré de manière aléatoire. C'est précisément ce qui fait que la moyenne est aléatoire: vous auriez pu obtenir un autre échantillon et donc une autre moyenne. Dans le langage courant par contre, le fait que l'échantillon a été généré aléatoirement est implicite. Si, par exemple, j'avais construit mon échantillon en prenant le 100 plus grandes valeurs de X dans ma population, je n'utiliserais pas le terme "échantillon".

Outils de la page