EModelo de probabilidad lineal
Donde se quiere explicar el comportamiento, mejor dicho la probabilidad de admisión a un programa de post grado con base en las calificaciones cuantitativas y verbales del GRE (se desea estimar la probabilidad de que un aspirante a un programa de post grado sea admitido con base a las calificaciones cuantitativas y verbales del GRE) con ello se dispone de información para cada uno de los 13 estudiantes, las calificaciones del examen de actitud GRE y el resultado de ser o no ser admitido al programa de post grado
Yi = B1 + B2Xi + ui
El valor esperado condicional de Y dado Xi representa la probabilidad de ocurrencia del evento, para el presente caso:
Y = 1 si el estudiante es admitido al programa de post grado
Y = 0 De lo contrario
E (Yi/Xi) = B1 + B2Xi la probabilidad de que el alumno sea admitido a la escuela de post grado
En un modelo de probabilidad lineal se presentara los siguientes problemas:
1. No normalidad de las perturbaciones ui; ui al igual Yi sigue distribución Bernuli (por qué Y puede tomar 2 únicos valores 1 o 0).
Para realizar la prueba de hipótesis, anteriormente habíamos visto que ui debe seguir distribución normal; por lo que se recomen erada trabajar con tamaño de muestra grande (como sabemos aplicando el teorema de la distribución normal asintótica, si una variable sigue distribución normal bernuli o cualquier tipo de distribución de probabilidad a medida de que su tamaño de muestra crece su distribución se hace normal.
2. Varianzas heterocedásticas de las perturbaciones, se puede demostrar que la varianza de ui condicional a los valores que tome la variable explicativa X no permanece constante. Var (ui) = Pi (1 -Pi).
Para poder estimar un modelo que adolezca del problema de heterocedasticidad aplicamos mínimos cuadrados ponderados. Para el ejemplo presentado el factor de ponderación w = Pi (1 -Pi) para demostrar el modelo debemos dividir a cada uno de sus modele entre la raíz cuadrada de w de esta manera formula (15.2.9).
3. No cumplimiento de 0 ≤ E (Yi/X)≤1. En el modelo de probabilidad lineal Yi (sombrero) puede tomar valores superiores a la 1 o menores que 0; motivo por el cual cuando la probabilidad estimada ( Yi sombrero sea mayor que 1, se tomara como si fuera igual a la unidad y cuando sea menor que 0, se tomara como si fuera 0)
4. Valor cuestionable de R2. Generalmente se encontrara coeficientes de determinación bajos (pendientes a 0) se debe q a que los valores de Y son iguales a 1 o 0.
Ejercicio
Nro. de estudiante
|
Calificación de oral y escrito
|
Admitido al programa de post grado (si = 1, No = 0)
|
1
|
1310
|
1
|
2
|
950
|
0
|
3
|
1040
|
0
|
4
|
1340
|
1
|
5
|
960
|
0
|
6
|
1220
|
0
|
7
|
1300
|
1
|
8
|
1330
|
1
|
9
|
1180
|
0
|
10
|
1050
|
0
|
11
|
1150
|
0
|
12
|
1190
|
1
|
13
|
1490
|
1
|
Aplicaremos mínimo cuadrados ordinarios solo por motivos metodológicos, pues ui no sigue distribución normal (entonces por lo tanto Yi tampoco seguiría )
Dependent Variable: Y
| ||||
Method: Least Squares
| ||||
Date: 09/13/11 Time: 11:24
| ||||
Sample: 1 13
| ||||
Included observations: 13
| ||||
Variable
|
Coefficient
|
Std. Error
|
t-Statistic
|
Prob.
|
C
|
-2.587130
|
0.704368
|
-3.672982
|
0.0037
|
X
|
0.002555
|
0.000585
|
4.364764
|
0.0011
|
R-squared
|
0.633958
|
Mean dependent var
|
0.461538
| |
Adjusted R-squared
|
0.600681
|
S.D. dependent var
|
0.518875
| |
S.E. of regression
|
0.327886
|
Akaike info criterion
|
0.748334
| |
Sum squared resid
|
1.182598
|
Schwarz criterion
|
0.835249
| |
Log likelihood
|
-2.864172
|
Hannan-Quinn criter.
|
0.730469
| |
F-statistic
|
19.05117
|
Durbin-Watson stat
|
2.658970
| |
Prob(F-statistic)
|
0.001127
| |||
Y = -2. 587130 + 0.002555X
Interpretaciones del coeficiente de regresión B2 si las calificaciones del alumno varia en 1 unidad la probabilidad de que sea admitido al programa de post grado aumenta en 0.002555.
Así también se puede encontrar la probabilidad de ocurrencia del evento para cada 1 de los 13 alumnos:
Y lo único que tenemos que hacer es remplazar los valores de tabla en la regresión esperada
Para el alumno 1:
X = 1310
Y = -2. 5871 + 0.0026X
Y = -2. 587130 + 0.002555 (1310)
Y = -2. 587130 + 3.34705
Y = 0.82
Para el alumno 2
X = 950
Y = -2. 5871 + 0.0026X
Y = -2. 5871 + 0.0026 (950)
Y = -2.5871 + 2.47
Y = -0.12
Para el alumno 13
X =1490
Y = -2. 5871 + 0.0026X
Y = -2. 5871 + 0.0026 (1490)
Y = -2. 5871 + 3.874
Y = 1.29
Aplicando las pruebas para comprobar heterocedasticidad:
Glejser: la varianza heterocedastica es ocasionada por las calificaciones en su forma lineal
O2i = O2Xi si esto se cumple el modelo original tendrá que ser dividido por su raíz cuadrad de X
F cal: 0.59028 P (1,11) = 0.4589
Homecedasticidad; alfa = 5% se acepta la hipótesis nula de homocedasticidad
cald ≥ crit (se acepta)
No hay comentarios:
Publicar un comentario