- APRECIADOS PARTICIPANTES DE LAS SECCIONES I-001-D Y I-003-D AULA 12 DE ADMINISTRACION DE DESASTRE UNEFA ISABELICA. PROF. LINO JOSE CAVEZ FIGUEROA. ESTA ACTIVIDAD CORRESPONDE PARA EL TECER CORTE DEL SEMESTRE (2-2008) UNEFA-ISABELICA. ADMINISTRACION DE DESASTRE.LOS ALUMNOS INVESTIGARAN , DISCUTIRAN LA UNIDAD EN EL TALLER QUE SE REALIZARA EN LA 2DA. SEMANA DE ENERO-,2009 DONDE ESTA INVOLUCRADO LA AUTO EVALUACION, COEVALUACION Y EVALUACION DIRECTA POR EQUIPO ORGANIZADOS ALEATORIAMENTE EN CLSE COMO DE COSTUMBRE
-
Regresión y correlación
Regresión y correlación Estadística. Líneal. Inferencias. Ecuaciones. Datos contínuos. Pearson. Error estándar de estimación. Intervalos de confianza.
html.rincondelvago.com/regresion-y-correlacion.html - 166k - En caché - Páginas similares -
Regresión y correlación - Monografias.com
Análisis de regresión y Correlación Múltiple.- consiste en estimar una variable dependiente, utilizando dos o más variables independientes. ...
www.monografias.com/trabajos30/regresion-correlacion/regresion-correlacion.shtml - 53k - En caché - Páginas similares
de G DE PUBLICIDAD - Artículos relacionados -
IGN="CENTER">6 6 7 7 8 9 LENGUAJE 2 2 5 5 5 7 5 8 7 10 Los pares ...
La correlación, método por el cual se relacionan dos variables se pude graficar con un diagrama de dispersión de ... BIBLIOGRAFIA DE REGRESION Y CORRELACION ...
www.monografias.com/trabajos26/estadistica-inferencial/estadistica-inferencial.shtml - 29k - En caché - Páginas similares -
regresión y correlación
VARIABLES ESTADÍSTICAS BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN ... (Recta de regresión, coeficiente de correlación, interpretación y conclusiones, ...
www.isftic.mepsyd.es/w3/Descartes/Bach_CNST_1/Variables_estadisticas...regresion_correlacion/regresio.htm - 3k - En caché - Páginas similares -
Correlacion y regresion lineales
Correlación y regresión lineales. En una distribución bidimensional puede ocurrir que las dos variables guarden algún tipo de relación entre si. ...
nutriserver.com/Cursos/Bioestadistica/Correlacion_Regresion.html - 47k - En caché - Páginas similares -
correlación y regresión
CORRELACIÓN LINEAL Y RECTA DE REGRESIÓN. Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. ...
descartes.cnice.mec.es/materiales_didacticos/Correlacion_regresion_recta_regresion/correlacion_y_regresion.htm - 63k - En caché - Páginas similares -
FisicaNet - Probabilidades y estadísticas. Análisis de Regresión y ...
Análisis de Regresión y Correlación. Relación funcional entre dos variables. ... Coeficiente de correlación lineal. Modelos de Regresión.
www.fisicanet.com.ar/matematica/estadisticas/ap07_regresion_y_correlacion.php - 40k - En caché - Páginas similares - [PDF]
CORRELACIÓN LINEAL Y ANÁLISIS DE REGRESIÓN
Formato de archivo: PDF/Adobe Acrobat - Versión en HTML
Análisis de regresión y correlación lineal. Proyecto e-Math ..... Los conceptos de regresión lineal y correlación entre variables se aplican a innumerables ...
www.uoc.edu/in3/emath/docs/RegresionLineal.pdf - Páginas similares -
Introducción a correlación y regresión
Introducción a correlación y regresión · Primer ciclo Add comments. Una introducción a algunas ideas sobre correlación y regresión lineal. icon for podpress ...
www.bioestadistica.uma.es/baron/1ciclo/introduccion-a-correlacion-y-regresion - 12k - En caché - Páginas similares -
Yahoo! Respuestas - ¿Correlación y Regresión : Estadísticas Aplicadas?
Diga qué índice de correlación se usaría para los …
espanol.answers.yahoo.com/question/index?qid=20081121204259AA1O7rE - 22k - En caché - Páginas similares
La distribución diváriate es cuando se estudia en una población dos variables, que forman pares correspondientes a cada individuo, como por Ejm:
Las notas de 10 alumnos en biología y lenguaje
Los pares de valores son: ( 2, 2) (4,2) (5,5)…….(8,7) (9,10) forman una distribución diváriate.
La correlación, método por el cual se relacionan dos variables se pude graficar con un diagrama de dispersión de puntos, a la cual muchos autores le llaman nubes de puntos, encuadrado dentro de un gráfico de coordenadas X Y en la cual se pude trazar una recta y cuyos puntos mas cercanos de una recta hablaran de una correlación mas fuerte, ha esta recta se le denomina recta de regresión, que puede ser positiva o negativa, la primera contundencia a aumentar y la segunda en descenso o decreciente.
También se puede describir un diagrama de dispersión en coordenadas cartesianas valores como en la distribución diváriate, en donde la nube de puntos representa los pares de valores.
Por último se pueden graficar las líneas de tendencia, herramienta muy útil para el mercadeo por que es utilizada para evaluar la resistencia que proyectan los precios. Cuando una línea de tendencia central se rompe ya sea con tendencia al alza o en la baja es porque ocurre un cambio en los precios, por lo tanto las líneas de tendencia pueden ser alcista cuando se unen los puntos sucesivos y bajista cuando se unen los puntos máximos.
También existen gráficos que representan la dispersión de datos dentro de las coordenadas cartesianas, ósea las nubes de puntos y que pueden darse según la relaciòn que representa, que puede ser lineal, exponencial y sin relación, esta última cuando los puntos están dispersos en todo el cuadro sin agruparse lo cual sugiere que no hay relación.
se trata de abordar un fragmento de la estadística inferencial, trabajo realizado en el ámbito en una maestría, como cierre de un capitulo del curso de estadística básica, en la bibliografía se encontró en la literatura bajado de internet literatura compleja que implica un amplio conocimiento de las estadísticas por parte del autor y en la revisión de la literatura que abarca años anteriores 1995, se observo pocos cambios de la temática a la actualidad, sobre todo dicho cambio esta ajustado al área de la entrada de los ordenadores en esta rama de la ciencia, el capitulo de regresión y correlación se hace por lo tanto mas maleable, sobre todo cuando se maneja gran cantidad de datos, la inferencia que es muy importante en investigación medica, en este caso se hace mas fácil para los que procesan estos tipos de datos.
En una distribución bidimensional puede ocurrir que las dos variables guarden algún tipo de relación entre si.
Por ejemplo, si se analiza la estatura y el peso de los alumnos o alumnas de una clase es muy posible que exista relación entre ambas variables: mientras más alto sea el estudiante, cabe pensar que mayor será su peso.
El coeficiente de correlación lineal mide el grado de intensidad de esta posible relación entre las variables. Este coeficiente se aplica cuando la relación que puede existir entre las varables es lineal (es decir, si representaramos en un gáfico los pares de valores de las dos variables la nube de puntos se aproximaría a una recta).
No obstante, puede que exista una relación que no sea lineal, sino exponencial, parabólica, etc. En estos casos, el coeficiente de correlación lineal mediría mal la intensidad de la relación las variables, por lo que convendría utilizar otro tipo de coeficiente más apropiado.
Para ver, por tanto, si se puede utilizar el coeficiente de correlación lineal, lo mejor es representar los pares de valores en un gráfico y ver que forma describen.
El coeficiente de correlación lineal se calcula aplicando la siguiente fórmula:
Es decir:
Numerador: se denomina covarianza y se calcula de la siguiente manera: en cada par de valores (x,y) se multiplica la "x" menos su media, por la "y" menos su media. Se suma el resultado obtenido de todos los pares de valores y este resultado se divide por el tamaño de la muestra.
Denominador se calcula el produto de las varianzas de "x" y de "y", y a este produto se le calcula la raíz cuadrada.
GRACIAS PROFESOR `POR LA INVESTIGACION. LO TOMARE EN CUENTA.. Q TENGA BUEN DIA
hola profesor soy dimas escobar de administracion de desastre de la seccion I001 recibi la adtividad gracias por la informacion
profe ya estoy biendo el material de trabajo , lo estare analisando . que tenga buen dia.. gracia.
ok ya estoy revisando el material profesor lo estare analisando en vacaciones para discutirlo en clase que tenga buen dia y muchas gracias
anny valderrama seccion 003D
hola profesor espero que este bien aqui tiene mi analisis de las reseña historica de las teorias de la probabilidades...
segun lo que estuve investigando se dice que la probabilidad debe ser tan antigua como el hombre
en 1954 comienza a desarrollarse el calculo de las torias de las probabilidades y que fue un proceso lento osea podriamos decir sistematisado que fue desarrollando el hombre a medida del tiempo
HOLA PROFESOS GRACIAS POR SU MATERIAL LO CUAL LO INVESTIGARE Y ESTARE PREPARADA PARA CUANDO REGRESEMOS DE VACACIONES, GRACIAS Y QUE ESTE BIEN
Buenas tardes Prof. estuve revisando el material muchas gracias por facilitarnolos. y q la pase muy bien.
La Regresión Y La Correlación
La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación. En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muestrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
Regresión lineal
La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación matemática lineal que describe la reacción entre dos variables.
La regresión puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo. La finalidad de una ecuación de regresión seria estimar los valores de una variable con base en los valores conocidos de la otra.
Ecuación Lineal
Dos características importantes de una ecuación lineal
• la independencia de la recta
• la localización de la recta en algún punto. Una ecuación lineal tiene la forma
y = a + bx
En la que a y b son valores que se determina a partir de los datos de la muestra; a indica la altura de la recta en x= 0, y b señala su pendiente. La variable y es la que se habrá de predecir, y x es la variable predictora.
EL error estándar de estimación
La determinante primaria de la exactitud es el grado de dispersión de la población: cuanto mas dispersa este, menor será la exactitud de la estimación. El grado de dispersión en la población se puede estimar a partir del grado de dispersión en las observaciones de la muestra con respecto a la línea de regresión calculada, utilizando la formula.
Se = " (yi -yc)
n-2
en la cual:
yi = cada valor de y
yc = valor de línea de regresión correspondiente a partir de la ecuación de regresión.
n = números de observaciones.
La formula anterior no se utiliza por lo general para cálculos reales, es mas fácil trabajar con la formula simplificada
Se " y2 - a y - b xy
n - 2
Inferencia de acerca de la pendiente de una línea de regresión
Aun cuando es muy poca o nula relación entre dos variables de aun población, es posible obtener valores maestrales que hacen que parezca que la variables están relacionadas, es importantes probar los resultados tales de caculo, a fin determinar si son significativos (es decir si los parámetros verdaderos no son cero), Si no existe ninguna relación se esperaría obtener aun pendiente cero, se pone a prueba la hipótesis nula contra la hipótesis alternativa.
Análisis de Correlación
EL objetivo de un estudio de correlación es determinar la consistencia de una relación entre observaciones por partes. EL termino “correlación “significa relación mutua, ye que indica el grado en el que los valores de una variable se relacionan con los valores de otra. Se considera tres técnicas de correlación uno para datos de medición, otro para datos jerarquizados y el último para clasificaciones nominales
buenas noches profe lino le mando muchos saludos.aqui rebisando su blog
bueno tomaré en cuenta todo lo que dejó publicado.gracias......chao
REGRESION Y CORRELACION
Regresión y Correlación
La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muestrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos
Los datos necesarios para análisis de regresión y correlación provienen de observaciones de variables relacionadas.
Regresión lineal
La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación matemática lineal que describe la reacción entre dos variables.
La regresión puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo.
La finalidad de una ecuación de regresión seria estimar los valores de una variable con base en los valores conocidos de la otra.
Otra forma de emplear una ecuación de regresión es para explicar los valores de una variable en término de otra. Es decir se puede intuir una relación de causa y efecto entre dos variables. El análisis de regresión únicamente indica qué relación matemática podría haber, de existir una. Ni con regresión ni con la correlación se pude establecer si una variable tiene “causa “ciertos valores de otra variable.
Ecuación Lineal
Dos características importantes de una ecuación lineal
la independencia de la recta
la localización de la recta en algún punto. Una ecuación lineal tiene la forma
y = a + bx
En la que a y b son valores que se determina a partir de los datos de la muestra; a indica la altura de la recta en x= 0, y b señala su pendiente. La variable y es la que se habrá de predecir, y x es la variable predictora.
Determinación de la ecuación matemática
En la regresión, los valores de y son predichos a partir de valores de x dados o conocidos. La variable y recibe le nombre variable dependiente y la variable x, el de variable independiente.
Métodos de mínimos cuadrados
EL procedimiento mas utilizado por adaptar una recta aun conjunto de punto se le que conoce como método de mínimos cuadrados. La recta resultante presenta 2 característica importantes
es nula la suma desviaciones verticales en los puntos a partir de la recta
es mínima la suma de los cuadrados de dicha desviaciones
(yi - yc)2
En el cual
Yi = valor esperado de y
Yc= valor calculado de y utilizando la ecuación de mínimos cuadrados con el valor correspondientes x para yi
Los valores de a y b para la recta es Yc = a + bx que minimiza la suma de los cuadrados de la desviación “ecuaciones normales “
y = na + (x)
xy= a (x) +b (x2)
En las que n es el numero de pares de observaciones. Evaluando las cantidades x, y, etc. Se puede resolver estas dos ecuaciones simultáneamente para determinar a b. la ecuaciones puede despejarse. Se obtuvieron dos formulas aun para a y otra para b.
n(xy)- (x)(y)
b=
n(x2)-(x)2
y - b x
a=
n
Inferencia en el análisis de regresión
Los supuestos para el análisis de regresión son como:
Existen datos de medición para a x y z.
la variable dependiente es una variable aleatoria.
para cada valor de x, existe una distribución condicional de la qué es de naturaleza normal
la desviación estándar de toda las distribuciones condicionales son iguales
EL error estándar de estimación
La determinante primaria de la exactitud es el grado de dispersión de la población: cuanto mas dispersa este, menor será la exactitud de la estimación. El grado de dispersión en la población se puede estimar a partir del grado de dispersión en las observaciones de la muestra con respecto a la línea de regresión calculada, utilizando la formula.
Se = " (yi -yc)
n-2
en la cual:
yi = cada valor de y
yc = valor de línea de regresión correspondiente a partir de la ecuación de regresión.
n = números de observaciones.
La formula anterior no se utiliza por lo general para cálculos reales, es mas fácil trabajar con la formula simplificada
Se "y2 - a y - b xy
n - 2
Inferencia de acerca de la pendiente de una línea de regresión
Aun cuando es muy poca o nula relación entre dos variables de aun población, es posible obtener valores maestrales que hacen que parezca que la variables están relacionadas, es importantes probar los resultados tales de caculo, a fin determinar si son significativos (es decir si los parámetros verdaderos no son cero), Si no existe ninguna relación se esperaría obtener aun pendiente cero, se pone a prueba la hipótesis nula contra la hipótesis alternativa.
La significación del coeficiente de regresión se puede probar comparándolo con su desviación estándar
t = valor de la muestra - valor esperado
Desviación estándar
Análisis de regresión lineal múltiple
La regresión múltiple comprende tres o más variables. Existe solo una variable dependiente, pero hay dos o mas tipo independiente. Esta operación al desarrollo de una ecuación que se pede utilizar para predecir valore de y, respecto a valores dados de la diferencia variables independientes adicionales es incrementar la capacidad predicativa sobre la de la regresión lineal simple.
Las técnicas de los mínimos cuadrados se utilizan para obtener ecuaciones de regresión.
Yc= a +b1x1+b2x2+…bkxk
a = ordenada en el origen
b1= pendiente
k = numero de variables independientes
Un análisis de regresión simple de dos variable da lugar a la ecuación de una recta, un problema de tres variables produce un plano, y un problema de k variables implica un hiperplano de a
(k +1) dimensiones.
Análisis de Correlación
EL objetivo de un estudio de correlación es determinar la consistencia de una relación entre observaciones por partes. EL termino “correlación “significa relación mutua, ye que indica el grado en el que los valores de una variable se relacionan con los valores de otra. Se considera tres técnicas de correlación uno para datos de medición, otro para datos jerarquizados y el último para clasificaciones nominales.
Datos Continuos: r de Pearson
EL grado de relación entre dos variables continuas se resume mediante un coeficiente de correlación que se conoce como “r de Pearson “en honor del gran matemático Kart Pearson, quien ideo este método. Esta técnica es valida mientras si es posible establecer ciertos supuestos bastante estrictos. Tales supuestos son los siguientes:
Tanto x como y son variables continuas aleatorias. Es decir, a diferencia del análisis de referencia de regresión, no es aceptable seleccionar ciertos valores de x, y después medir y; tanto y como x deben de variar libremente.
La distribución conjunta de frecuencia es normal. Esto recibe el nombre de de distribución normal divariada.
Carácter de r
El coeficiente de relación presenta dos propiedades que establecen la naturaleza de una relación entre dos variables. Una es su signo (+ o -) y la otra, es su magnitud. El signo es igual al de la pendiente de una recta que podría “ajustarse” a los datos si estos se graficaran en un diagrama de dispersión, y la magnitud de r indica cuan cerca esta de la “recta” tales puntos.
Método practicar para calcular r
Dado que los cálculos necesarios pueden requerir mucho tiempo especialmente cuando se resta las medias del grupo de cada observación se elevan a cuadrado esas diferencias. Existe una versión, la cual simplifica los cálculos:
r= n ("xy)-("x)("y) _
"n("x2)-("x)2 ·"n("y2)("y)2
Existen 3 formas posibles para obtener el valor de r en el caso de datos de medición: estandarizar cada conjunto y hallar el producto medio, calcular el coeficiente de determinación r2 y obtener su raíz cuadrada como utilizar la formula. Para un conjunto de datos los tres métodos producirán el mismo valor para r no obstante cada método agrega algo a la comprensión del significado del termino “correlación”
Inferencia acerca del coeficiente de correlación
Intervalo de confianza para la correlación de la población
El valor del coeficiente de correlación de la muestra se puede utilizar como un estimado de la correlación verdadera de población existen varios métodos para obtener un método de confianza para pero quizás la forma mas directa es usar un diagrama.
Si se examinan el diagrama se observara que el intervalo de los valores potenciales (no conocidos) se indica a lo largo de la escala vertical los posibles valores r de la muestra se indica en la escala inferior una serie de curvas representan tamaño de muestras seleccionadas.
Prueba de significación de r
Puede ser necesario evaluar una aseveración con respecto al valor de . La forma mas sencilla es obtener un intervalo de confianza para r y observar si el valor propuesto esta incluido en el intervalo de ser así se rechaza a Ho y se acepta la alternativa.
Regresión y Correlación
La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muestrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos
Los datos necesarios para
EL error estándar de estimación
La determinante primaria de la exactitud es el grado de dispersión de la población: cuanto mas dispersa este, menor será la exactitud de la estimación. El grado de dispersión en la población se puede estimar a partir del grado de dispersión en las observaciones de la muestra con respecto a la línea de regresión calculada, utilizando la formula.
Se = " (yi -yc)
n-2
en la cual:
yi = cada valor de y
yc = valor de línea de regresión correspondiente a partir de la ecuación de regresión.
n = números de observaciones.
La formula anterior no se utiliza por lo general para cálculos reales, es mas fácil trabajar con la formula simplificada
Se "y2 - a y - b xy
n - 2
Inferencia de acerca de la pendiente de una línea de regresión
Aun cuando es muy poca o nula relación entre dos variables de aun población, es posible obtener valores maestrales que hacen que parezca que la variables están relacionadas, es importantes probar los resultados tales de caculo, a fin determinar si son significativos (es decir si los parámetros verdaderos no son cero), Si no existe ninguna relación se esperaría obtener aun pendiente cero, se pone a prueba la hipótesis nula contra la hipótesis alternativa.
La significación del coeficiente de regresión se puede probar comparándolo con su desviación estándar
t = valor de la muestra - valor esperado
Buenas tardes prof como esta espero que bien mi nombre es Romero Angela de seccion I-001 de ad de desastre bueno gracias por el material esto es lo que investigue nuevamente gracias por todo y que pase una feliz navidad
La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación. En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muestrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos Los datos necesarios para análisis de regresión y correlación provienen de observaciones de variables relacionadas.
Regresión lineal: La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación matemática lineal que describe la reacción entre dos variables.
La regresión puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo.
La finalidad de una ecuación de regresión seria estimar los valores de una variable con base en los valores conocidos de la otra.
Otra forma de emplear una ecuación de regresión es para explicar los valores de una variable en término de otra. Es decir se puede intuir una relación de causa y efecto entre dos variables. El análisis de regresión únicamente indica qué relación matemática podría haber, de existir una.
Ni con regresión ni con la correlación se pude establecer si una variable tiene “causa “ciertos valores de otra variable.
Ecuación Lineal: Dos características importantes de una ecuación lineal
*La independencia de la recta
*La localización de la recta en algún punto. Una ecuación lineal tiene la forma
y = a + bx
En la que a y b son valores que se determina a partir de los datos de la muestra; a indica la altura de la recta en x= 0, y b señala su pendiente. La variable y es la que se habrá de predecir, y x es la variable predictora.
Determinación de la ecuación matemática: En la regresión, los valores de y son predichos a partir de valores de x dados o conocidos. La variable y recibe le nombre variable dependiente y la variable x, el de variable independiente.
Métodos de mínimos cuadrados: EL procedimiento mas utilizado por adaptar una recta aun conjunto de punto se le que conoce como método de mínimos cuadrados. La recta resultante presenta 2 característica importantes
*Es nula la suma desviaciones verticales en los puntos a partir de la recta
*Es mínima la suma de los cuadrados de dicha desviaciones
(yi - yc)2
En el cual
Yi = valor esperado de y
Yc= valor calculado de y utilizando la ecuación de mínimos cuadrados con el valor correspondientes x para yi
Los valores de a y b para la recta es Yc = a + bx que minimiza la suma de los cuadrados de la desviación “ecuaciones normales “
y = na + (x)
xy= a (x) +b (x2)
En las que n es el numero de pares de observaciones. Evaluando las cantidades x, y, etc. Se puede resolver estas dos ecuaciones simultáneamente para determinar a b. la ecuaciones puede despejarse. Se obtuvieron dos formulas aun para a y otra para b.
n(xy)- (x)(y)
b=
n(x2)-(x)2
y - b x
a=
n
Inferencia en el análisis de regresión
Los supuestos para el análisis de regresión son como:
Existen datos de medición para a x y z.
La variable dependiente es una variable aleatoria.
Para cada valor de x, existe una distribución condicional de la qué es de naturaleza normal
La desviación estándar de toda las distribuciones condicionales son iguales
EL objetivo de un estudio de correlación es determinar la consistencia de una relación entre observaciones por partes. EL termino “correlación “significa relación mutua, ye que indica el grado en el que los valores de una variable se relacionan con los valores de otra.
Buenas tarde profesor lino soy la alumna de la seccion:I-003D de Administracion de desastre gracia por el material que dejo publicado en el blog que pase buenas tarde
Regresión y Correlación
La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muestrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos
No obstante, puede que exista una relación que no sea lineal, sino exponencial, parabólica, etc. En estos casos, el coeficiente de correlación lineal mediría mal la intensidad de la relación las variables, por lo que convendría utilizar otro tipo de coeficiente más apropiado.
Para ver, por tanto, si se puede utilizar el coeficiente de correlación lineal, lo mejor es representar los pares de valores en un gráfico y ver que forma describen.
El coeficiente de correlación lineal se calcula aplicando la siguiente fórmula:
Es decir:
Numerador: se denomina covarianza y se calcula de la siguiente manera: en cada par de valores (x,y) se multiplica la "x" menos su media, por la "y" menos su media. Se suma el resultado obtenido de todos los pares de valores y este resultado se divide por el tamaño de la muestra.
Denominador se calcula el produto de las varianzas de "x" y de "y", y a este produto se le calcula la raíz cuadrada.
Ni con regresión ni con la correlación se pude establecer si una variable tiene “causa “ciertos valores de otra variable.
Ecuación Lineal: Dos características importantes de una ecuación lineal
*La independencia de la recta
*La localización de la recta en algún punto. Una ecuación lineal tiene la forma
y = a + bx
En la que a y b son valores que se determina a partir de los datos de la muestra; a indica la altura de la recta en x= 0, y b señala su pendiente. La variable y es la que se habrá de predecir, y x es la variable predictora.
Determinación de la ecuación matemática: En la regresión, los valores de y son predichos a partir de valores de x dados o conocidos. La variable y recibe le nombre variable dependiente y la variable x, el de variable independiente.
Métodos de mínimos cuadrados: EL procedimiento mas utilizado por adaptar una recta aun conjunto de punto se le que conoce como método de mínimos cuadrados. La recta resultante presenta 2 característica importantes
*Es nula la suma desviaciones verticales en los puntos a partir de la recta
*Es mínima la suma de los cuadrados de dicha desviaciones
(yi - yc)2
En el cual
Yi = valor esperado de y
Yc= valor calculado de y utilizando la ecuación de mínimos cuadrados con el valor correspondientes x para yi
Los valores de a y b para la recta es Yc = a + bx que minimiza la suma de los cuadrados de la desviación “ecuaciones normales “
y = na + (x)
xy= a (x) +b (x2)
En las que n es el numero de pares de observaciones. Evaluando las cantidades x, y, etc. Se puede resolver estas dos ecuaciones simultáneamente para determinar a b. la ecuaciones puede despejarse. Se obtuvieron dos formulas aun para a y otra para b.
n(xy)- (x)(y)
b=
n(x2)-(x)2
y - b x
a=
n
Idania Higuera
Administracion de desastre
seccion:001
carlos perez
seccion 001
adm desastre
2 semestre
Regresión y Correlación.
La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muéstrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos
Regresión lineal.
La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación matemática lineal que describe la reacción entre dos variables.
La regresión puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo.
La finalidad de una ecuación de regresión seria estimar los valores de una variable con base en los valores conocidos de la otra.
Ecuación Lineal.
Dos características importantes de una ecuación lineal
La independencia de la recta
La localización de la recta en algún punto.
Una ecuación lineal tiene la forma y = a + bx
Análisis de Correlación.
Es el conjunto de técnicas estadísticas empleado para medir la intensidad de la asociación entre dos variables.
El principal objetivo del análisis de correlación consiste en determinar que tan intensa es la relación entre dos variables. Normalmente, el primer paso es mostrar los datos en un diagrama de dispersión.
Diagrama de Dispersión: es aquel grafico que representa la relación entre dos variables.
Variable Dependiente: es la variable que se predice o calcula. Cuya representación es "Y".
Variable Independiente: es la variable que proporciona las bases para el cálculo.
Coeficiente de Correlación: Describe la intensidad de la relación entre dos conjuntos de variables de nivel de intervalo. Es la medida de la intensidad de la relación lineal entre dos variables.
Análisis de regresión: Es la técnica empleada para desarrollar la ecuación y dar las estimaciones.
Ecuación de Regresión: es una ecuación que define la relación lineal entre dos variables.
Ecuación de regresión Lineal: Y’ = a + Bx
Ecuación de regresión Lineal Múltiple: Y’ = a + b1x1 + b2x2 + b3x3.
El coeficiente de correlación lineal mide el grado de intensidad de esta posible relación entre las variables. Este coeficiente se aplica cuando la relación que puede existir entre las variables es lineal (es decir, si representáramos en un gráfico los pares de valores de las dos variables la nube de puntos se aproximaría a una recta).
El coeficiente de correlación lineal nos permite determinar si, efectivamente, existe relación entre las dos variables. Una vez que se concluye que sí existe relación, la regresión nos permite definir la recta que mejor se ajusta a esta nube de puntos.
Regresión lineal.
Si representamos en un gráfico los pares de valores de una distribución bidimensional: la variable "x" en el eje horizontal o eje de abcisa, y la variable "y" en el eje vertical, o eje de ordenada.
buenas tardes profesor ya revise el meterial esta muy bueno se lo llego la prosima clase escrito el cual : La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muestrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
buenas tarde profesor aqui esta el resumen de la distribucion probabilistica ..... Distribución probabilística
Cuando se analiza un experimento aleatorio, se descubren factores de comportamiento de la probabilidad que siguen modelos propios y distintivos. Por ello, es frecuente asociar a estos experimentos una «función de probabilidad», que puede adoptar diversas formas y regirse por principios diferentes y cuyo estudio arroja luz sobre la naturaleza y las características del fenómeno físico o social ligado al experimento.
Regresión y Correlación.
La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muéstrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos
Regresión lineal.
La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación matemática lineal que describe la reacción entre dos variables.
La regresión puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo.
La finalidad de una ecuación de regresión seria estimar los valores de una variable con base en los valores conocidos de la otra.
Ecuación Lineal.
Dos características importantes de una ecuación lineal
La independencia de la recta
La localización de la recta en algún punto.
Una ecuación lineal tiene la forma y = a + bx
Análisis de Correlación.
Es el conjunto de técnicas estadísticas empleado para medir la intensidad de la asociación entre dos variables.
El principal objetivo del análisis de correlación consiste en determinar que tan intensa es la relación entre dos variables. Normalmente, el primer paso es mostrar los datos en un diagrama de dispersión.
Diagrama de Dispersión: es aquel grafico que representa la relación entre dos variables.
Variable Dependiente: es la variable que se predice o calcula. Cuya representación es "Y".
Variable Independiente: es la variable que proporciona las bases para el cálculo.
Coeficiente de Correlación: Describe la intensidad de la relación entre dos conjuntos de variables de nivel de intervalo. Es la medida de la intensidad de la relación lineal entre dos variables.
Análisis de regresión: Es la técnica empleada para desarrollar la ecuación y dar las estimaciones.
Ecuación de Regresión: es una ecuación que define la relación lineal entre dos variables.
Ecuación de regresión Lineal: Y’ = a + Bx
Ecuación de regresión Lineal Múltiple: Y’ = a + b1x1 + b2x2 + b3x3.
El coeficiente de correlación lineal mide el grado de intensidad de esta posible relación entre las variables. Este coeficiente se aplica cuando la relación que puede existir entre las variables es lineal (es decir, si representáramos en un gráfico los pares de valores de las dos variables la nube de puntos se aproximaría a una recta).
El coeficiente de correlación lineal nos permite determinar si, efectivamente, existe relación entre las dos variables. Una vez que se concluye que sí existe relación, la regresión nos permite definir la recta que mejor se ajusta a esta nube de puntos.
Regresión lineal.
Si representamos en un gráfico los pares de valores de una distribución bidimensional: la variable "x" en el eje horizontal o eje de abcisa, y la variable "y" en el eje vertical, o eje de ordenada.
seccion 001
adm desastre
2 semestre daniel ruiz
buenas noches profesor estube revisando su pagina y esto lo encontre interesante :Variables estadísticas bidimensionales
Se trata de variables que surgen cuando se estudian dos características asociadas a la observación de un fenómeno.
Ejemplo 1.- Estudiamos la talla, medida en cm. y el peso, medido en kg. de un grupo de 10 personas, podemos obtener los siguientes valores:
TALLA (cm) 160 165 168 170 171 175 175 180 180 182
PESO (kg) 55 58 58 61 67 62 66 74 79 83
Podemos llamar X a la talla e Y al peso con lo que se obtendría la variable bidimensional (X, Y) que toma 10 valores, que son las 10 parejas de valores de la tabla anterior: (160,55), (165,58), etc.
Cuando el número de valores de la variable bidimensional no es muy grande, los mismos se expresan en una tabla semejante a la anterior, pero en algunos casos el número de "parejas" de valores (x,y) es grande y además muchos de ellos aparecen repetidos; en este caso se utiliza una "Tabla de doble entrada" como la que se muestra a continuación en el ejemplo 2.
En la primera fila se colocan los valores de una de las características o variable que componen la variable bidimensional y en la primera columna los de la otra.
Ejemplo 2.- Se representa por X el número de hijos de 100 familias y por Y el número de hijas:
nº hijas (Y)
0
1
2
3
nº hijos (X)
-----------
--
--
--
--
0
-----------
10
15
15
3
1
----------
10
12
7
2
2
----------
8
4
3
1
3
----------
3
2
1
0
4
----------
2
1
1
0
La lectura de esta tabla es sencilla. Por ejemplo: habría 7 familias que tendrían 1 hijo y 2 hijas y ninguna familia tendría 3 hijos y 3 hijas.
En realidad la tabla de doble entrada anterior se convertiría en una tabla simple si escribiéramos los 100 pares de valores iguales o repetidos en una tabla simple.
Los ejemplos con que vamos a trabajar este tema serán del primer tipo por razones de limitación a la hora de visualizar más número de valores en las escenas. Esto no limita las posibilidades de estudiar el tema y entender los conceptos básicos.
seccion 001..adm de desastres
La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muéstrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos
Los datos necesarios para análisis de regresión y correlación provienen de observaciones de variables relacionadas.
Regresión lineal
La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación matemática lineal que describe la reacción entre dos variables.
La regresión puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo.
La finalidad de una ecuación de regresión seria estimar los valores de una variable con base en los valores conocidos de la otra.
Otra forma de emplear una ecuación de regresión es para explicar los valores de una variable en término de otra. Es decir se puede intuir una relación de causa y efecto entre dos variables. El análisis de regresión únicamente indica qué relación matemática podría haber, de existir una. Ni con regresión ni con la correlación se pude establecer si una variable tiene “causa “ciertos valores de otra variable.
Ecuación Lineal
Dos características importantes de una ecuación lineal
• la independencia de la recta
• la localización de la recta en algún punto. Una ecuación lineal tiene la forma
y = a + bx
En la que a y b son valores que se determina a partir de los datos de la muestra; a indica la altura de la recta en x= 0, y b señala su pendiente. La variable y es la que se habrá de predecir, y x es la variable predictora.
• Métodos de mínimos cuadrados
EL procedimiento mas utilizado por adaptar una recta aun conjunto de punto se le que conoce como método de mínimos cuadrados. La recta resultante presenta 2 característica importantes
• es nula la suma desviaciones verticales en los puntos a partir de la recta
• es mínima la suma de los cuadrados de dicha desviaciones (yi - yc)2
• Prueba de significación de r
Puede ser necesario evaluar una aseveración con respecto al valor de . La forma mas sencilla es obtener un intervalo de confianza para r y observar si el valor propuesto esta incluido en el intervalo de ser así se rechaza a Ho y se acepta la alternativa.
Datos jerarquizados de: r Spearman
Es una técnica no paramétrica que utiliza para medir la fuerza de una relación por pares de 2 variables cuando los datos se encuentran en forma jerarquizados. El objeto de calcular un coeficiente de correlación estos ejemplos es determinar el grado en el que dos conjuntos de jerarquización concuerdan o no. Esta técnica también se puede extender a calificaciones u otro tipo de medición si estas se convierten a rangos.
Las medidas de l grado de concordancia son sol cuadrados de las diferencias entre los dos conjuntos de rangos: si la suma de éstos es pequeña, esto significa que hay acuerdo; si la suma es grande, esto indica lo contrario. EL calculo real de la correlación comprende la formula.
rsp = 1 - 6"d2
n(n2 -1)
En la cual n es el número de observaciones y "d2 es la suma de los cuadrados de la diferencia entre los rangos. El coeficiente de correlación de jerarquía obtenido recibe el nombre de r Spearman. La suma de la diferencia es cero. Esto no sirve como una comprobación útil de los cálculos aunque no es necesaria en la fórmula.
El procedimiento es como el siguiente:
• Obtener la diferencia en rango para cada par de observaciones
• Como comprobaciones, verificar que la diferencias se sumen a 0
• elevar el cuadrado la diferencias
• sumar los cuadrados de la diferencia para obtener "d2
• Calcular rsp
Si el valor rsp es pequeño para situaciones en donde n es mayor que 10, la hipótesis nula de rsp = 0 puede ser probada utilizándola la fórmula
Análisis:
Se pueden encontrar varios tipos de regresión, por ejemplo:
1. Regresión lineal simple
2. Regresión múltiple ( varias variables)
3. Regresión logística
a. Simple b) Múltiple, etc.
La regresión lineal técnica que usa variables aleatorias, continuas se diferencia del otro método analítica que es la correlación, por que esta última no distingue entre las variables respuesta y la variable explicativa por que las trata en forma simétrica.
La mate matización nos da ecuaciones para manipular los datos, como por ejemplo medir la circunferencia de los niños y niñas y que parece incrementarse entre las edades de 2 meses y 18 años, aquí podemos inferir o predecir que las circunferencias del cráneo cambiara con la edad, en este ejercicio la circunferencia de la cabeza es la respuesta y la edad la variable explicativa.
En la regresión tenemos ecuaciones que nos representan las diferentes clases de regresión:
Regresión Lineal : y = A + Bx
Regresión Logarítmica : y = A + BLn(x)
Regresión Exponencial : y = Ac(bx)
Regresión Cuadrática: y = A + Bx +Cx2
Relación funcional entre dos variables
Una relación funcional se expresa mediante una función matemática.
Si X es la variable independiente e Y es la variable dependiente, una relación funcional tiene la forma:
Y=f(X
DISTRIBUCIONES BIDIMENSIONALES
Cuando sobre una población estudiamos simultáneamente los valores de dos variables estadísticas, el conjunto de los pares de valores correspondientes a cada individuo se denomina distribución bidimensional.
Ejemplo 1:
Las notas de 10 alumnos en Matemáticas y en Lengua vienen dadas en la siguiente tabla:
MATEMÁTICAS 2 4 5 5 6 6 7 7 8 9
LENGUA 2 2 5 6 5 7 5 8 7 10
Los pares de valores {(2,2),(4,2),(5,5),...;(8,7),(9,10)}, forman la distribución bidimensional.
NUBE DE PUNTOS O DIAGRAMA DE DISPERSIÓN
La primera forma de describir una distribución bidimensional es representar los pares de valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o diagrama de dispersión.
luis guerrero c.i: 13 547 035
adm de desastres
La regresión y la correlación
son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muéstrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos
Los datos necesarios para análisis de regresión y correlación provienen de observaciones de variables relacionadas.
Regresión lineal
La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación matemática lineal que describe la reacción entre dos variables.
La regresión puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo.
La finalidad de una ecuación de regresión seria estimar los valores de una variable con base en los valores conocidos de la otra.
Otra forma de emplear una ecuación de regresión es para explicar los valores de una variable en término de otra. Es decir se puede intuir una relación de causa y efecto entre dos variables. El análisis de regresión únicamente indica qué relación matemática podría haber, de existir una. Ni con regresión ni con la correlación se pude establecer si una variable tiene “causa “ciertos valores de otra variable.
Ecuación Lineal
Dos características importantes de una ecuación lineal
• la independencia de la recta
• la localización de la recta en algún punto. Una ecuación lineal tiene la forma
y = a + bx
En la que a y b son valores que se determina a partir de los datos de la muestra; a indica la altura de la recta en x= 0, y b señala su pendiente. La variable y es la que se habrá de predecir, y x es la variable predictora.
• Métodos de mínimos cuadrados
EL procedimiento mas utilizado por adaptar una recta aun conjunto de punto se le que conoce como método de mínimos cuadrados. La recta resultante presenta 2 característica importantes
• es nula la suma desviaciones verticales en los puntos a partir de la recta
• es mínima la suma de los cuadrados de dicha desviaciones (yi - yc)2
• Prueba de significación de r
Puede ser necesario evaluar una aseveración con respecto al valor de . La forma mas sencilla es obtener un intervalo de confianza para r y observar si el valor propuesto esta incluido en el intervalo de ser así se rechaza a Ho y se acepta la alternativa.
Datos jerarquizados de: r Spearman
Es una técnica no paramétrica que utiliza para medir la fuerza de una relación por pares de 2 variables cuando los datos se encuentran en forma jerarquizados. El objeto de calcular un coeficiente de correlación estos ejemplos es determinar el grado en el que dos conjuntos de jerarquización concuerdan o no. Esta técnica también se puede extender a calificaciones u otro tipo de medición si estas se convierten a rangos.
Las medidas de l grado de concordancia son sol cuadrados de las diferencias entre los dos conjuntos de rangos: si la suma de éstos es pequeña, esto significa que hay acuerdo; si la suma es grande, esto indica lo contrario. EL calculo real de la correlación comprende la formula.
rsp = 1 - 6"d2
n(n2 -1)
En la cual n es el número de observaciones y "d2 es la suma de los cuadrados de la diferencia entre los rangos. El coeficiente de correlación de jerarquía obtenido recibe el nombre de r Spearman. La suma de la diferencia es cero. Esto no sirve como una comprobación útil de los cálculos aunque no es necesaria en la fórmula.
El procedimiento es como el siguiente:
• Obtener la diferencia en rango para cada par de observaciones
• Como comprobaciones, verificar que la diferencias se sumen a 0
• elevar el cuadrado la diferencias
• sumar los cuadrados de la diferencia para obtener "d2
• Calcular rsp
Si el valor rsp es pequeño para situaciones en donde n es mayor que 10, la hipótesis nula de rsp = 0 puede ser probada utilizándola la fórmula
Análisis de regresión lineal múltiple
La regresión múltiple comprende tres o más variables. Existe solo una variable dependiente, pero hay dos o mas tipo independiente. Esta operación al desarrollo de una ecuación que se pede utilizar para predecir valore de y, respecto a valores dados de la diferencia variables independientes adicionales es incrementar la capacidad predicativa sobre la de la regresión lineal simple.
Las técnicas de los mínimos cuadrados se utilizan para obtener ecuaciones de regresión.
Yc= a +b1x1+b2x2+…bkxk
a = ordenada en el origen
b1= pendiente
k = numero de variables independientes
Un análisis de regresión simple de dos variable da lugar a la ecuación de una recta, un problema de tres variables produce un plano, y un problema de k variables implica un hiperplano de a
(k +1) dimensiones.
Análisis de Correlación
EL objetivo de un estudio de correlación es determinar la consistencia de una relación entre observaciones por partes. EL termino “correlación “significa relación mutua, ye que indica el grado en el que los valores de una variable se relacionan con los valores de otra. Se considera tres técnicas de correlación uno para datos de medición, otro para datos jerarquizados y el último para clasificaciones nominales.
Datos Continuos: r de Pearson
EL grado de relación entre dos variables continuas se resume mediante un coeficiente de correlación que se conoce como “r de Pearson “en honor del gran matemático Kart Pearson, quien ideo este método. Esta técnica es valida mientras si es posible establecer ciertos supuestos bastante estrictos. Tales supuestos son los siguientes:
Tanto x como y son variables continuas aleatorias. Es decir, a diferencia del análisis de referencia de regresión, no es aceptable seleccionar ciertos valores de x, y después medir y; tanto y como x deben de variar libremente.
La distribución conjunta de frecuencia es normal. Esto recibe el nombre de de distribución normal divariada.
buenas tardes querido profesor
este es mi analisis.......................................
La regresión y la correlación
son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muéstrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos
Los datos necesarios para análisis de regresión y correlación provienen de observaciones de variables relacionadas.
Regresión lineal
La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación matemática lineal que describe la reacción entre dos variables.
La regresión puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo.
La finalidad de una ecuación de regresión seria estimar los valores de una variable con base en los valores conocidos de la otra.
Otra forma de emplear una ecuación de regresión es para explicar los valores de una variable en término de otra. Es decir se puede intuir una relación de causa y efecto entre dos variables. El análisis de regresión únicamente indica qué relación matemática podría haber, de existir una.
Ni con regresión ni con la correlación se pude establecer si una variable tiene “causa “ciertos valores de otra variable.
Ecuación Lineal
Dos características importantes de una ecuación lineal
• la independencia de la recta
• la localización de la recta en algún punto. Una ecuación lineal tiene la forma
y = a + bx
EL procedimiento mas utilizado por adaptar una recta aun conjunto de punto se le que conoce como método de mínimos cuadrados. La recta resultante presenta 2 característica importantes
• es nula la suma desviaciones verticales en los puntos a partir de la recta
• es mínima la suma de los cuadrados de dicha desviaciones (yi - yc)2
´
La regresión lineal técnica que usa variables aleatorias, continuas se diferencia del otro método analítica que es la correlación, por que esta última no distingue entre las variables respuesta y la variable explicativa por que las trata en forma simétrica.
La mate matización nos da ecuaciones para manipular los datos, como por ejemplo medir la circunferencia de los niños y niñas y que parece incrementarse entre las edades de 2 meses y 18 años, aquí podemos inferir o predecir que las circunferencias del cráneo cambiara con la edad, en este ejercicio la circunferencia de la cabeza es la respuesta y la edad la variable explicativa.
En la regresión tenemos ecuaciones que nos representan las diferentes clases de regresión:
Regresión Lineal : y = A + Bx
Regresión Logarítmica : y = A + BLn(x)
Regresión Exponencial : y = Ac(bx)
Regresión Cuadrática: y = A + Bx +Cx2
Datos nominales: el coeficiente de contingencia
Cuando ambas variables se miden en escalas nominales ( es decir , categorías ) , el análisis es fácilmente mediante el desarrollo de una tabla de contingencia semejante a la que se utilizo en el análisis de k proporciones ( prueba de ji cuadrada ), el procedimiento en realidad de aun extensión del análisis de una tabla r * k.
Una medida de relación es calcular el coeficiente de contingencia en C, donde
x2
C=
X2 + N
Un aspecto interesante de una tabla ji cuadrada es que l tamaño máximo posible de x2 es función de N, de las observaciones y del tamaño de la tabla.
En le caso de tabla con los valores cuadrado, esto lleva obtener un valor máximo de C de
K - 1
C max =
k
En el cual k es el número de fila o columnas. La comprar C con C max se pude obtener una idea de la intensidad de la asociación entre la variables.
Esta es una relación moderada, no muy intensa. Su interpretación exacta en parte de la naturaleza de los datos y de los resultados comparables que se obtengan de otros estudios, por lo que es difícil establecer valores definitivos dé intensidades.
Se bebe observar que la formula no fórmula no produce automáticamente el signo del coeficiente de contingencia. DE ahí que no siempre resulte evidente el existe aun relación positiva o negativa.
Ventajas:
Nos e requiere de supuestos con respectos a la formula de población
Solamente se necesita una medición nominal ( categorías)
Limitaciones
El limite superior de C es menor que 1.00 incluso Para un correlación perfecta.
El límite superior depende del tamaño de la tabla, por lo que no son comparables los coeficientes de contingencia de tablas de tamaño diferente
El coeficiente de contingencia no es directamente comprable con otras medidas de correlación, como la r de Pearson y la r de Spearman, o incluso con otras tablas de contingencia de tamaño diferente.
Cada casilla deberá tener una frecuencia esperada por lo menos 5.
C max solamente se puede calcular a partir de tabla de valores al cuadrado.
HOLA PROFESOR:
Análisis de Regresión: Es un procedimiento estadístico que estudia la relación funcional entre variables. Con el objeto de predecir una en función de la/s otra/s.
Análisis de Correlación: Un grupo de técnicas estadísticas usadas para medir la intensidad de la relación entre dos variables. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos
Diagrama de Dispersión: Es un gráfico que muestra la intensidad y el sentido de la relación entre dos variables de interés.
Variable dependiente (respuesta, predicha, endógena): es la variable que se desea predecir o estimar
Variables independientes (predictoras, explicativas exógenas). Son las variables que proveen las bases para estimar.
Regresión simple: interviene una sola variable independiente
Regresión múltiple: intervienen dos o más variables independientes.
Regresión lineal: la función es una combinación lineal de los parámetros.
Regresión no lineal: la función que relaciona los parámetros no es una combinación lineal
El Coeficiente de Correlación requiere variables medidas en escala de intervalos o de proporciones.
Un modelo de regresión, es una manera de expresar dos ingredientes esenciales de una relación estadística.
anny valderrama y martina padilla 003d desestres
hola amado profesor esperamos que este pasando una feliz navidad y que este nuevo año que viene sea de exito y prosperidad para su vida
nuestros analisis es
LA REGRESION Y CORRELACION son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muéstrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos
Los datos necesarios para análisis de regresión y correlación provienen de observaciones de variables relacionadas.
Regresión lineal
La regresión puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo.
.El análisis de regresión únicamente indica qué relación matemática podría haber, de existir una. Ni con regresión ni con la correlación se pude establecer si una variable tiene “causa “ciertos valores de otra variable.
Ecuación Lineal
Dos características importantes de una ecuación lineal
• la independencia de la recta
• la localización de la recta en algún punto. Una ecuación lineal tiene la forma
y = a + bx
En la que a y b son valores que se determina a partir de los datos de la muestra; a indica la altura de la recta en x= 0, y b señala su pendiente. La variable y es la que se habrá de predecir, y x es la variable predictora.
Puede ser necesario evaluar una aseveración con respecto al valor de . La forma mas sencilla es obtener un intervalo de confianza para r y observar si el valor propuesto esta incluido en el intervalo de ser así se rechaza a Ho y se acepta la alternativa.
Datos jerarquizados de: r Spearman
Es una técnica no paramétrica que utiliza para medir la fuerza de una relación por pares de 2 variables cuando los datos se encuentran en forma jerarquizados. El objeto de calcular un coeficiente de correlación estos ejemplos es determinar el grado en el que dos conjuntos de jerarquización concuerdan o no. Esta técnica también se puede extender a calificaciones u otro tipo de medición si estas se convierten a rangos.
Las medidas de l grado de concordancia son sol cuadrados de las diferencias entre los dos conjuntos de rangos: si la suma de éstos es pequeña, esto significa que hay acuerdo; si la suma es grande, esto indica lo contrario. EL calculo real de la correlación comprende la formula.
rsp = 1 - 6"d2
n(n2 -1)
En la cual n es el número de observaciones y "d2 es la suma de los cuadrados de la diferencia entre los rangos. El coeficiente de correlación de jerarquía obtenido recibe el nombre de r Spearman. La suma de la diferencia es cero. Esto no sirve como una comprobación útil de los cálculos aunque no es necesaria en la fórmula.
El procedimiento es como el siguiente:
• Obtener la diferencia en rango para cada par de observaciones
• Como comprobaciones, verificar que la diferencias se sumen a 0
• elevar el cuadrado la diferencias
• sumar los cuadrados de la diferencia para obtener "d2
• Calcular rsp
Si el valor rsp es pequeño para situaciones en donde n es mayor que 10, la hipótesis nula de rsp = 0 puede ser probada utilizándola la fórmula
Análisis:
Se pueden encontrar varios tipos de regresión, por ejemplo:
1. Regresión lineal simple
2. Regresión múltiple ( varias variables)
3. Regresión logística
a. Simple b) Múltiple, etc.
La regresión lineal técnica que usa variables aleatorias, continuas se diferencia del otro método analítica que es la correlación, por que esta última no distingue entre las variables respuesta y la variable explicativa por que las trata en forma simétrica.
La mate matización nos da ecuaciones para manipular los datos, como por ejemplo medir la circunferencia de los niños y niñas y que parece incrementarse entre las edades de 2 meses y 18 años, aquí podemos inferir o predecir que las circunferencias del cráneo cambiara con la edad, en este ejercicio la circunferencia de la cabeza es la respuesta y la edad la variable explicativa.
En la regresión tenemos ecuaciones que nos representan las diferentes clases de regresión:
Regresión Lineal : y = A + Bx
Regresión Logarítmica : y = A + BLn(x)
Regresión Exponencial : y = Ac(bx)
Regresión Cuadrática: y = A + Bx +Cx2
Relación funcional entre dos variables
Una relación funcional se expresa mediante una función matemática.
Si X es la variable independiente e Y es la variable dependiente, una relación funcional tiene la forma:
Y=f(X
DISTRIBUCIONES BIDIMENSIONALES
Cuando sobre una población estudiamos simultáneamente los valores de dos variables estadísticas, el conjunto de los pares de valores correspondientes a cada individuo se denomina distribución bidimensional.
Ejemplo 1:
Las notas de 10 alumnos en Matemáticas y en Lengua vienen dadas en la siguiente tabla:
MATEMÁTICAS 2 4 5 5 6 6 7 7 8 9
LENGUA 2 2 5 6 5 7 5 8 7 10
Los pares de valores {(2,2),(4,2),(5,5),...;(8,7),(9,10)}, forman la distribución bidimensional.
NUBE DE PUNTOS O DIAGRAMA DE DISPERSIÓN
La primera forma de describir una distribución bidimensional es representar los pares de valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o diagrama de dispersión.
buenas tardes profesor espero que este pasando una feliz navidad con su familia y principalmente con dios le escribe el alumno javier ruiz de la torre de la seccion 001-d de administracion de desastres
regresion y correlacion
analisis:
# Marco Teórico
A fin de facilitar la comprensión del presente trabajo definiremos algunos conceptos basicos.
Análisis de Correlación: Es el conjunto de técnicas estadísticas empleado para medir la intensidad de la asociación entre dos variables.
El principal objetivo del análisis de correlación consiste en determinar que tan intensa es la relación entre dos variables. Normalmente, el primer paso es mostrar los datos en un diagrama de dispersión.
Diagrama de Dispersión:es aquel grafico que representa la relación entre dos variables.
Variable Dependiente:es la variable que se predice o calcula. Cuya representación es "Y"
Variable Independiente: es la variable que proporciona las bases para el calculo. Cuya representación es: X1,X2,X3.......
Coeficiente de Correlación: Describe la intensidad de la relación entre dos conjuntos de variables de nivel de intervalo. Es la medida de la intensidad de la relación lineal entre dos variables.
El valor del coeficiente de correlación puede tomar valores desde menos uno hasta uno, indicando que mientras más cercano a uno sea el valor del coeficiente de correlación, en cualquier dirección, más fuerte será la asociación lineal entre las dos variables. Mientras más cercano a cero sea el coeficiente de correlación indicará que más débil es la asociación entre ambas variables. Si es igual a cero se concluirá que no existe relación lineal alguna entre ambas variables.
Análisis de regresión:Es la técnica empleada para desarrollar la ecuación y dar las estimaciones.
Ecuación de Regresión:es una ecuación que define la relación lineal entre dos variables.
Ecuación de regresión Lineal: Y’ = a + Bx
Ecuación de regresión Lineal Múltiple: Y’ = a + b1X1 + b2X2 + b3X3...
Principio de Mínimos Cuadrados:Es la técnica empleada para obtener la ecuación de regresión, minimizando la suma de los cuadrados de las distancias verticales entre los valores verdaderos de "Y" y los valores pronosticados "Y".
Análisis de regresión y Correlación Múltiple:consiste en estimar una variable dependiente, utilizando dos o más variables independientes.
Ecuación de regresión Múltiple: La forma general de la ecuación de regresión múltiple con dos variables independientes es:
Y' = a + b1X1 + b2X2
X1,X2 : Variables Independientes
a : es la ordenada del punto de intersección con el eje Y.
b1 : Coeficiente de Regresión (es la variación neta en Y por cada unidad de
variación en X1.).
b2 : Coeficiente de Regresión (es el cambio neto en Y para cada cambio
unitario en X2).
Prueba Global.- esta prueba investiga básicamente si es posible que todas las variables independientes tengan coeficientes de regresión neta iguales a 0.
# Desarrollo de un Caso.
Una agencia de Viajes desea saber la relación que hay entre las ventas, el presupuesto destinado a publicidad, y las comisiones de los vendedores para esto presenta los siguientes datos. Realice los análisis respectivos.
Y
X1
X2
AÑO
VENTAS
GASTOS DE PUBLICIDAD
COMISIONES DE VENDEDORES
2000
264000
550
15840
2001
384000
590
19250
2002
400200
680
26013
2003
422400
700
16896
2004
543000
750
16290
ANÁLISIS DE DATOS:
Se van a utilizar las siguientes variables:
Variables Independientes:
1.- Gastos de Publicidad
2.- Comisión de vendedores
Variable dependiente:
- Ventas
Utilizando el Excel obtenemos los siguientes datos.
Estadísticas de la Regresión
Coeficiente de correlación múltiple
0.92092
Coeficiente de determinación R2
0.84810
R2 ajustado
0.69619
Error típico
54887.83156
Observaciones
5
De aquí se puede decir:
- De acuerdo al valor del coeficiente de correlación múltiple, podemos afirmar que la variable X1 (Gastos de Publicidad) y X2 (Comisión de vendedores) se encuentran asociadas en forma directa de una manera muy fuerte con la variable dependiente Ventas, en un 92%.
- De acuerdo al Coeficiente de determinación R2, podemos decir que el 85% de las ventas pueden ser explicadas por los gastos de publicidad y las comisiones de los vendedores.
A N Á L I S I S D E V A R I A N Z A
Grados de libertad
Suma de cuadrados
Prom. de los cuadrados
F
Valor crítico de F
Regresión
2
33640459893
16820229947
5.5832
0.15190282
Residuos
2
6025348107
3012674053
Total
4
39665808000
Coeficientes
Error típico
Estadístico t
Probab.
Inf. 95%
Sup. 95%
Inferior 95.0%
Sup. 95.0%
Intercepción
-289315.16
242459.39
-1.193
0.35513
-1332534.446
753904.118
-1332534.446
753904.118
GSTOS DE PUBLICID.
1123.49
336.22
3.342
0.07908
-323.1275965
2570.108
-323.128
2570.108
COM. DE VENDED.
-2.27
6.55
-0.346
0.76245
-30.45400257
25.922
-30.454
25.922
De aquí se desprende la ecuación de regresión múltiple:
Y = - 289315 + 1123 X1 - 2.27 X2
Prueba Global: Verificación de la validez del modelo de regresión Múltiple.
Formulación de Hipótesis:
Hp: B1 = B2 = 0
Ha: B1 B2 0
Si se acepta la hipótesis planteada, significa que ninguno de los factores (X1,X2) son relevantes para explicar los cambios en Y.
De acuerdo a la tabla de análisis de la varianza F calculado es 5.58 y el p-valor es 0.15, de lo cual podemos decir que La hipótesis planteada se rechaza y se acepta la hipótesis alternativa, por que el F calculado es mayor que el p-valor.
Hasta ahora se ha demostrado que algunos, pero no necesariamente todos los coeficientes de regresión, no son iguales a cero y, por o tanto son útiles para las predicciones. El siguiente paso consiste en probar individualmente las variables para determinar cuales coeficientes de regresión pueden ser cero y cuales no.
Del análisis mediante Excell tenemos el siguiente cuadro.
VENTAS VS GASTOS DE PUBLICIDAD
Estadísticas de la regresión
Coeficiente de correlación múltiple
0.915976333
Inferencia en el analisis de regresion:
los supuestos para elananlisis de regesion son como:
· Existen atos de medicion para a x y z
· la variable dependiente es una variable aleatoria
· para cada valor de x, existe una distribucion condicional de la que es de naturaleza normal
· la desviacion estandar de todas la distribuciones condicionales son iguales
el error de estandar de estimacion
la determinante primaria de la exactitud es el grado de dispersion de la poblacion: cuanto mas dispersa este, menor sera la exactitud de la estmacion.El grado de dispresion en la poblacion se puede estimar a partir del grado de dispersion en las observacines de la muestra con respecto a la linea de regresion calculada, utilizando la formula:
SE="(YI-YC)
N-2
EN LA CUAL:
YI= CADA VALOR DE Y
YC=VALOR DE LA LINEA DE REGRESION CORRESPONDIENTE A PARTIR DE LA ECUACION DE REGRESION
N=NUMERO DE OBSERVACIONES
DISTRIBUCIONES BIDIMENSIONALES
Cuando trabajamos en un estudio estadístico y observamos simultáneamente dos caracteres en un mismo individuo obtenemos pares de resultados, por ejemplo, al observar en una persona su edad y su peso. Los distintos valores de las modalidades que pueden adoptar estos caracteres forman un conjunto de pares, que representamos por (X, Y) y llamamos variable estadística bidimensional.
Los dos caracteres observados no tienen por qué ser de la misma clase, así nos podemos encontrar con las siguientes situaciones :
Tipos variables ( X, Y )
Ejemplo
Dos caracteres cualitativos Categórica / Categórica Sexo y color del pelo.
Dos caracteres cuantitativos Discreta / Discreta Número de hermanos y número de hijos.
Continua / Continua Perímetro craneal y perímetro torácico.
Discreta / Continua Pulsaciones y temperatura.
Uno cualitativo y otro cuantitativo Categórica / Discreta Sexo y número de libros leídos.
Categórica / Continua Color del pelo y talla.
Es decir, ahora nuestra unidad de estudio es el par (X, Y) y dos pares están repetidos cuando sus respectivos valores son iguales. Otro factor a tener en cuenta es que el número de modalidades distintas que adopta el carácter X no tiene por qué ser el mismo que el que adopta el carácter Y:
X = { x1, x2, x3, ..., xs } ; Y = { y1, y2, y3, ..., yt }
Ordenación de datos : Tablas
Parece que lo más lógico es ordenar éstos pares de datos en una tabla de doble entrada, donde tengan cabida los s valores de la variable X y los t valores de la variable Y.
Donde nij es el número de veces que aparece repetido el par (xi, yi) y que llamaremos frecuencia absoluta del par (xi, yi).
Una tabla de doble entrada también se puede expresar como una tabla simple, de forma que siempre es posible pasar de una a otra según convenga.
Las tablas simples reflejan el comportamiento de la variable estadística bidimensional (X, Y) a partir de los valores individuales que toman cada una de las variables estadísticas unidimensionales X e Y.
Observaciones
La frecuencia relativa del par (xi, yi) la denotamos por fij
La suma de las frecuencias absolutas es igual al número de pares observados (N).
La suma de las frecuencias relativas es igual a la unidad.
Representaciones gráficas
Diagramas de dispersión
Es la representación sobre unos ejes cartesianos de los distintos valores de la variable (X, Y). En el eje de abscisas representamos los valores de X y en el de ordenadas los valores de Y, de tal forma que cada par viene representado por un punto del plano X×Y.
En el caso de que las dos variables estén agrupadas en intervalos el diagrama se construye mediante casillas que tienen dentro tantos puntos como el valor de la frecuencia absoluta correspondiente a los intervalos X e Y.
Si las variables que componen el par son una discreta y otra continua se utilizan las marcas de clase, siendo un caso similar al primero.
Los diagramas de dispersión también se conocen como nube de puntos.
diagramas de frecuencias
Como en un diagrama de dispersión no puede quedar reflejado las veces que se repite un par o un intervalo, hemos de recurrir a una representación en tres dimensiones de (X, Y). Dos son para la variable bidimensional y una dimensión para expresar las frecuencias.
La figura adjunta representa los datos del ejemplo 1. La variable X toma los valores 10, 15,... y la variable Y los valores 0, 1,2,...; en el eje Z están representadas las frecuencias absolutas del par (X, Y).
Distribuciones Marginales
Si en una tabla de doble entrada tenemos en cuenta solamente la variable X y el recuento de sus frecuencias, sin que para nada intervengan los valores de la Y, esta distribución se denomina distribución marginal de la variable X ,siendo nxi el número de elementos observados cuando la variable X es xi (frecuencia marginal del valor xi ). Análogamente cuando tomamos la variable Y, sin tener en cuenta para nada los valores de X.
De las frecuencias absolutas marginales se obtienen las frecuencias relativas marginales. Y de igual forma podemos obtener las medias, varianzas y desviaciones típicas marginales.
DISTRIBUCIONES BIDIMENSIONALES
________________________________________
Cuando trabajamos en un estudio estadístico y observamos simultáneamente dos caracteres en un mismo individuo obtenemos pares de resultados, por ejemplo, al observar en una persona su edad y su peso. Los distintos valores de las modalidades que pueden adoptar estos caracteres forman un conjunto de pares, que representamos por (X, Y) y llamamos variable estadística bidimensional.
Los dos caracteres observados no tienen por qué ser de la misma clase, así nos podemos encontrar con las siguientes situaciones :
Tipos variables ( X, Y ) Ejemplo
Dos caracteres cualitativos Categórica / Categórica Sexo y color del pelo.
Dos caracteres cuantitativos Discreta / Discreta Número de hermanos y número de hijos.
Continua / Continua Perímetro craneal y perímetro torácico.
Discreta / Continua Pulsaciones y temperatura.
Uno cualitativo y otro cuantitativo Categórica / Discreta Sexo y número de libros leídos.
Categórica / Continua Color del pelo y talla.
Es decir, ahora nuestra unidad de estudio es el par (X, Y) y dos pares están repetidos cuando sus respectivos valores son iguales. Otro factor a tener en cuenta es que el número de modalidades distintas que adopta el carácter X no tiene por qué ser el mismo que el que adopta el carácter Y:
X = { x1, x2, x3, ..., xs } ; Y = { y1, y2, y3, ..., yt }
Ordenación de datos : Tablas
Parece que lo más lógico es ordenar éstos pares de datos en una tabla de doble entrada, donde tengan cabida los s valores de la variable X y los t valores de la variable Y.
Donde nij es el número de veces que aparece repetido el par (xi, yi) y que llamaremos frecuencia absoluta del par (xi, yi).
Una tabla de doble entrada también se puede expresar como una tabla simple, de forma que siempre es posible pasar de una a otra según convenga.
Las tablas simples reflejan el comportamiento de la variable estadística bidimensional (X, Y) a partir de los valores individuales que toman cada una de las variables estadísticas unidimensionales X e Y.
Observaciones
La frecuencia relativa del par (xi, yi) la denotamos por fij
La suma de las frecuencias absolutas es igual al número de pares observados (N).
La suma de las frecuencias relativas es igual a la unidad.
Representaciones gráficas
DIAGRAMAS DE DISPERSIÓN
Es la representación sobre unos ejes cartesianos de los distintos valores de la variable (X, Y). En el eje de abscisas representamos los valores de X y en el de ordenadas los valores de Y, de tal forma que cada par viene representado por un punto del plano X×Y.
En el caso de que las dos variables estén agrupadas en intervalos el diagrama se construye mediante casillas que tienen dentro tantos puntos como el valor de la frecuencia absoluta correspondiente a los intervalos X e Y.
Si las variables que componen el par son una discreta y otra continua se utilizan las marcas de clase, siendo un caso similar al primero.
Los diagramas de dispersión también se conocen como nube de puntos.
DIAGRAMAS DE FRECUENCIAS
Como en un diagrama de dispersión no puede quedar reflejado las veces que se repite un par o un intervalo, hemos de recurrir a una representación en tres dimensiones de (X, Y). Dos son para la variable bidimensional y una dimensión para expresar las frecuencias.
La figura adjunta representa los datos del ejemplo 1. La variable X toma los valores 10, 15,... y la variable Y los valores 0, 1,2,...; en el eje Z están representadas las frecuencias absolutas del par (X, Y).
Distribuciones Marginales
Si en una tabla de doble entrada tenemos en cuenta solamente la variable X y el recuento de sus frecuencias, sin que para nada intervengan los valores de la Y, esta distribución se denomina distribución marginal de la variable X ,siendo nxi el número de elementos observados cuando la variable X es xi (frecuencia marginal del valor xi ). Análogamente cuando tomamos la variable Y, sin tener en cuenta para nada los valores de X.
De las frecuencias absolutas marginales se obtienen las frecuencias relativas marginales. Y de igual forma podemos obtener las medias, varianzas y desviaciones típicas marginales.
Regresión lineal:
En estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede ser expresado como:
Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \cdots +\beta_p X_p + \varepsilon
donde β0 es la intersección o término "constante", las βi son los parámetros respectivos a cada variable independiente, y p es el número de parámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.
Ecuación lineal:
Una ecuación lineal es un planteamiento de igualdad, involucrando una o más variables a la primera potencia, que no contiene productos entre las variables, o mejor dicho,es una ecuación que involucra solamente sumas y restas de una variable a la primera potencia . En el sistema cartesiano representan rectas. Una forma común de ecuaciones lineales es y = mx + c Donde m representa la pendiente y el valor de c determina la ordenada al origen (el punto donde la recta corta al eje Y). Las ecuaciones en las que aparece el término x*y (llamado rectangular) no son consideradas lineales
Algunos ejemplos de ecuaciones lineales:
3x + 2y = 10\,
3a + 472b = 10b + 37\,
3x + y -5 = -7x + 4y +3\,.
x-y+z=15 \,
3x-2y+z=20 \,
x+4y-3z=10 \,
Tipos de ecuaciones lineales
Formas complejas como las anteriores pueden reescribirse usando las reglas del álgebra elemental en formas más simples. Las letras mayúsculas representan constantes, mientras x e y son variables.
* Ecuación general
Ax + By + C = 0\,
Aquí A y B no son ambos cero. Representa una línea en el cartesiano. Es posible encontrar los valores donde x e y se anulan.
* Ecuación segmentaria
\frac{x}{E} + \frac{y}{F} = 1
Aquí E y F no deben ser cero. El gráfico de esta ecuación corta al eje X y al eje Y en E y F respectivamente.
* Forma paramétrica
1. x = Tt + U\,
2. y = Vt + W\,
Dos ecuaciones que deben cumplirse de manera simultanea, cada una en la variable t. Puede convertirse a la forma general despejando t en ambas ecuaciones e igualando.
* Casos especiales:
y = F\,
Un caso especial es la forma estándar donde A = 0 y B = 1. El gráfico es una línea horizontal sin intersección con el eje X ó (si F = 0) coincidente con el ese eje.
x = E\,
Otro caso especial de la forma general donde A = 1 y B = 0. El gráfico es una línea vertical, interceptando el eje X en E.
0 = 0\,
En este caso, todas las variables fueron canceladas, dejando una ecuación que es verdadera en todos los casos. La forma original (no una tan trivial como la del ejemplo), es llamada identidad. El gráfico es todo el plano cartesiano, ya que lo satisface todo par de números reales x e y.
Nótese que si la manipulación algebraica lleva a una ecuación como 1 = 0 entonces la original es llamada inconsistente, o sea que no se cumple para ningún par de números x e y. Un ejemplo podría ser: 3x + 2 = 3x − 5.
Adicionalmente podría haber más de dos variables, en ecuaciones simultaneas. Para más información véa: Sistema lineal de ecuaciones
Linealidad
Una función es lineal si y solo si cumple con la siguiente proposición:
f(x + y) = f(x) + f(y)
f(ax) = af(x)
donde a es cualquier escalar. También se llama a f operador lineal
Sistema de ecuaciones lineales:
En matemática y álgebra lineal, un sistema de ecuaciones lineales, también conocido como sistema lineal de ecuaciones o simplemente sistema lineal, es un conjunto de ecuaciones lineales sobre un cuerpo o un anillo conmutativo. Un ejemplo de sistema lineal de ecuaciones sería el siguiente:
El problema consiste en encontrar los valores desconocidos de las variables x1, x2 y x3 que satisfacen las tres ecuaciones.
El problema de los sistemas lineales de ecuaciones es uno de los más antiguos de la matemática y tiene una infinidad de aplicaciones, como en procesamiento digital de señales, estimación, predicción y más generalmente en programación lineal así como en la aproximación de problemas no lineales de análisis numérico.
En general, un sistema con m ecuaciones lineales n incógnitas puede ser escrito en forma ordinaria como:
Donde son las incógnitas y los números son los coeficientes del sistema sobre el cuerpo . Es posible reescribir el sistema separando con coeficientes con notación matricial:
(1)
Si representamos cada matriz con una única letra obtenemos:
Donde A es una matriz m por n, x es un vector columna de longitud n y b es otro vector columna de longitud m. El sistema de eliminación de Gauss-Jordan se aplica a este tipo de sistemas, sea cual sea el cuerpo del que provengan los coeficientes.
Sistemas lineales reales
En esta sección se analizan las propiedades de los sistemas de ecuaciones lineales sobre el cuerpo , es decir, los sistemas lineales en los coeficientes de las ecuaciones son números reales.
La intersección de dos planos no paralelos es una recta
Un sistema con incógnitas se puede representar en el n-espacio correspondiente.
En los sistemas con 2 incógnitas, el universo de nuestro sistema será el plano bidimensional, mientras que cada una de las ecuaciones será representada por una recta, si es lineal, o por una curva, si no lo es. La solución será el punto (o línea) donde intersecten todas las rectas y curvas que representan a las ecuaciones. Si no existe ningún punto en el que intersecten al mismo tiempo todas las líneas, el sistema es incompatible, o lo que es lo mismo, no tiene solución.
En el caso de un sistema con 3 incógnitas, el universo será el espacio tridimensional, siendo cada ecuación un plano dentro del mismo. Si todos los planos intersectan en un único punto, las coordenadas de éste serán la solución al sistema. Si, por el contrario, la intersección de todos ellos es una recta o incluso un plano, el sistema tendrá infinitas soluciones, que serán las coordenadas de los puntos que forman dicha línea o superficie.
Para sistemas de 4 ó más incógnitas, la representación gráfica no es intuitiva para el ser humano, por lo que dichos problemas no suelen enfocarse desde esta óptica.
Tipos de sistemas [editar]
Los sistemas de ecuaciones se pueden clasificar según el número de soluciones que pueden presentar. De acuerdo con ese caso se pueden presentar los siguientes casos:
Sistema incompatible si no tiene ninguna solución.
Sistema compatible si tiene alguna solución, en este caso además puede distinguirse entre:
o Sistema compatible determinado cuando tiene un número finito de soluciones.
o Sistema compatible indeterminado cuando admite un conjunto infinito de soluciones.
Quedando así la clasificación:
Los sistemas incompatibles geométricamente se caracterizan por (hiper)planos o rectas que se cruzan sin cortarse. Los sistemas compatibles determinados se caracterizan por un conjunto de (hiper)planos o rectas que se cortan en un único punto. Los sistemas compatibles indeterminados se caracterizan por (hiper)planos que se cortan a lo largo de una recta [o más generalmente un hiperplano de dimensión menor]. Desde un punto de vista algebraico los sistemas compatibles determinados se caracterizan porque el determinante de la matriz es diferente de cero:
Sistemas compatibles indeterminados
Un sistema sobre un cuerpo K es compatible indeterminado cuando posee un número infinito de soluciones. Por ejemplo, el siguiente sistema:
Tanto la primera como la segunda ecuación se corresponden con la recta cuya pendiente es y que pasa por el punto , por lo que ambas intersectan en todos los puntos de dicha recta. El sistema es compatible por haber solución o intersección entre las rectas, pero es indeterminado al ocurrir esto en infinitos puntos.
• En este tipo de sistemas, la solución genérica consiste en expresar una o más variables como función matemática del resto. En los sistemas lineales compatibles indeterminados, al menos una de sus ecuaciones se puede hallar como combinación lineal del resto, es decir, es linealmente dependiente.
•Una condición necesaria para que un sistema sea compatible indeterminado es que el determinante de la matriz del sistema sea cero (y por tanto uno de sus autovalores será 0):
•De hecho, de las dos condiciones anteriores se desprende, que el conjunto de soluciones de un sistema compatible indeterminado es un subespacio vectorial. Y la dimensión de ese espacio vectorial coincidirá con la multiplicidad geométrica del autovalor cero.
Sistemas incompatibles [editar]
De un sistema se dice que es incompatible cuando no presenta ninguna solución. Por ejemplo, supongamos el siguiente sistema:
Las ecuaciones se corresponden gráficamente con dos rectas, ambas con la misma pendiente, Al ser paralelas, no se cortan en ningún punto, es decir, no existe ningún valor que satisfaga a la vez ambas ecuaciones.
Matemáticamente un sistema de es incompatible cuando el rango de la matriz del sistema es inferior al rango de la matriz ampliada. Una condición necesaria para que esto suceda es que el determinante de la matriz del sistema sea cero:
Métodos de resolución
SustitucióN
El método de sustitución consiste en despejar en una de las ecuaciones cualquier incógnita, preferiblemente la que tenga menor coeficiente, para, a continuación, sustituirla en otra ecuación por su valor.
En caso de sistemas con más de dos incógnitas, la seleccionada debe ser sustituida por su valor equivalente en todas las ecuaciones excepto en la que la hemos despejado. En ese instante, tendremos un sistema con una ecuación y una incógnita menos que el inicial, en el que podemos seguir aplicando este método reiteradamente. Por ejemplo, supongamos que queremos resolver por sustitución este sistema:
En la primera ecuación, seleccionamos la incógnita por ser la de menor coeficiente y que posiblemente nos facilite más las operaciones, y la despejamos, obteniendo la siguiente ecuación.
El siguiente paso será sustituir cada ocurrencia de la incógnita en la otra ecuación, para así obtener una ecuación donde la única incógnita sea la .
Al resolver la ecuación obtenemos el resultado , y si ahora sustituimos esta incógnita por su valor en alguna de las ecuaciones originales obtendremos , con lo que el sistema queda ya resuelto.
Igualación [editar]
El método de igualación se puede entender como un caso particular del método de sustitución en el que se despeja la misma incógnita en dos ecuaciones y a continuación se igualan entre sí la parte derecha de ambas ecuaciones.
Tomando el mismo sistema utilizado como ejemplo para el método de sustitución, si despejamos la incógnita en ambas ecuaciones nos queda de la siguiente manera:
Como se puede observar, ambas ecuaciones comparten la misma parte izquierda, por lo que podemos afirmar que las partes derechas también son iguales entre sí.
Llegados a este punto, la ecuación resultante es resoluble y podemos obtener el valor de la incógnita , y a partir de aquí, sustituyendo dicho valor en una de las ecuaciones originales, obtener el valor de la , que además ya se encuentra despejada.
Reducción [editar]
Este método suele emplearse mayoritariamente en los sistemas lineales, siendo pocos los casos en que se utiliza para resolver sistemas no lineales. El procedimiento, diseñado para sistemas con dos ecuaciones e incógnitas, consiste en transformar una de las ecuaciones (generalmente, mediante productos), de manera que obtengamos dos ecuaciones en la que una misma incógnita aparezca con el mismo coeficiente y distinto signo. A continuación, se suman ambas ecuaciones produciéndose así la reducción o cancelación de dicha incógnita, obteniendo así una ecuación con una sola incógnita, donde el método de resolución es simple.
Por ejemplo, en el sistema
no tenemos más que multiplicar la primera ecuación por para poder cancelar la incógnita . Al multiplicar, dicha ecuación nos queda así:
Si sumamos esta ecuación a la segunda del sistema original, obtenemos una nueva ecuación donde la incógnita ha sido reducida y que, en este caso, nos da directamente el valor de la incógnita :
El siguiente paso consiste únicamente en sustituir el valor de la incógnita en cualquiera de las ecuaciones donde aparecían ambas incógnitas, y obtener así que el valor de es igual a .
Método de Gauss [editar]
La eliminación de Gauss-Jordan, más conocida como método de Gauss, es un método aplicable únicamente a los sistemas lineales de ecuaciones, y consistente en triangular la matriz aumentada del sistema mediante transformaciones elementales, hasta obtener ecuaciones de una sola incógnita, cuyo valor será igual al coeficiente situado en la misma fila de la matriz. Este procedimiento es similar al anterior de reducción, pero ejecutado de manera reiterada y siguiendo un cierto orden algorítmico.
Tomemos como ejemplo el siguiente sistema:
Su matriz aumentada será esta:
En primer lugar, reducimos la incógnita , sumando a la segunda fila, la primera multiplicada por , y a la tercera, la primera fila. La matriz queda así:
El siguiente paso consiste en eliminar la incógnita en la primera y tercera fila, para lo cual les sumamos la segunda multiplicada por y por , respectivamente.
Por último, eliminamos la , tanto de la primera como de la segunda fila, sumándoles la tercera multiplicada por y por , respectivamente.
Llegados a este punto podemos resolver directamente las ecuaciones que se nos plantean:
O, si lo preferimos, podemos multiplicar las tres filas de la matriz por , y respectivamente, y obtener así automáticamente los valores de las incógnitas en la última columna.
Regla de Cramer :
Artículo principal: Regla de Cramer
La regla de Cramer da una solución para sistemas compatibles determinados en términos de determinantes y adjuntos dada por:
Donde Aj es la matriz resultante de remplazar la j-ésima columna de A por el vector columna b. Para un sistema de dos ecuaciones y dos incónitas:
La regla de Cramer da la siguiente solución:
Nota: Cuando en la determinante original det(A) el resultado es 0, el sistema indica múltiples o sin coincidencia.
Sistemas lineales en un cuerpo arbitrario
Cuando consideramos ecuaciones lineales cuyas soluciones son números racionales, reales o complejos o más generalmente un cuerpo , la solución puede encontrarse mediante Regla de Cramer. Para sistemas de muchas ecuaciones la regla de Cramer puede ser computacionalmente más costosa y suelen usarse otros métodos más "económicos" en número de operaciones como la eliminación de Gauss-Jordan y la descomposición de Cholesky. Existen también métodos indirectos (basados en iteraciones) como el método de Gauss-Seidel.
Si el cuerpo es infinito (como es el caso de los números reales o complejos), entonces solo puede darse una de las tres siguientes situaciones:
•el sistema no tiene solución (en dicho caso decimos que el sistema está sobredeterminado o que es incompatible)
•el sistema tiene una única solución (el sistema es compatible determinado)
•el sistema tiene un número infinito de soluciones (el sistema es compatible indeterminado).
Un sistema de la forma
Ax = 0
se le llama sistema homogéneo. El conjunto de todas las soluciones de este tipo de sistema se le llama núcleo de la matriz y se escribe como Nuc A.
Se han diseñado algoritmos alternativos mucho más eficientes a la eliminación de Gauss-Jordan para una gran cantidad de casos específicos. La mayoría de estos algoritmos mejorados tienen una complejidad computacional de O(n²). Algunos de los métodos más usados son:
•Para los problemas de la forma Ax = b, donde A es una matriz de Toeplitz simétrica, se puede utilizar la recursión de Levinson o alguno de los métodos derivados de éste. Un método derivado de la recursión de Levinson es la recursión de Schur, que es ampliamente usado en el campo del procesamiento digital de señales.
•Para los problemas de la forma Ax = b, donde A es una matriz singular o casi singular, la matriz A se descompone en el producto de tres matrices en un proceso llamado descomposición de valores singulares.
Solución de sistemas lineales en un anillo
Artículo principal: ecuación diofántica
Los métodos para resolver el sistema (1) sobre un anillo son muy diferentes a los considerados anteriormente. De hecho la mayoría de métodos usados en cuerpos, como la regla de Cramer, son inaplicables en anillos debido a que no existen inversos multiplicativos.
La existencia de solución del sistema (1) sobre los enteros requiere varias condiciones:
1.Para cada i es divisor de .
2.Si la condición anterior se cumple para un determinado i existe un conunto de enteros formado por el conjunto de enteros que satisface la i-ésima ecuación, y existirá solución si la intersección .
buenas tardes profesor espero que este pasando una feliz navidad con su familia y principalmente con dios le escribe el alumno javier ruiz de la torre de la seccion 001-d de administracion de desastres
regresion y correlacion
analisis:
# Marco Teórico
A fin de facilitar la comprensión del presente trabajo definiremos algunos conceptos basicos.
Análisis de Correlación: Es el conjunto de técnicas estadísticas empleado para medir la intensidad de la asociación entre dos variables.
El principal objetivo del análisis de correlación consiste en determinar que tan intensa es la relación entre dos variables. Normalmente, el primer paso es mostrar los datos en un diagrama de dispersión.
Diagrama de Dispersión:es aquel grafico que representa la relación entre dos variables.
Variable Dependiente:es la variable que se predice o calcula. Cuya representación es "Y"
Variable Independiente: es la variable que proporciona las bases para el calculo. Cuya representación es: X1,X2,X3.......
Coeficiente de Correlación: Describe la intensidad de la relación entre dos conjuntos de variables de nivel de intervalo. Es la medida de la intensidad de la relación lineal entre dos variables.
El valor del coeficiente de correlación puede tomar valores desde menos uno hasta uno, indicando que mientras más cercano a uno sea el valor del coeficiente de correlación, en cualquier dirección, más fuerte será la asociación lineal entre las dos variables. Mientras más cercano a cero sea el coeficiente de correlación indicará que más débil es la asociación entre ambas variables. Si es igual a cero se concluirá que no existe relación lineal alguna entre ambas variables.
Análisis de regresión:Es la técnica empleada para desarrollar la ecuación y dar las estimaciones.
Ecuación de Regresión:es una ecuación que define la relación lineal entre dos variables.
Ecuación de regresión Lineal: Y’ = a + Bx
Ecuación de regresión Lineal Múltiple: Y’ = a + b1X1 + b2X2 + b3X3...
Principio de Mínimos Cuadrados:Es la técnica empleada para obtener la ecuación de regresión, minimizando la suma de los cuadrados de las distancias verticales entre los valores verdaderos de "Y" y los valores pronosticados "Y".
Análisis de regresión y Correlación Múltiple:consiste en estimar una variable dependiente, utilizando dos o más variables independientes.
Ecuación de regresión Múltiple: La forma general de la ecuación de regresión múltiple con dos variables independientes es:
Y' = a + b1X1 + b2X2
X1,X2 : Variables Independientes
a : es la ordenada del punto de intersección con el eje Y.
b1 : Coeficiente de Regresión (es la variación neta en Y por cada unidad de
variación en X1.).
b2 : Coeficiente de Regresión (es el cambio neto en Y para cada cambio
unitario en X2).
Prueba Global.- esta prueba investiga básicamente si es posible que todas las variables independientes tengan coeficientes de regresión neta iguales a 0.
# Desarrollo de un Caso.
Una agencia de Viajes desea saber la relación que hay entre las ventas, el presupuesto destinado a publicidad, y las comisiones de los vendedores para esto presenta los siguientes datos. Realice los análisis respectivos.
Y
X1
X2
AÑO
VENTAS
GASTOS DE PUBLICIDAD
COMISIONES DE VENDEDORES
2000
264000
550
15840
2001
384000
590
19250
2002
400200
680
26013
2003
422400
700
16896
2004
543000
750
16290
ANÁLISIS DE DATOS:
Se van a utilizar las siguientes variables:
Variables Independientes:
1.- Gastos de Publicidad
2.- Comisión de vendedores
Variable dependiente:
- Ventas
Utilizando el Excel obtenemos los siguientes datos.
Estadísticas de la Regresión
Coeficiente de correlación múltiple
0.92092
Coeficiente de determinación R2
0.84810
R2 ajustado
0.69619
Error típico
54887.83156
Observaciones
5
De aquí se puede decir:
- De acuerdo al valor del coeficiente de correlación múltiple, podemos afirmar que la variable X1 (Gastos de Publicidad) y X2 (Comisión de vendedores) se encuentran asociadas en forma directa de una manera muy fuerte con la variable dependiente Ventas, en un 92%.
- De acuerdo al Coeficiente de determinación R2, podemos decir que el 85% de las ventas pueden ser explicadas por los gastos de publicidad y las comisiones de los vendedores.
A N Á L I S I S D E V A R I A N Z A
Grados de libertad
Suma de cuadrados
Prom. de los cuadrados
F
Valor crítico de F
Regresión
2
33640459893
16820229947
5.5832
0.15190282
Residuos
2
6025348107
3012674053
Total
4
39665808000
Coeficientes
Error típico
Estadístico t
Probab.
Inf. 95%
Sup. 95%
Inferior 95.0%
Sup. 95.0%
Intercepción
-289315.16
242459.39
-1.193
0.35513
-1332534.446
753904.118
-1332534.446
753904.118
GSTOS DE PUBLICID.
1123.49
336.22
3.342
0.07908
-323.1275965
2570.108
-323.128
2570.108
COM. DE VENDED.
-2.27
6.55
-0.346
0.76245
-30.45400257
25.922
-30.454
25.922
De aquí se desprende la ecuación de regresión múltiple:
Y = - 289315 + 1123 X1 - 2.27 X2
Prueba Global: Verificación de la validez del modelo de regresión Múltiple.
Formulación de Hipótesis:
Hp: B1 = B2 = 0
Ha: B1 B2 0
Si se acepta la hipótesis planteada, significa que ninguno de los factores (X1,X2) son relevantes para explicar los cambios en Y.
De acuerdo a la tabla de análisis de la varianza F calculado es 5.58 y el p-valor es 0.15, de lo cual podemos decir que La hipótesis planteada se rechaza y se acepta la hipótesis alternativa, por que el F calculado es mayor que el p-valor.
Hasta ahora se ha demostrado que algunos, pero no necesariamente todos los coeficientes de regresión, no son iguales a cero y, por o tanto son útiles para las predicciones. El siguiente paso consiste en probar individualmente las variables para determinar cuales coeficientes de regresión pueden ser cero y cuales no.
Del análisis mediante Excell tenemos el siguiente cuadro.
VENTAS VS GASTOS DE PUBLICIDAD
Estadísticas de la regresión
Coeficiente de correlación múltiple
0.915976333
Inferencia en el analisis de regresion:
los supuestos para elananlisis de regesion son como:
· Existen atos de medicion para a x y z
· la variable dependiente es una variable aleatoria
· para cada valor de x, existe una distribucion condicional de la que es de naturaleza normal
· la desviacion estandar de todas la distribuciones condicionales son iguales
el error de estandar de estimacion
la determinante primaria de la exactitud es el grado de dispersion de la poblacion: cuanto mas dispersa este, menor sera la exactitud de la estmacion.El grado de dispresion en la poblacion se puede estimar a partir del grado de dispersion en las observacines de la muestra con respecto a la linea de regresion calculada, utilizando la formula:
SE="(YI-YC)
N-2
EN LA CUAL:
YI= CADA VALOR DE Y
YC=VALOR DE LA LINEA DE REGRESION CORRESPONDIENTE A PARTIR DE LA ECUACION DE REGRESION
N=NUMERO DE OBSERVACIONES
DISTRIBUCIONES BIDIMENSIONALES
Cuando trabajamos en un estudio estadístico y observamos simultáneamente dos caracteres en un mismo individuo obtenemos pares de resultados, por ejemplo, al observar en una persona su edad y su peso. Los distintos valores de las modalidades que pueden adoptar estos caracteres forman un conjunto de pares, que representamos por (X, Y) y llamamos variable estadística bidimensional.
Los dos caracteres observados no tienen por qué ser de la misma clase, así nos podemos encontrar con las siguientes situaciones :
Tipos variables ( X, Y )
Ejemplo
Dos caracteres cualitativos Categórica / Categórica Sexo y color del pelo.
Dos caracteres cuantitativos Discreta / Discreta Número de hermanos y número de hijos.
Continua / Continua Perímetro craneal y perímetro torácico.
Discreta / Continua Pulsaciones y temperatura.
Uno cualitativo y otro cuantitativo Categórica / Discreta Sexo y número de libros leídos.
Categórica / Continua Color del pelo y talla.
Es decir, ahora nuestra unidad de estudio es el par (X, Y) y dos pares están repetidos cuando sus respectivos valores son iguales. Otro factor a tener en cuenta es que el número de modalidades distintas que adopta el carácter X no tiene por qué ser el mismo que el que adopta el carácter Y:
X = { x1, x2, x3, ..., xs } ; Y = { y1, y2, y3, ..., yt }
Ordenación de datos : Tablas
Parece que lo más lógico es ordenar éstos pares de datos en una tabla de doble entrada, donde tengan cabida los s valores de la variable X y los t valores de la variable Y.
Donde nij es el número de veces que aparece repetido el par (xi, yi) y que llamaremos frecuencia absoluta del par (xi, yi).
Una tabla de doble entrada también se puede expresar como una tabla simple, de forma que siempre es posible pasar de una a otra según convenga.
Las tablas simples reflejan el comportamiento de la variable estadística bidimensional (X, Y) a partir de los valores individuales que toman cada una de las variables estadísticas unidimensionales X e Y.
Observaciones
La frecuencia relativa del par (xi, yi) la denotamos por fij
La suma de las frecuencias absolutas es igual al número de pares observados (N).
La suma de las frecuencias relativas es igual a la unidad.
Representaciones gráficas
Diagramas de dispersión
Es la representación sobre unos ejes cartesianos de los distintos valores de la variable (X, Y). En el eje de abscisas representamos los valores de X y en el de ordenadas los valores de Y, de tal forma que cada par viene representado por un punto del plano X×Y.
En el caso de que las dos variables estén agrupadas en intervalos el diagrama se construye mediante casillas que tienen dentro tantos puntos como el valor de la frecuencia absoluta correspondiente a los intervalos X e Y.
Si las variables que componen el par son una discreta y otra continua se utilizan las marcas de clase, siendo un caso similar al primero.
Los diagramas de dispersión también se conocen como nube de puntos.
diagramas de frecuencias
Como en un diagrama de dispersión no puede quedar reflejado las veces que se repite un par o un intervalo, hemos de recurrir a una representación en tres dimensiones de (X, Y). Dos son para la variable bidimensional y una dimensión para expresar las frecuencias.
La figura adjunta representa los datos del ejemplo 1. La variable X toma los valores 10, 15,... y la variable Y los valores 0, 1,2,...; en el eje Z están representadas las frecuencias absolutas del par (X, Y).
Distribuciones Marginales
Si en una tabla de doble entrada tenemos en cuenta solamente la variable X y el recuento de sus frecuencias, sin que para nada intervengan los valores de la Y, esta distribución se denomina distribución marginal de la variable X ,siendo nxi el número de elementos observados cuando la variable X es xi (frecuencia marginal del valor xi ). Análogamente cuando tomamos la variable Y, sin tener en cuenta para nada los valores de X.
De las frecuencias absolutas marginales se obtienen las frecuencias relativas marginales. Y de igual forma podemos obtener las medias, varianzas y desviaciones típicas marginales.
DISTRIBUCIONES BIDIMENSIONALES
________________________________________
Cuando trabajamos en un estudio estadístico y observamos simultáneamente dos caracteres en un mismo individuo obtenemos pares de resultados, por ejemplo, al observar en una persona su edad y su peso. Los distintos valores de las modalidades que pueden adoptar estos caracteres forman un conjunto de pares, que representamos por (X, Y) y llamamos variable estadística bidimensional.
Los dos caracteres observados no tienen por qué ser de la misma clase, así nos podemos encontrar con las siguientes situaciones :
Tipos variables ( X, Y ) Ejemplo
Dos caracteres cualitativos Categórica / Categórica Sexo y color del pelo.
Dos caracteres cuantitativos Discreta / Discreta Número de hermanos y número de hijos.
Continua / Continua Perímetro craneal y perímetro torácico.
Discreta / Continua Pulsaciones y temperatura.
Uno cualitativo y otro cuantitativo Categórica / Discreta Sexo y número de libros leídos.
Categórica / Continua Color del pelo y talla.
Es decir, ahora nuestra unidad de estudio es el par (X, Y) y dos pares están repetidos cuando sus respectivos valores son iguales. Otro factor a tener en cuenta es que el número de modalidades distintas que adopta el carácter X no tiene por qué ser el mismo que el que adopta el carácter Y:
X = { x1, x2, x3, ..., xs } ; Y = { y1, y2, y3, ..., yt }
Ordenación de datos : Tablas
Parece que lo más lógico es ordenar éstos pares de datos en una tabla de doble entrada, donde tengan cabida los s valores de la variable X y los t valores de la variable Y.
Donde nij es el número de veces que aparece repetido el par (xi, yi) y que llamaremos frecuencia absoluta del par (xi, yi).
Una tabla de doble entrada también se puede expresar como una tabla simple, de forma que siempre es posible pasar de una a otra según convenga.
Las tablas simples reflejan el comportamiento de la variable estadística bidimensional (X, Y) a partir de los valores individuales que toman cada una de las variables estadísticas unidimensionales X e Y.
Observaciones
La frecuencia relativa del par (xi, yi) la denotamos por fij
La suma de las frecuencias absolutas es igual al número de pares observados (N).
La suma de las frecuencias relativas es igual a la unidad.
Representaciones gráficas
DIAGRAMAS DE DISPERSIÓN
Es la representación sobre unos ejes cartesianos de los distintos valores de la variable (X, Y). En el eje de abscisas representamos los valores de X y en el de ordenadas los valores de Y, de tal forma que cada par viene representado por un punto del plano X×Y.
En el caso de que las dos variables estén agrupadas en intervalos el diagrama se construye mediante casillas que tienen dentro tantos puntos como el valor de la frecuencia absoluta correspondiente a los intervalos X e Y.
Si las variables que componen el par son una discreta y otra continua se utilizan las marcas de clase, siendo un caso similar al primero.
Los diagramas de dispersión también se conocen como nube de puntos.
DIAGRAMAS DE FRECUENCIAS
Como en un diagrama de dispersión no puede quedar reflejado las veces que se repite un par o un intervalo, hemos de recurrir a una representación en tres dimensiones de (X, Y). Dos son para la variable bidimensional y una dimensión para expresar las frecuencias.
La figura adjunta representa los datos del ejemplo 1. La variable X toma los valores 10, 15,... y la variable Y los valores 0, 1,2,...; en el eje Z están representadas las frecuencias absolutas del par (X, Y).
Distribuciones Marginales
Si en una tabla de doble entrada tenemos en cuenta solamente la variable X y el recuento de sus frecuencias, sin que para nada intervengan los valores de la Y, esta distribución se denomina distribución marginal de la variable X ,siendo nxi el número de elementos observados cuando la variable X es xi (frecuencia marginal del valor xi ). Análogamente cuando tomamos la variable Y, sin tener en cuenta para nada los valores de X.
De las frecuencias absolutas marginales se obtienen las frecuencias relativas marginales. Y de igual forma podemos obtener las medias, varianzas y desviaciones típicas marginales.
Regresión lineal:
En estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede ser expresado como:
Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \cdots +\beta_p X_p + \varepsilon
donde β0 es la intersección o término "constante", las βi son los parámetros respectivos a cada variable independiente, y p es el número de parámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.
Ecuación lineal:
Una ecuación lineal es un planteamiento de igualdad, involucrando una o más variables a la primera potencia, que no contiene productos entre las variables, o mejor dicho,es una ecuación que involucra solamente sumas y restas de una variable a la primera potencia . En el sistema cartesiano representan rectas. Una forma común de ecuaciones lineales es y = mx + c Donde m representa la pendiente y el valor de c determina la ordenada al origen (el punto donde la recta corta al eje Y). Las ecuaciones en las que aparece el término x*y (llamado rectangular) no son consideradas lineales
Algunos ejemplos de ecuaciones lineales:
3x + 2y = 10\,
3a + 472b = 10b + 37\,
3x + y -5 = -7x + 4y +3\,.
x-y+z=15 \,
3x-2y+z=20 \,
x+4y-3z=10 \,
Tipos de ecuaciones lineales
Formas complejas como las anteriores pueden reescribirse usando las reglas del álgebra elemental en formas más simples. Las letras mayúsculas representan constantes, mientras x e y son variables.
* Ecuación general
Ax + By + C = 0\,
Aquí A y B no son ambos cero. Representa una línea en el cartesiano. Es posible encontrar los valores donde x e y se anulan.
* Ecuación segmentaria
\frac{x}{E} + \frac{y}{F} = 1
Aquí E y F no deben ser cero. El gráfico de esta ecuación corta al eje X y al eje Y en E y F respectivamente.
* Forma paramétrica
1. x = Tt + U\,
2. y = Vt + W\,
Dos ecuaciones que deben cumplirse de manera simultanea, cada una en la variable t. Puede convertirse a la forma general despejando t en ambas ecuaciones e igualando.
* Casos especiales:
y = F\,
Un caso especial es la forma estándar donde A = 0 y B = 1. El gráfico es una línea horizontal sin intersección con el eje X ó (si F = 0) coincidente con el ese eje.
x = E\,
Otro caso especial de la forma general donde A = 1 y B = 0. El gráfico es una línea vertical, interceptando el eje X en E.
0 = 0\,
En este caso, todas las variables fueron canceladas, dejando una ecuación que es verdadera en todos los casos. La forma original (no una tan trivial como la del ejemplo), es llamada identidad. El gráfico es todo el plano cartesiano, ya que lo satisface todo par de números reales x e y.
Nótese que si la manipulación algebraica lleva a una ecuación como 1 = 0 entonces la original es llamada inconsistente, o sea que no se cumple para ningún par de números x e y. Un ejemplo podría ser: 3x + 2 = 3x − 5.
Adicionalmente podría haber más de dos variables, en ecuaciones simultaneas. Para más información véa: Sistema lineal de ecuaciones
Linealidad
Una función es lineal si y solo si cumple con la siguiente proposición:
f(x + y) = f(x) + f(y)
f(ax) = af(x)
donde a es cualquier escalar. También se llama a f operador lineal
Sistema de ecuaciones lineales:
En matemática y álgebra lineal, un sistema de ecuaciones lineales, también conocido como sistema lineal de ecuaciones o simplemente sistema lineal, es un conjunto de ecuaciones lineales sobre un cuerpo o un anillo conmutativo. Un ejemplo de sistema lineal de ecuaciones sería el siguiente:
El problema consiste en encontrar los valores desconocidos de las variables x1, x2 y x3 que satisfacen las tres ecuaciones.
El problema de los sistemas lineales de ecuaciones es uno de los más antiguos de la matemática y tiene una infinidad de aplicaciones, como en procesamiento digital de señales, estimación, predicción y más generalmente en programación lineal así como en la aproximación de problemas no lineales de análisis numérico.
En general, un sistema con m ecuaciones lineales n incógnitas puede ser escrito en forma ordinaria como:
Donde son las incógnitas y los números son los coeficientes del sistema sobre el cuerpo . Es posible reescribir el sistema separando con coeficientes con notación matricial:
(1)
Si representamos cada matriz con una única letra obtenemos:
Donde A es una matriz m por n, x es un vector columna de longitud n y b es otro vector columna de longitud m. El sistema de eliminación de Gauss-Jordan se aplica a este tipo de sistemas, sea cual sea el cuerpo del que provengan los coeficientes.
Sistemas lineales reales
En esta sección se analizan las propiedades de los sistemas de ecuaciones lineales sobre el cuerpo , es decir, los sistemas lineales en los coeficientes de las ecuaciones son números reales.
La intersección de dos planos no paralelos es una recta
Un sistema con incógnitas se puede representar en el n-espacio correspondiente.
En los sistemas con 2 incógnitas, el universo de nuestro sistema será el plano bidimensional, mientras que cada una de las ecuaciones será representada por una recta, si es lineal, o por una curva, si no lo es. La solución será el punto (o línea) donde intersecten todas las rectas y curvas que representan a las ecuaciones. Si no existe ningún punto en el que intersecten al mismo tiempo todas las líneas, el sistema es incompatible, o lo que es lo mismo, no tiene solución.
En el caso de un sistema con 3 incógnitas, el universo será el espacio tridimensional, siendo cada ecuación un plano dentro del mismo. Si todos los planos intersectan en un único punto, las coordenadas de éste serán la solución al sistema. Si, por el contrario, la intersección de todos ellos es una recta o incluso un plano, el sistema tendrá infinitas soluciones, que serán las coordenadas de los puntos que forman dicha línea o superficie.
Para sistemas de 4 ó más incógnitas, la representación gráfica no es intuitiva para el ser humano, por lo que dichos problemas no suelen enfocarse desde esta óptica.
Tipos de sistemas [editar]
Los sistemas de ecuaciones se pueden clasificar según el número de soluciones que pueden presentar. De acuerdo con ese caso se pueden presentar los siguientes casos:
Sistema incompatible si no tiene ninguna solución.
Sistema compatible si tiene alguna solución, en este caso además puede distinguirse entre:
o Sistema compatible determinado cuando tiene un número finito de soluciones.
o Sistema compatible indeterminado cuando admite un conjunto infinito de soluciones.
Quedando así la clasificación:
Los sistemas incompatibles geométricamente se caracterizan por (hiper)planos o rectas que se cruzan sin cortarse. Los sistemas compatibles determinados se caracterizan por un conjunto de (hiper)planos o rectas que se cortan en un único punto. Los sistemas compatibles indeterminados se caracterizan por (hiper)planos que se cortan a lo largo de una recta [o más generalmente un hiperplano de dimensión menor]. Desde un punto de vista algebraico los sistemas compatibles determinados se caracterizan porque el determinante de la matriz es diferente de cero:
Sistemas compatibles indeterminados
Un sistema sobre un cuerpo K es compatible indeterminado cuando posee un número infinito de soluciones. Por ejemplo, el siguiente sistema:
Tanto la primera como la segunda ecuación se corresponden con la recta cuya pendiente es y que pasa por el punto , por lo que ambas intersectan en todos los puntos de dicha recta. El sistema es compatible por haber solución o intersección entre las rectas, pero es indeterminado al ocurrir esto en infinitos puntos.
• En este tipo de sistemas, la solución genérica consiste en expresar una o más variables como función matemática del resto. En los sistemas lineales compatibles indeterminados, al menos una de sus ecuaciones se puede hallar como combinación lineal del resto, es decir, es linealmente dependiente.
•Una condición necesaria para que un sistema sea compatible indeterminado es que el determinante de la matriz del sistema sea cero (y por tanto uno de sus autovalores será 0):
•De hecho, de las dos condiciones anteriores se desprende, que el conjunto de soluciones de un sistema compatible indeterminado es un subespacio vectorial. Y la dimensión de ese espacio vectorial coincidirá con la multiplicidad geométrica del autovalor cero.
Sistemas incompatibles [editar]
De un sistema se dice que es incompatible cuando no presenta ninguna solución. Por ejemplo, supongamos el siguiente sistema:
Las ecuaciones se corresponden gráficamente con dos rectas, ambas con la misma pendiente, Al ser paralelas, no se cortan en ningún punto, es decir, no existe ningún valor que satisfaga a la vez ambas ecuaciones.
Matemáticamente un sistema de es incompatible cuando el rango de la matriz del sistema es inferior al rango de la matriz ampliada. Una condición necesaria para que esto suceda es que el determinante de la matriz del sistema sea cero:
Métodos de resolución
SustitucióN
El método de sustitución consiste en despejar en una de las ecuaciones cualquier incógnita, preferiblemente la que tenga menor coeficiente, para, a continuación, sustituirla en otra ecuación por su valor.
En caso de sistemas con más de dos incógnitas, la seleccionada debe ser sustituida por su valor equivalente en todas las ecuaciones excepto en la que la hemos despejado. En ese instante, tendremos un sistema con una ecuación y una incógnita menos que el inicial, en el que podemos seguir aplicando este método reiteradamente. Por ejemplo, supongamos que queremos resolver por sustitución este sistema:
En la primera ecuación, seleccionamos la incógnita por ser la de menor coeficiente y que posiblemente nos facilite más las operaciones, y la despejamos, obteniendo la siguiente ecuación.
El siguiente paso será sustituir cada ocurrencia de la incógnita en la otra ecuación, para así obtener una ecuación donde la única incógnita sea la .
Al resolver la ecuación obtenemos el resultado , y si ahora sustituimos esta incógnita por su valor en alguna de las ecuaciones originales obtendremos , con lo que el sistema queda ya resuelto.
Igualación [editar]
El método de igualación se puede entender como un caso particular del método de sustitución en el que se despeja la misma incógnita en dos ecuaciones y a continuación se igualan entre sí la parte derecha de ambas ecuaciones.
Tomando el mismo sistema utilizado como ejemplo para el método de sustitución, si despejamos la incógnita en ambas ecuaciones nos queda de la siguiente manera:
Como se puede observar, ambas ecuaciones comparten la misma parte izquierda, por lo que podemos afirmar que las partes derechas también son iguales entre sí.
Llegados a este punto, la ecuación resultante es resoluble y podemos obtener el valor de la incógnita , y a partir de aquí, sustituyendo dicho valor en una de las ecuaciones originales, obtener el valor de la , que además ya se encuentra despejada.
Reducción [editar]
Este método suele emplearse mayoritariamente en los sistemas lineales, siendo pocos los casos en que se utiliza para resolver sistemas no lineales. El procedimiento, diseñado para sistemas con dos ecuaciones e incógnitas, consiste en transformar una de las ecuaciones (generalmente, mediante productos), de manera que obtengamos dos ecuaciones en la que una misma incógnita aparezca con el mismo coeficiente y distinto signo. A continuación, se suman ambas ecuaciones produciéndose así la reducción o cancelación de dicha incógnita, obteniendo así una ecuación con una sola incógnita, donde el método de resolución es simple.
Por ejemplo, en el sistema
no tenemos más que multiplicar la primera ecuación por para poder cancelar la incógnita . Al multiplicar, dicha ecuación nos queda así:
Si sumamos esta ecuación a la segunda del sistema original, obtenemos una nueva ecuación donde la incógnita ha sido reducida y que, en este caso, nos da directamente el valor de la incógnita :
El siguiente paso consiste únicamente en sustituir el valor de la incógnita en cualquiera de las ecuaciones donde aparecían ambas incógnitas, y obtener así que el valor de es igual a .
Método de Gauss [editar]
La eliminación de Gauss-Jordan, más conocida como método de Gauss, es un método aplicable únicamente a los sistemas lineales de ecuaciones, y consistente en triangular la matriz aumentada del sistema mediante transformaciones elementales, hasta obtener ecuaciones de una sola incógnita, cuyo valor será igual al coeficiente situado en la misma fila de la matriz. Este procedimiento es similar al anterior de reducción, pero ejecutado de manera reiterada y siguiendo un cierto orden algorítmico.
Tomemos como ejemplo el siguiente sistema:
Su matriz aumentada será esta:
En primer lugar, reducimos la incógnita , sumando a la segunda fila, la primera multiplicada por , y a la tercera, la primera fila. La matriz queda así:
El siguiente paso consiste en eliminar la incógnita en la primera y tercera fila, para lo cual les sumamos la segunda multiplicada por y por , respectivamente.
Por último, eliminamos la , tanto de la primera como de la segunda fila, sumándoles la tercera multiplicada por y por , respectivamente.
Llegados a este punto podemos resolver directamente las ecuaciones que se nos plantean:
O, si lo preferimos, podemos multiplicar las tres filas de la matriz por , y respectivamente, y obtener así automáticamente los valores de las incógnitas en la última columna.
Regla de Cramer :
Artículo principal: Regla de Cramer
La regla de Cramer da una solución para sistemas compatibles determinados en términos de determinantes y adjuntos dada por:
Donde Aj es la matriz resultante de remplazar la j-ésima columna de A por el vector columna b. Para un sistema de dos ecuaciones y dos incónitas:
La regla de Cramer da la siguiente solución:
Nota: Cuando en la determinante original det(A) el resultado es 0, el sistema indica múltiples o sin coincidencia.
Sistemas lineales en un cuerpo arbitrario
Cuando consideramos ecuaciones lineales cuyas soluciones son números racionales, reales o complejos o más generalmente un cuerpo , la solución puede encontrarse mediante Regla de Cramer. Para sistemas de muchas ecuaciones la regla de Cramer puede ser computacionalmente más costosa y suelen usarse otros métodos más "económicos" en número de operaciones como la eliminación de Gauss-Jordan y la descomposición de Cholesky. Existen también métodos indirectos (basados en iteraciones) como el método de Gauss-Seidel.
Si el cuerpo es infinito (como es el caso de los números reales o complejos), entonces solo puede darse una de las tres siguientes situaciones:
•el sistema no tiene solución (en dicho caso decimos que el sistema está sobredeterminado o que es incompatible)
•el sistema tiene una única solución (el sistema es compatible determinado)
•el sistema tiene un número infinito de soluciones (el sistema es compatible indeterminado).
Un sistema de la forma
Ax = 0
se le llama sistema homogéneo. El conjunto de todas las soluciones de este tipo de sistema se le llama núcleo de la matriz y se escribe como Nuc A.
Se han diseñado algoritmos alternativos mucho más eficientes a la eliminación de Gauss-Jordan para una gran cantidad de casos específicos. La mayoría de estos algoritmos mejorados tienen una complejidad computacional de O(n²). Algunos de los métodos más usados son:
•Para los problemas de la forma Ax = b, donde A es una matriz de Toeplitz simétrica, se puede utilizar la recursión de Levinson o alguno de los métodos derivados de éste. Un método derivado de la recursión de Levinson es la recursión de Schur, que es ampliamente usado en el campo del procesamiento digital de señales.
•Para los problemas de la forma Ax = b, donde A es una matriz singular o casi singular, la matriz A se descompone en el producto de tres matrices en un proceso llamado descomposición de valores singulares.
Solución de sistemas lineales en un anillo
Artículo principal: ecuación diofántica
Los métodos para resolver el sistema (1) sobre un anillo son muy diferentes a los considerados anteriormente. De hecho la mayoría de métodos usados en cuerpos, como la regla de Cramer, son inaplicables en anillos debido a que no existen inversos multiplicativos.
La existencia de solución del sistema (1) sobre los enteros requiere varias condiciones:
1.Para cada i es divisor de .
2.Si la condición anterior se cumple para un determinado i existe un conunto de enteros formado por el conjunto de enteros que satisface la i-ésima ecuación, y existirá solución si la intersección .
buenas tardes profesor espero que este pasando una feliz navidad con su familia y principalmente con dios le escribe el alumno javier ruiz de la torre de la seccion 001-d de administracion de desastres
regresion y correlacion
analisis:
# Marco Teórico
A fin de facilitar la comprensión del presente trabajo definiremos algunos conceptos basicos.
Análisis de Correlación: Es el conjunto de técnicas estadísticas empleado para medir la intensidad de la asociación entre dos variables.
El principal objetivo del análisis de correlación consiste en determinar que tan intensa es la relación entre dos variables. Normalmente, el primer paso es mostrar los datos en un diagrama de dispersión.
Diagrama de Dispersión:es aquel grafico que representa la relación entre dos variables.
Variable Dependiente:es la variable que se predice o calcula. Cuya representación es "Y"
Variable Independiente: es la variable que proporciona las bases para el calculo. Cuya representación es: X1,X2,X3.......
Coeficiente de Correlación: Describe la intensidad de la relación entre dos conjuntos de variables de nivel de intervalo. Es la medida de la intensidad de la relación lineal entre dos variables.
El valor del coeficiente de correlación puede tomar valores desde menos uno hasta uno, indicando que mientras más cercano a uno sea el valor del coeficiente de correlación, en cualquier dirección, más fuerte será la asociación lineal entre las dos variables. Mientras más cercano a cero sea el coeficiente de correlación indicará que más débil es la asociación entre ambas variables. Si es igual a cero se concluirá que no existe relación lineal alguna entre ambas variables.
Análisis de regresión:Es la técnica empleada para desarrollar la ecuación y dar las estimaciones.
Ecuación de Regresión:es una ecuación que define la relación lineal entre dos variables.
Ecuación de regresión Lineal: Y’ = a + Bx
Ecuación de regresión Lineal Múltiple: Y’ = a + b1X1 + b2X2 + b3X3...
Principio de Mínimos Cuadrados:Es la técnica empleada para obtener la ecuación de regresión, minimizando la suma de los cuadrados de las distancias verticales entre los valores verdaderos de "Y" y los valores pronosticados "Y".
Análisis de regresión y Correlación Múltiple:consiste en estimar una variable dependiente, utilizando dos o más variables independientes.
Ecuación de regresión Múltiple: La forma general de la ecuación de regresión múltiple con dos variables independientes es:
Y' = a + b1X1 + b2X2
X1,X2 : Variables Independientes
a : es la ordenada del punto de intersección con el eje Y.
b1 : Coeficiente de Regresión (es la variación neta en Y por cada unidad de
variación en X1.).
b2 : Coeficiente de Regresión (es el cambio neto en Y para cada cambio
unitario en X2).
Prueba Global.- esta prueba investiga básicamente si es posible que todas las variables independientes tengan coeficientes de regresión neta iguales a 0.
# Desarrollo de un Caso.
Una agencia de Viajes desea saber la relación que hay entre las ventas, el presupuesto destinado a publicidad, y las comisiones de los vendedores para esto presenta los siguientes datos. Realice los análisis respectivos.
Y
X1
X2
AÑO
VENTAS
GASTOS DE PUBLICIDAD
COMISIONES DE VENDEDORES
2000
264000
550
15840
2001
384000
590
19250
2002
400200
680
26013
2003
422400
700
16896
2004
543000
750
16290
ANÁLISIS DE DATOS:
Se van a utilizar las siguientes variables:
Variables Independientes:
1.- Gastos de Publicidad
2.- Comisión de vendedores
Variable dependiente:
- Ventas
Utilizando el Excel obtenemos los siguientes datos.
Estadísticas de la Regresión
Coeficiente de correlación múltiple
0.92092
Coeficiente de determinación R2
0.84810
R2 ajustado
0.69619
Error típico
54887.83156
Observaciones
5
De aquí se puede decir:
- De acuerdo al valor del coeficiente de correlación múltiple, podemos afirmar que la variable X1 (Gastos de Publicidad) y X2 (Comisión de vendedores) se encuentran asociadas en forma directa de una manera muy fuerte con la variable dependiente Ventas, en un 92%.
- De acuerdo al Coeficiente de determinación R2, podemos decir que el 85% de las ventas pueden ser explicadas por los gastos de publicidad y las comisiones de los vendedores.
A N Á L I S I S D E V A R I A N Z A
Grados de libertad
Suma de cuadrados
Prom. de los cuadrados
F
Valor crítico de F
Regresión
2
33640459893
16820229947
5.5832
0.15190282
Residuos
2
6025348107
3012674053
Total
4
39665808000
Coeficientes
Error típico
Estadístico t
Probab.
Inf. 95%
Sup. 95%
Inferior 95.0%
Sup. 95.0%
Intercepción
-289315.16
242459.39
-1.193
0.35513
-1332534.446
753904.118
-1332534.446
753904.118
GSTOS DE PUBLICID.
1123.49
336.22
3.342
0.07908
-323.1275965
2570.108
-323.128
2570.108
COM. DE VENDED.
-2.27
6.55
-0.346
0.76245
-30.45400257
25.922
-30.454
25.922
De aquí se desprende la ecuación de regresión múltiple:
Y = - 289315 + 1123 X1 - 2.27 X2
Prueba Global: Verificación de la validez del modelo de regresión Múltiple.
Formulación de Hipótesis:
Hp: B1 = B2 = 0
Ha: B1 B2 0
Si se acepta la hipótesis planteada, significa que ninguno de los factores (X1,X2) son relevantes para explicar los cambios en Y.
De acuerdo a la tabla de análisis de la varianza F calculado es 5.58 y el p-valor es 0.15, de lo cual podemos decir que La hipótesis planteada se rechaza y se acepta la hipótesis alternativa, por que el F calculado es mayor que el p-valor.
Hasta ahora se ha demostrado que algunos, pero no necesariamente todos los coeficientes de regresión, no son iguales a cero y, por o tanto son útiles para las predicciones. El siguiente paso consiste en probar individualmente las variables para determinar cuales coeficientes de regresión pueden ser cero y cuales no.
Del análisis mediante Excell tenemos el siguiente cuadro.
VENTAS VS GASTOS DE PUBLICIDAD
Estadísticas de la regresión
Coeficiente de correlación múltiple
0.915976333
Inferencia en el analisis de regresion:
los supuestos para elananlisis de regesion son como:
· Existen atos de medicion para a x y z
· la variable dependiente es una variable aleatoria
· para cada valor de x, existe una distribucion condicional de la que es de naturaleza normal
· la desviacion estandar de todas la distribuciones condicionales son iguales
el error de estandar de estimacion
la determinante primaria de la exactitud es el grado de dispersion de la poblacion: cuanto mas dispersa este, menor sera la exactitud de la estmacion.El grado de dispresion en la poblacion se puede estimar a partir del grado de dispersion en las observacines de la muestra con respecto a la linea de regresion calculada, utilizando la formula:
SE="(YI-YC)
N-2
EN LA CUAL:
YI= CADA VALOR DE Y
YC=VALOR DE LA LINEA DE REGRESION CORRESPONDIENTE A PARTIR DE LA ECUACION DE REGRESION
N=NUMERO DE OBSERVACIONES
DISTRIBUCIONES BIDIMENSIONALES
Cuando trabajamos en un estudio estadístico y observamos simultáneamente dos caracteres en un mismo individuo obtenemos pares de resultados, por ejemplo, al observar en una persona su edad y su peso. Los distintos valores de las modalidades que pueden adoptar estos caracteres forman un conjunto de pares, que representamos por (X, Y) y llamamos variable estadística bidimensional.
Los dos caracteres observados no tienen por qué ser de la misma clase, así nos podemos encontrar con las siguientes situaciones :
Tipos variables ( X, Y )
Ejemplo
Dos caracteres cualitativos Categórica / Categórica Sexo y color del pelo.
Dos caracteres cuantitativos Discreta / Discreta Número de hermanos y número de hijos.
Continua / Continua Perímetro craneal y perímetro torácico.
Discreta / Continua Pulsaciones y temperatura.
Uno cualitativo y otro cuantitativo Categórica / Discreta Sexo y número de libros leídos.
Categórica / Continua Color del pelo y talla.
Es decir, ahora nuestra unidad de estudio es el par (X, Y) y dos pares están repetidos cuando sus respectivos valores son iguales. Otro factor a tener en cuenta es que el número de modalidades distintas que adopta el carácter X no tiene por qué ser el mismo que el que adopta el carácter Y:
X = { x1, x2, x3, ..., xs } ; Y = { y1, y2, y3, ..., yt }
Ordenación de datos : Tablas
Parece que lo más lógico es ordenar éstos pares de datos en una tabla de doble entrada, donde tengan cabida los s valores de la variable X y los t valores de la variable Y.
Donde nij es el número de veces que aparece repetido el par (xi, yi) y que llamaremos frecuencia absoluta del par (xi, yi).
Una tabla de doble entrada también se puede expresar como una tabla simple, de forma que siempre es posible pasar de una a otra según convenga.
Las tablas simples reflejan el comportamiento de la variable estadística bidimensional (X, Y) a partir de los valores individuales que toman cada una de las variables estadísticas unidimensionales X e Y.
Observaciones
La frecuencia relativa del par (xi, yi) la denotamos por fij
La suma de las frecuencias absolutas es igual al número de pares observados (N).
La suma de las frecuencias relativas es igual a la unidad.
Representaciones gráficas
Diagramas de dispersión
Es la representación sobre unos ejes cartesianos de los distintos valores de la variable (X, Y). En el eje de abscisas representamos los valores de X y en el de ordenadas los valores de Y, de tal forma que cada par viene representado por un punto del plano X×Y.
En el caso de que las dos variables estén agrupadas en intervalos el diagrama se construye mediante casillas que tienen dentro tantos puntos como el valor de la frecuencia absoluta correspondiente a los intervalos X e Y.
Si las variables que componen el par son una discreta y otra continua se utilizan las marcas de clase, siendo un caso similar al primero.
Los diagramas de dispersión también se conocen como nube de puntos.
diagramas de frecuencias
Como en un diagrama de dispersión no puede quedar reflejado las veces que se repite un par o un intervalo, hemos de recurrir a una representación en tres dimensiones de (X, Y). Dos son para la variable bidimensional y una dimensión para expresar las frecuencias.
La figura adjunta representa los datos del ejemplo 1. La variable X toma los valores 10, 15,... y la variable Y los valores 0, 1,2,...; en el eje Z están representadas las frecuencias absolutas del par (X, Y).
Distribuciones Marginales
Si en una tabla de doble entrada tenemos en cuenta solamente la variable X y el recuento de sus frecuencias, sin que para nada intervengan los valores de la Y, esta distribución se denomina distribución marginal de la variable X ,siendo nxi el número de elementos observados cuando la variable X es xi (frecuencia marginal del valor xi ). Análogamente cuando tomamos la variable Y, sin tener en cuenta para nada los valores de X.
De las frecuencias absolutas marginales se obtienen las frecuencias relativas marginales. Y de igual forma podemos obtener las medias, varianzas y desviaciones típicas marginales.
DISTRIBUCIONES BIDIMENSIONALES
________________________________________
Cuando trabajamos en un estudio estadístico y observamos simultáneamente dos caracteres en un mismo individuo obtenemos pares de resultados, por ejemplo, al observar en una persona su edad y su peso. Los distintos valores de las modalidades que pueden adoptar estos caracteres forman un conjunto de pares, que representamos por (X, Y) y llamamos variable estadística bidimensional.
Los dos caracteres observados no tienen por qué ser de la misma clase, así nos podemos encontrar con las siguientes situaciones :
Tipos variables ( X, Y ) Ejemplo
Dos caracteres cualitativos Categórica / Categórica Sexo y color del pelo.
Dos caracteres cuantitativos Discreta / Discreta Número de hermanos y número de hijos.
Continua / Continua Perímetro craneal y perímetro torácico.
Discreta / Continua Pulsaciones y temperatura.
Uno cualitativo y otro cuantitativo Categórica / Discreta Sexo y número de libros leídos.
Categórica / Continua Color del pelo y talla.
Es decir, ahora nuestra unidad de estudio es el par (X, Y) y dos pares están repetidos cuando sus respectivos valores son iguales. Otro factor a tener en cuenta es que el número de modalidades distintas que adopta el carácter X no tiene por qué ser el mismo que el que adopta el carácter Y:
X = { x1, x2, x3, ..., xs } ; Y = { y1, y2, y3, ..., yt }
Ordenación de datos : Tablas
Parece que lo más lógico es ordenar éstos pares de datos en una tabla de doble entrada, donde tengan cabida los s valores de la variable X y los t valores de la variable Y.
Donde nij es el número de veces que aparece repetido el par (xi, yi) y que llamaremos frecuencia absoluta del par (xi, yi).
Una tabla de doble entrada también se puede expresar como una tabla simple, de forma que siempre es posible pasar de una a otra según convenga.
Las tablas simples reflejan el comportamiento de la variable estadística bidimensional (X, Y) a partir de los valores individuales que toman cada una de las variables estadísticas unidimensionales X e Y.
Observaciones
La frecuencia relativa del par (xi, yi) la denotamos por fij
La suma de las frecuencias absolutas es igual al número de pares observados (N).
La suma de las frecuencias relativas es igual a la unidad.
Representaciones gráficas
DIAGRAMAS DE DISPERSIÓN
Es la representación sobre unos ejes cartesianos de los distintos valores de la variable (X, Y). En el eje de abscisas representamos los valores de X y en el de ordenadas los valores de Y, de tal forma que cada par viene representado por un punto del plano X×Y.
En el caso de que las dos variables estén agrupadas en intervalos el diagrama se construye mediante casillas que tienen dentro tantos puntos como el valor de la frecuencia absoluta correspondiente a los intervalos X e Y.
Si las variables que componen el par son una discreta y otra continua se utilizan las marcas de clase, siendo un caso similar al primero.
Los diagramas de dispersión también se conocen como nube de puntos.
DIAGRAMAS DE FRECUENCIAS
Como en un diagrama de dispersión no puede quedar reflejado las veces que se repite un par o un intervalo, hemos de recurrir a una representación en tres dimensiones de (X, Y). Dos son para la variable bidimensional y una dimensión para expresar las frecuencias.
La figura adjunta representa los datos del ejemplo 1. La variable X toma los valores 10, 15,... y la variable Y los valores 0, 1,2,...; en el eje Z están representadas las frecuencias absolutas del par (X, Y).
Distribuciones Marginales
Si en una tabla de doble entrada tenemos en cuenta solamente la variable X y el recuento de sus frecuencias, sin que para nada intervengan los valores de la Y, esta distribución se denomina distribución marginal de la variable X ,siendo nxi el número de elementos observados cuando la variable X es xi (frecuencia marginal del valor xi ). Análogamente cuando tomamos la variable Y, sin tener en cuenta para nada los valores de X.
De las frecuencias absolutas marginales se obtienen las frecuencias relativas marginales. Y de igual forma podemos obtener las medias, varianzas y desviaciones típicas marginales.
Regresión lineal:
En estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede ser expresado como:
Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \cdots +\beta_p X_p + \varepsilon
donde β0 es la intersección o término "constante", las βi son los parámetros respectivos a cada variable independiente, y p es el número de parámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.
Ecuación lineal:
Una ecuación lineal es un planteamiento de igualdad, involucrando una o más variables a la primera potencia, que no contiene productos entre las variables, o mejor dicho,es una ecuación que involucra solamente sumas y restas de una variable a la primera potencia . En el sistema cartesiano representan rectas. Una forma común de ecuaciones lineales es y = mx + c Donde m representa la pendiente y el valor de c determina la ordenada al origen (el punto donde la recta corta al eje Y). Las ecuaciones en las que aparece el término x*y (llamado rectangular) no son consideradas lineales
Algunos ejemplos de ecuaciones lineales:
3x + 2y = 10\,
3a + 472b = 10b + 37\,
3x + y -5 = -7x + 4y +3\,.
x-y+z=15 \,
3x-2y+z=20 \,
x+4y-3z=10 \,
Tipos de ecuaciones lineales
Formas complejas como las anteriores pueden reescribirse usando las reglas del álgebra elemental en formas más simples. Las letras mayúsculas representan constantes, mientras x e y son variables.
* Ecuación general
Ax + By + C = 0\,
Aquí A y B no son ambos cero. Representa una línea en el cartesiano. Es posible encontrar los valores donde x e y se anulan.
* Ecuación segmentaria
\frac{x}{E} + \frac{y}{F} = 1
Aquí E y F no deben ser cero. El gráfico de esta ecuación corta al eje X y al eje Y en E y F respectivamente.
* Forma paramétrica
1. x = Tt + U\,
2. y = Vt + W\,
Dos ecuaciones que deben cumplirse de manera simultanea, cada una en la variable t. Puede convertirse a la forma general despejando t en ambas ecuaciones e igualando.
* Casos especiales:
y = F\,
Un caso especial es la forma estándar donde A = 0 y B = 1. El gráfico es una línea horizontal sin intersección con el eje X ó (si F = 0) coincidente con el ese eje.
x = E\,
Otro caso especial de la forma general donde A = 1 y B = 0. El gráfico es una línea vertical, interceptando el eje X en E.
0 = 0\,
En este caso, todas las variables fueron canceladas, dejando una ecuación que es verdadera en todos los casos. La forma original (no una tan trivial como la del ejemplo), es llamada identidad. El gráfico es todo el plano cartesiano, ya que lo satisface todo par de números reales x e y.
Nótese que si la manipulación algebraica lleva a una ecuación como 1 = 0 entonces la original es llamada inconsistente, o sea que no se cumple para ningún par de números x e y. Un ejemplo podría ser: 3x + 2 = 3x − 5.
Adicionalmente podría haber más de dos variables, en ecuaciones simultaneas. Para más información véa: Sistema lineal de ecuaciones
Linealidad
Una función es lineal si y solo si cumple con la siguiente proposición:
f(x + y) = f(x) + f(y)
f(ax) = af(x)
donde a es cualquier escalar. También se llama a f operador lineal
Sistema de ecuaciones lineales:
En matemática y álgebra lineal, un sistema de ecuaciones lineales, también conocido como sistema lineal de ecuaciones o simplemente sistema lineal, es un conjunto de ecuaciones lineales sobre un cuerpo o un anillo conmutativo. Un ejemplo de sistema lineal de ecuaciones sería el siguiente:
El problema consiste en encontrar los valores desconocidos de las variables x1, x2 y x3 que satisfacen las tres ecuaciones.
El problema de los sistemas lineales de ecuaciones es uno de los más antiguos de la matemática y tiene una infinidad de aplicaciones, como en procesamiento digital de señales, estimación, predicción y más generalmente en programación lineal así como en la aproximación de problemas no lineales de análisis numérico.
En general, un sistema con m ecuaciones lineales n incógnitas puede ser escrito en forma ordinaria como:
Donde son las incógnitas y los números son los coeficientes del sistema sobre el cuerpo . Es posible reescribir el sistema separando con coeficientes con notación matricial:
(1)
Si representamos cada matriz con una única letra obtenemos:
Donde A es una matriz m por n, x es un vector columna de longitud n y b es otro vector columna de longitud m. El sistema de eliminación de Gauss-Jordan se aplica a este tipo de sistemas, sea cual sea el cuerpo del que provengan los coeficientes.
Sistemas lineales reales
En esta sección se analizan las propiedades de los sistemas de ecuaciones lineales sobre el cuerpo , es decir, los sistemas lineales en los coeficientes de las ecuaciones son números reales.
La intersección de dos planos no paralelos es una recta
Un sistema con incógnitas se puede representar en el n-espacio correspondiente.
En los sistemas con 2 incógnitas, el universo de nuestro sistema será el plano bidimensional, mientras que cada una de las ecuaciones será representada por una recta, si es lineal, o por una curva, si no lo es. La solución será el punto (o línea) donde intersecten todas las rectas y curvas que representan a las ecuaciones. Si no existe ningún punto en el que intersecten al mismo tiempo todas las líneas, el sistema es incompatible, o lo que es lo mismo, no tiene solución.
En el caso de un sistema con 3 incógnitas, el universo será el espacio tridimensional, siendo cada ecuación un plano dentro del mismo. Si todos los planos intersectan en un único punto, las coordenadas de éste serán la solución al sistema. Si, por el contrario, la intersección de todos ellos es una recta o incluso un plano, el sistema tendrá infinitas soluciones, que serán las coordenadas de los puntos que forman dicha línea o superficie.
Para sistemas de 4 ó más incógnitas, la representación gráfica no es intuitiva para el ser humano, por lo que dichos problemas no suelen enfocarse desde esta óptica.
Tipos de sistemas [editar]
Los sistemas de ecuaciones se pueden clasificar según el número de soluciones que pueden presentar. De acuerdo con ese caso se pueden presentar los siguientes casos:
Sistema incompatible si no tiene ninguna solución.
Sistema compatible si tiene alguna solución, en este caso además puede distinguirse entre:
o Sistema compatible determinado cuando tiene un número finito de soluciones.
o Sistema compatible indeterminado cuando admite un conjunto infinito de soluciones.
Quedando así la clasificación:
Los sistemas incompatibles geométricamente se caracterizan por (hiper)planos o rectas que se cruzan sin cortarse. Los sistemas compatibles determinados se caracterizan por un conjunto de (hiper)planos o rectas que se cortan en un único punto. Los sistemas compatibles indeterminados se caracterizan por (hiper)planos que se cortan a lo largo de una recta [o más generalmente un hiperplano de dimensión menor]. Desde un punto de vista algebraico los sistemas compatibles determinados se caracterizan porque el determinante de la matriz es diferente de cero:
Sistemas compatibles indeterminados
Un sistema sobre un cuerpo K es compatible indeterminado cuando posee un número infinito de soluciones. Por ejemplo, el siguiente sistema:
Tanto la primera como la segunda ecuación se corresponden con la recta cuya pendiente es y que pasa por el punto , por lo que ambas intersectan en todos los puntos de dicha recta. El sistema es compatible por haber solución o intersección entre las rectas, pero es indeterminado al ocurrir esto en infinitos puntos.
•En este tipo de sistemas, la solución genérica consiste en expresar una o más variables como función matemática del resto. En los sistemas lineales compatibles indeterminados, al menos una de sus ecuaciones se puede hallar como combinación lineal del resto, es decir, es linealmente dependiente.
•Una condición necesaria para que un sistema sea compatible indeterminado es que el determinante de la matriz del sistema sea cero (y por tanto uno de sus autovalores será 0):
•De hecho, de las dos condiciones anteriores se desprende, que el conjunto de soluciones de un sistema compatible indeterminado es un subespacio vectorial. Y la dimensión de ese espacio vectorial coincidirá con la multiplicidad geométrica del autovalor cero.
Sistemas incompatibles
De un sistema se dice que es incompatible cuando no presenta ninguna solución. Por ejemplo, supongamos el siguiente sistema:
Las ecuaciones se corresponden gráficamente con dos rectas, ambas con la misma pendiente, Al ser paralelas, no se cortan en ningún punto, es decir, no existe ningún valor que satisfaga a la vez ambas ecuaciones.
Matemáticamente un sistema de es incompatible cuando el rango de la matriz del sistema es inferior al rango de la matriz ampliada. Una condición necesaria para que esto suceda es que el determinante de la matriz del sistema sea cero:
Métodos de resolución
SustitucióN
El método de sustitución consiste en despejar en una de las ecuaciones cualquier incógnita, preferiblemente la que tenga menor coeficiente, para, a continuación, sustituirla en otra ecuación por su valor.
En caso de sistemas con más de dos incógnitas, la seleccionada debe ser sustituida por su valor equivalente en todas las ecuaciones excepto en la que la hemos despejado. En ese instante, tendremos un sistema con una ecuación y una incógnita menos que el inicial, en el que podemos seguir aplicando este método reiteradamente. Por ejemplo, supongamos que queremos resolver por sustitución este sistema:
En la primera ecuación, seleccionamos la incógnita por ser la de menor coeficiente y que posiblemente nos facilite más las operaciones, y la despejamos, obteniendo la siguiente ecuación.
El siguiente paso será sustituir cada ocurrencia de la incógnita en la otra ecuación, para así obtener una ecuación donde la única incógnita sea la .
Al resolver la ecuación obtenemos el resultado , y si ahora sustituimos esta incógnita por su valor en alguna de las ecuaciones originales obtendremos , con lo que el sistema queda ya resuelto.
Igualación
El método de igualación se puede entender como un caso particular del método de sustitución en el que se despeja la misma incógnita en dos ecuaciones y a continuación se igualan entre sí la parte derecha de ambas ecuaciones.
Tomando el mismo sistema utilizado como ejemplo para el método de sustitución, si despejamos la incógnita en ambas ecuaciones nos queda de la siguiente manera:
Como se puede observar, ambas ecuaciones comparten la misma parte izquierda, por lo que podemos afirmar que las partes derechas también son iguales entre sí.
Llegados a este punto, la ecuación resultante es resoluble y podemos obtener el valor de la incógnita , y a partir de aquí, sustituyendo dicho valor en una de las ecuaciones originales, obtener el valor de la , que además ya se encuentra despejada.
Reducción
Este método suele emplearse mayoritariamente en los sistemas lineales, siendo pocos los casos en que se utiliza para resolver sistemas no lineales. El procedimiento, diseñado para sistemas con dos ecuaciones e incógnitas, consiste en transformar una de las ecuaciones (generalmente, mediante productos), de manera que obtengamos dos ecuaciones en la que una misma incógnita aparezca con el mismo coeficiente y distinto signo. A continuación, se suman ambas ecuaciones produciéndose así la reducción o cancelación de dicha incógnita, obteniendo así una ecuación con una sola incógnita, donde el método de resolución es simple.
Por ejemplo, en el sistema
no tenemos más que multiplicar la primera ecuación por para poder cancelar la incógnita . Al multiplicar, dicha ecuación nos queda así:
Si sumamos esta ecuación a la segunda del sistema original, obtenemos una nueva ecuación donde la incógnita ha sido reducida y que, en este caso, nos da directamente el valor de la incógnita :
El siguiente paso consiste únicamente en sustituir el valor de la incógnita en cualquiera de las ecuaciones donde aparecían ambas incógnitas, y obtener así que el valor de es igual a .
Método de Gauss [editar]
La eliminación de Gauss-Jordan, más conocida como método de Gauss, es un método aplicable únicamente a los sistemas lineales de ecuaciones, y consistente en triangular la matriz aumentada del sistema mediante transformaciones elementales, hasta obtener ecuaciones de una sola incógnita, cuyo valor será igual al coeficiente situado en la misma fila de la matriz. Este procedimiento es similar al anterior de reducción, pero ejecutado de manera reiterada y siguiendo un cierto orden algorítmico.
Tomemos como ejemplo el siguiente sistema:
Su matriz aumentada será esta:
En primer lugar, reducimos la incógnita , sumando a la segunda fila, la primera multiplicada por , y a la tercera, la primera fila. La matriz queda así:
El siguiente paso consiste en eliminar la incógnita en la primera y tercera fila, para lo cual les sumamos la segunda multiplicada por y por , respectivamente.
Por último, eliminamos la , tanto de la primera como de la segunda fila, sumándoles la tercera multiplicada por y por , respectivamente.
Llegados a este punto podemos resolver directamente las ecuaciones que se nos plantean:
O, si lo preferimos, podemos multiplicar las tres filas de la matriz por , y respectivamente, y obtener así automáticamente los valores de las incógnitas en la última columna.
Regla de Cramer :
Artículo principal: Regla de Cramer
La regla de Cramer da una solución para sistemas compatibles determinados en términos de determinantes y adjuntos dada por:
Donde Aj es la matriz resultante de remplazar la j-ésima columna de A por el vector columna b. Para un sistema de dos ecuaciones y dos incónitas:
La regla de Cramer da la siguiente solución:
Nota: Cuando en la determinante original det(A) el resultado es 0, el sistema indica múltiples o sin coincidencia.
Sistemas lineales en un cuerpo arbitrario
Cuando consideramos ecuaciones lineales cuyas soluciones son números racionales, reales o complejos o más generalmente un cuerpo , la solución puede encontrarse mediante Regla de Cramer. Para sistemas de muchas ecuaciones la regla de Cramer puede ser computacionalmente más costosa y suelen usarse otros métodos más "económicos" en número de operaciones como la eliminación de Gauss-Jordan y la descomposición de Cholesky. Existen también métodos indirectos (basados en iteraciones) como el método de Gauss-Seidel.
Si el cuerpo es infinito (como es el caso de los números reales o complejos), entonces solo puede darse una de las tres siguientes situaciones:
•el sistema no tiene solución (en dicho caso decimos que el sistema está sobredeterminado o que es incompatible)
•el sistema tiene una única solución (el sistema es compatible determinado)
•el sistema tiene un número infinito de soluciones (el sistema es compatible indeterminado).
Un sistema de la forma
Ax = 0
se le llama sistema homogéneo. El conjunto de todas las soluciones de este tipo de sistema se le llama núcleo de la matriz y se escribe como Nuc A.
Se han diseñado algoritmos alternativos mucho más eficientes a la eliminación de Gauss-Jordan para una gran cantidad de casos específicos. La mayoría de estos algoritmos mejorados tienen una complejidad computacional de O(n²). Algunos de los métodos más usados son:
•Para los problemas de la forma Ax = b, donde A es una matriz de Toeplitz simétrica, se puede utilizar la recursión de Levinson o alguno de los métodos derivados de éste. Un método derivado de la recursión de Levinson es la recursión de Schur, que es ampliamente usado en el campo del procesamiento digital de señales.
•Para los problemas de la forma Ax = b, donde A es una matriz singular o casi singular, la matriz A se descompone en el producto de tres matrices en un proceso llamado descomposición de valores singulares.
Solución de sistemas lineales en un anillo
Artículo principal: ecuación diofántica
Los métodos para resolver el sistema (1) sobre un anillo son muy diferentes a los considerados anteriormente. De hecho la mayoría de métodos usados en cuerpos, como la regla de Cramer, son inaplicables en anillos debido a que no existen inversos multiplicativos.
La existencia de solución del sistema (1) sobre los enteros requiere varias condiciones:
1.Para cada i es divisor de .
2.Si la condición anterior se cumple para un determinado i existe un conunto de enteros formado por el conjunto de enteros que satisface la i-ésima ecuación, y existirá solución si la intersección .
Buenas este es mi resumen Soy José Camacho
Regresión y Correlación.
La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muéstrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.Ecuación de regresión Múltiple: La forma general de la ecuación de regresión múltiple con dos variables independientes es:
Y' = a + b1X1 + b2X2
X1,X2 : Variables Independientes
a : es la ordenada del punto de intersección con el eje Y.
b1 : Coeficiente de Regresión (es la variación neta en Y por cada unidad de
variación en X1.).
b2 : Coeficiente de Regresión (es el cambio neto en Y para cada cambio
unitario en X2).
Prueba Global.- esta prueba investiga básicamente si es posible que todas las variables independientes tengan coeficientes de regresión neta iguales a 0.
# Desarrollo de un Caso.
Una agencia de Viajes desea saber la relación que hay entre las ventas, el presupuesto destinado a publicidad, y las comisiones de los vendedores para esto presenta los siguientes datos. Realice los análisis respectivos.
Y
X1
X2
AÑO
VENTAS
GASTOS DE PUBLICIDAD
COMISIONES DE VENDEDORES
2000
264000
550
15840
2001
384000
590
19250
2002
400200
680
26013
2003
422400
700
16896
2004
543000
750
16290
ANÁLISIS DE DATOS:
Se van a utilizar las siguientes variables:
Variables Independientes:
1.- Gastos de Publicidad
2.- Comisión de vendedores
Variable dependiente:
- Ventas
Utilizando el Excel obtenemos los siguientes datos.
Estadísticas de la Regresión
Coeficiente de correlación múltiple
0.92092
Coeficiente de determinación R2
0.84810
R2 ajustado
0.69619
Error típico
54887.83156
Observaciones
5
De aquí se puede decir:
- De acuerdo al valor del coeficiente de correlación múltiple, podemos afirmar que la variable X1 (Gastos de Publicidad) y X2 (Comisión de vendedores) se encuentran asociadas en forma directa de una manera muy fuerte con la variable dependiente Ventas, en un 92%.
- De acuerdo al Coeficiente de determinación R2, podemos decir que el 85% de las ventas pueden ser explicadas por los gastos de publicidad y las comisiones de los vendedores.
A N Á L I S I S D E V A R I A N Z A
Grados de libertad
Suma de cuadrados
Prom. de los cuadrados
F
Valor crítico de F
Regresión
2
33640459893
16820229947
5.5832
0.15190282
Residuos
2
6025348107
3012674053
Total
4
39665808000
Coeficientes
Error típico
Estadístico t
Probab.
Inf. 95%
Sup. 95%
Inferior 95.0%
Sup. 95.0%
Intercepción
-289315.16
242459.39
-1.193
0.35513
-1332534.446
753904.118
-1332534.446
753904.118
GSTOS DE PUBLICID.
1123.49
336.22
3.342
0.07908
-323.1275965
2570.108
-323.128
2570.108
COM. DE VENDED.
-2.27
6.55
-0.346
0.76245
-30.45400257
25.922
-30.454
25.922
De aquí se desprende la ecuación de regresión múltiple:
Y = - 289315 + 1123 X1 - 2.27 X2
Prueba Global: Verificación de la validez del modelo de regresión Múltiple.
Formulación de Hipótesis:
Hp: B1 = B2 = 0
Ha: B1 B2 0
Si se acepta la hipótesis planteada, significa que ninguno de los factores (X1,X2) son relevantes para explicar los cambios en Y.
De acuerdo a la tabla de análisis de la varianza F calculado es 5.58 y el p-valor es 0.15, de lo cual podemos decir que La hipótesis planteada se rechaza y se acepta la hipótesis alternativa, por que el F calculado es mayor que el p-valor.
Hasta ahora se ha demostrado que algunos, pero no necesariamente todos los coeficientes de regresión, no son iguales a cero y, por o tanto son útiles para las predicciones. El siguiente paso consiste en probar individualmente las variables para determinar cuales coeficientes de regresión pueden ser cero y cuales no.
Del análisis mediante Excell tenemos el siguiente cuadro.
VENTAS VS GASTOS DE PUBLICIDAD
Estadísticas de la regresión
Coeficiente de correlación múltiple
0.915976333
Inferencia en el analisis de regresion:
los supuestos para elananlisis de regesion son como:
· Existen atos de medicion para a x y z
· la variable dependiente es una variable aleatoria
· para cada valor de x, existe una distribucion condicional de la que es de naturaleza normal
· la desviacion estandar de todas la distribuciones condicionales son iguales
el error de estandar de estimacion
la determinante primaria de la exactitud es el grado de dispersion de la poblacion: cuanto mas dispersa este, menor sera la exactitud de la estmacion.El grado de dispresion en la poblacion se puede estimar a partir del grado de dispersion en las observacines de la muestra con respecto a la linea de regresion calculada, utilizando la formula:
SE="(YI-YC)
N-2
EN LA CUAL:
YI= CADA VALOR DE Y
YC=VALOR DE LA LINEA DE REGRESION CORRESPONDIENTE A PARTIR DE LA ECUACION DE REGRESION
N=NUMERO DE OBSERVACIONES
DISTRIBUCIONES BIDIMENSIONALES
Cuando trabajamos en un estudio estadístico y observamos simultáneamente dos caracteres en un mismo individuo obtenemos pares de resultados, por ejemplo, al observar en una persona su edad y su peso. Los distintos valores de las modalidades que pueden adoptar estos caracteres forman un conjunto de pares, que representamos por (X, Y) y llamamos variable estadística bidimensional.
Los dos caracteres observados no tienen por qué ser de la misma clase, así nos podemos encontrar con las siguientes situaciones :
Tipos variables ( X, Y )
Ejemplo
Dos caracteres cualitativos Categórica / Categórica Sexo y color del pelo.
Dos caracteres cuantitativos Discreta / Discreta Número de hermanos y número de hijos.
Continua / Continua Perímetro craneal y perímetro torácico.
Discreta / Continua Pulsaciones y temperatura.
Uno cualitativo y otro cuantitativo Categórica / Discreta Sexo y número de libros leídos.
Categórica / Continua Color del pelo y talla.
Es decir, ahora nuestra unidad de estudio es el par (X, Y) y dos pares están repetidos cuando sus respectivos valores son iguales. Otro factor a tener en cuenta es que el número de modalidades distintas que adopta el carácter X no tiene por qué ser el mismo que el que adopta el carácter Y:
X = { x1, x2, x3, ..., xs } ; Y = { y1, y2, y3, ..., yt }
Ordenación de datos : Tablas
Parece que lo más lógico es ordenar éstos pares de datos en una tabla de doble entrada, donde tengan cabida los s valores de la variable X y los t valores de la variable Y.
Donde nij es el número de veces que aparece repetido el par (xi, yi) y que llamaremos frecuencia absoluta del par (xi, yi).
Una tabla de doble entrada también se puede expresar como una tabla simple, de forma que siempre es posible pasar de una a otra según convenga.
Las tablas simples reflejan el comportamiento de la variable estadística bidimensional (X, Y) a partir de los valores individuales que toman cada una de las variables estadísticas unidimensionales X e Y.
Observaciones
La frecuencia relativa del par (xi, yi) la denotamos por fij
La suma de las frecuencias absolutas es igual al número de pares observados (N).
La suma de las frecuencias relativas es igual a la unidad.
Representaciones gráficas
Diagramas de dispersión
Es la representación sobre unos ejes cartesianos de los distintos valores de la variable (X, Y). En el eje de abscisas representamos los valores de X y en el de ordenadas los valores de Y, de tal forma que cada par viene representado por un punto del plano X×Y.
En el caso de que las dos variables estén agrupadas en intervalos el diagrama se construye mediante casillas que tienen dentro tantos puntos como el valor de la frecuencia absoluta correspondiente a los intervalos X e Y.
Si las variables que componen el par son una discreta y otra continua se utilizan las marcas de clase, siendo un caso similar al primero.
Los diagramas de dispersión también se conocen como nube de puntos.
diagramas de frecuencias
Como en un diagrama de dispersión no puede quedar reflejado las veces que se repite un par o un intervalo, hemos de recurrir a una representación en tres dimensiones de (X, Y). Dos son para la variable bidimensional y una dimensión para expresar las frecuencias.
La figura adjunta representa los datos del ejemplo 1. La variable X toma los valores 10, 15,... y la variable Y los valores 0, 1,2,...; en el eje Z están representadas las frecuencias absolutas del par (X, Y).
Distribuciones Marginales
Si en una tabla de doble entrada tenemos en cuenta solamente la variable X y el recuento de sus frecuencias, sin que para nada intervengan los valores de la Y, esta distribución se denomina distribución marginal de la variable X ,siendo nxi el número de elementos observados cuando la variable X es xi (frecuencia marginal del valor xi ). Análogamente cuando tomamos la variable Y, sin tener en cuenta para nada los valores de X.
De las frecuencias absolutas marginales se obtienen las frecuencias relativas marginales. Y de igual forma podemos obtener las medias, varianzas y desviaciones típicas marginales.
Hola profe soy angela feliz navidad soy de la sección 001-D este es mi pequeño resumen.
Recordemos que para el caso de una variable, la varianza era un parámetro que nos mostraba cuanta variación existía entre la media un conjunto de datos. En el mismo tenor, estamos en determinar la dependencia entre dos variables por lo que una primera propuesta es construir una medida que nos permita en forma análoga tratar la “variación”.
Se define la covarianza como la variación que existe entre los datos de dos variables, expresada como:
donde son las variables para n datos que intervienen en el estudio.
En realidad la correlación es una medida sobre el grado de relación entre dos variables, sin importar cual es la causa y cual es el efecto. La dependencia de la que se habla en este sentido es la dependencia entre la varianza de las variables.
Como hemos visto el manejo de unidades adimensionales nos permiten tener un coeficiente sobre el que de forma cómoda se pueda trabajar, por lo que podemos dividir entre el producto de las desviaciones de las variables, es decir:
los valores para este coeficiente están comprendidos entre -1 y 1.
Se tiene los siguientes criterios para r
entre mas se aproxima a los valores 1 y -1 la aproximación a una correlación se considera buena. Cuando mas se aleja de 1 o de -1 y se acerca a cero se tiene menos confianza en la dependencia lineal por lo que una aproximación lineal será lo menos apropiado, sin embargo no significa que no existe dependencia, lo único que podemos decir es que la dependencia no es lineal. Un valor positivo para r indica que a medida que una variable crece la otra también lo hace, por el contrario si su valor es negativo, lo que podemos decir es que a medida que una variable crece la otra decrece.
Datos influyentes
Ejemplos de correlación
Una vez que se determina que existe dependencia lineal un aspecto sumamente relevante es el investigar las características del modelo matemático que relaciona una variable con otra, así de esta forma podemos decir, una variable puede clasificarse como
determinístico y probabilistico. El modelo determinístico, que no será abordado en este curso, esta ligado a la ecuación que regula de forma determinante el comportamiento de un fenómeno, así por ejemplo podemos determinar a partir de la obtención de una ecuación sobre el potencial de frenado en un material, que ante cambios de la longitud de onda la relación es lineal no permitirá predecir cuales serán sus valores. Ecuaciones que permiten ver como es la oposición a la corriente eléctrica, o resistencia eléctrica, al aumentar la temperatura de un metal, entre otros, es un claro indicio de una ecuación que es determinística, en ella se podrá describir como cambiara la resistencia eléctrica del material en cuestión ante el aumento de una temperatura en el material. Por otro lado, los fenómenos probabilísticos están sujetos a la modelos que aunque puedan ser descritos por una ecuación no implica que todos los valores que intervienen en el estudio puedan ser localizados en el gráfico que los representan, y por supuesto un dato mas no es garantía que sea localizado en la ecuación.
A continuación será presentado un método para localizar en un fenómeno probabilístico la mejor línea recta que describa un fenómeno. Aunque el método de mínimos cuadrados permite encontrar la mejor ecuación para un conjunto de datos obtenidos de una muestra que puede ser aleatoria el método también permite obtener la ecuación para un fenómeno determinístico, y que por supuesto, en último caso el conjunto de puntos se ubicaran sobre la ecuación.
Línea de Regresión
La regresión logística analiza datos distribuidos binomialmente de la forma
donde los números de ensayos Bernoulli ni son conocidos y las probabilidades de éxito pi son desconocidas. Un ejemplo de esta distribución es el porcentaje de semillas (pi) que germinan después de que ni son plantadas.
El modelo es entonces obtenido en base a lo que cada ensayo (valor de i) y el conjunto de variables explicativas/independientes pueda informar acerca de la probabilidad final. Estas variables explicativas pueden pensarse como un vector Xi k-dimensional y el modelo toma entonces la forma
Los logits de las probabilidades binomiales desconocidas (i.e., los logaritmos de los odds) son modeladas como una función lineal de los Xi.
Note que un elemento particular de Xi puede ser ajustado a 1 para todo i obteniéndose un intercepto en el modelo. Los parámetros desconocidos βj son usualmente estimados a través de máxima verosimilitud.
La interpretación de los estimados del parámetro βj es como los efectos aditivos en el log odds ratio para una unidad de cambio en la jésima variable explicativa. En el caso de una variable explicativa dicotómica, por ejemplo género, eβ es la estimación del odds ratio de tener el resultado para, por decir algo, hombres comparados con mujeres.
El modelo tiene una formulación equivalente dada por
Esta forma funcional es comúnmente identificada como un "perceptrón" de una capa simple or red neuronal artificial de una sola capa. Una red neuronal de una sola capa calcula una salida continua en lugar de una función por pedazos. La derivada de pi con respecto a X = x1...xk es calculada de la forma general:
donde f(X) es una función analítica en X. Con esta escogencia, la red de capa simple es idéntica al modelo de regresión logística. Esta función tiene una derivada continua, la cual permite ser usada en propagación hacia atrás. Esta función también es preferida pues su derivada es fácilmente calculable:
Extensiones [editar]Algunas extensiones del modelo existen para tratar variables dependientes multicategóricas y/o ordinales, tales como la regresión politómica. La clasificación en varias clases por regresión logística es conocida como logit multinomial. Una extensión del modelo logístico para ajustar conjuntos de variables independientes es el campo aleatorio condicional.
Ejemplo [editar]Sea p(x) la probabilidad de éxito cuando el valor de la variable predictora es x. Entonces sea
Después de algún álgebra se prueba que
donde son los odds en favor de éxito.
Si tomamos un valor de ejemplo, digamos p(50) = 2/3, entonces
Cuando x = 50, un éxito es dos veces tan probable como una falla. Es decir, se puede decir simplemente que los odds son 2$ a 1.
buen dia profesor he estado revisando la informacion y en estas vacaciones estare repasando el tema gracias
Hola Profesor espero que este muy bien, disfrutando de estas cortas vacaciones, ya tengo el material muchas gracias. un FELIZ AÑO NUEVO, JUNTO A SUS SERES QUERIDO. Y UN PROPERO AÑO 2009
Correlación, en estadística, relación entre las dos variables de una
distribución bidimensional. Se mide mediante el coeficiente de correlación, .
Si los datos de la distribución son (x1,y1), (x2,y2),…, (xn,yn), el coeficiente de correlación se obtiene mediante la fórmula:
en donde σxy es la covarianza, y σ x, σ y son las desviaciones típicas de las dos variables.
El valor del coeficiente de correlación oscila entre –1 y 1 (-1 ≤ ≤ 1). En cada caso concreto, el valor de indica el tipo de relación entre las variables x e y.
Cuando ||es próximo a 1, la correlación es fuerte, lo que significa que las variaciones de una de las variables repercuten fuertemente en la otra. Mientras que si ||es próximo a 0, la correlación es muy débil y las variables están muy poco relacionadas.
muchas gracias por el material, nos veremos en la evaluacion, que pase feliz año.
seccion I-003-D
hasta el 39 de diciembre han entrado 33 participantes queda revisar que han investigado y si han preparado la defenza con problema de aplicacion y analisis de la unidad expuestas.
feliz año profesor lino soy de la seccion 001 de administracion de desastres gracias por el material me encargare de imprimirlo para prepararme para el taller de la segunda semana de enero el 12/01/09 me imagino que esta es la primera actividad asistida que tenga un feliz dia
buenas tardes profe un feliz año nuevo para usted y su familia espero que alla disfrutado del festin que guarda las navidades y el fin de año.
esta es mi investigacion del tema que discutiremos en clase la segunda semana de este mes.
La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muéstrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos
Los datos necesarios para análisis de regresión y correlación provienen de observaciones de variables relacionadas.
Regresión lineal
La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación matemática lineal que describe la reacción entre dos variables.
La regresión puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo.
La finalidad de una ecuación de regresión seria estimar los valores de una variable con base en los valores conocidos de la otra.
Otra forma de emplear una ecuación de regresión es para explicar los valores de una variable en término de otra. Es decir se puede intuir una relación de causa y efecto entre dos variables. El análisis de regresión únicamente indica qué relación matemática podría haber, de existir una. Ni con regresión ni con la correlación se pude establecer si una variable tiene “causa “ciertos valores de otra variable.
Ecuación Lineal
Dos características importantes de una ecuación lineal
• la independencia de la recta
• la localización de la recta en algún punto. Una ecuación lineal tiene la forma
y = a + bx
En la que a y b son valores que se determina a partir de los datos de la muestra; a indica la altura de la recta en x= 0, y b señala su pendiente. La variable y es la que se habrá de predecir, y x es la variable predictora.
Determinación de la ecuación matemática
En la regresión, los valores de y son predichos a partir de valores de x dados o conocidos. La variable y recibe le nombre variable dependiente y la variable x, el de variable independiente.
Métodos de mínimos cuadrados
EL procedimiento mas utilizado por adaptar una recta aun conjunto de punto se le que conoce como método de mínimos cuadrados. La recta resultante presenta 2 característica importantes
• es nula la suma desviaciones verticales en los puntos a partir de la recta
• es mínima la suma de los cuadrados de dicha desviaciones
sobre este tema hay mucho que discutir estos puntos son algunos de ellos.
Buen día profe “Feliz Año 2009”
La relación y la correlación el tema de la primera semana de enero
Para comenzar quisiera hacer énfasis que la una depende de la otra un ejemplo bastante concreto de esta relación entre ambas seria que el peso de un hombre adulto dependerá de la altura que el mismo tenga
en estadística el calculo maestral seria el evento a estudiar del denotaremos dos variables para saber cual es la relación entre ambas
Si todos los valores de las variables cumplen exactamente una relación exacta, entonces se dice que las variables están perfectamente correlacionadas o que hay una correlación perfecta entre ellas
Cuando se trata de dos variables solamente, se habla de correlación simple y cuando se trata de más de dos variables se habla de correlación múltiple.
Regresión simple o lineal esta nos sirve para para estudiar datos semejante donde las variable miden exactamente lo mismo o para estudiar las causas y efectos este tipo de ecuiasion describe una línea recta
Regresión y Correlación
La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muestrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos
Los datos necesarios para análisis de regresión y correlación provienen de observaciones de variables relacionadas.
Regresión lineal
La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación matemática lineal que describe la reacción entre dos variables.
La regresión puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo.
La finalidad de una ecuación de regresión seria estimar los valores de una variable con base en los valores conocidos de la otra.
Otra forma de emplear una ecuación de regresión es para explicar los valores de una variable en término de otra. Es decir se puede intuir una relación de causa y efecto entre dos variables. El análisis de regresión únicamente indica qué relación matemática podría haber, de existir una. Ni con regresión ni con la correlación se pude establecer si una variable tiene “causa “ciertos valores de otra variable.
Ecuación Lineal
Dos características importantes de una ecuación lineal
• la independencia de la recta
• la localización de la recta en algún punto. Una ecuación lineal tiene la forma
y = a + bx
En la que a y b son valores que se determina a partir de los datos de la muestra; a indica la altura de la recta en x= 0, y b señala su pendiente. La variable y es la que se habrá de predecir, y x es la variable predictora.
Determinación de la ecuación matemática
En la regresión, los valores de y son predichos a partir de valores de x dados o conocidos. La variable y recibe le nombre variable dependiente y la variable x, el de variable independiente.
Métodos de mínimos cuadrados
EL procedimiento mas utilizado por adaptar una recta aun conjunto de punto se le que conoce como método de mínimos cuadrados. La recta resultante presenta 2 característica importantes
• es nula la suma desviaciones verticales en los puntos a partir de la recta
• es mínima la suma de los cuadrados de dicha desviaciones
(yi - yc)2
En el cual
Yi = valor esperado de y
Yc= valor calculado de y utilizando la ecuación de mínimos cuadrados con el valor correspondientes x para yi
Los valores de a y b para la recta es Yc = a + bx que minimiza la suma de los cuadrados de la desviación “ecuaciones normales “
y = na + (x)
xy= a (x) +b (x2)
En las que n es el numero de pares de observaciones. Evaluando las cantidades x, y, etc. Se puede resolver estas dos ecuaciones simultáneamente para determinar a b. la ecuaciones puede despejarse. Se obtuvieron dos formulas aun para a y otra para b.
n(xy)- (x)(y)
b=
n(x2)-(x)2
y - b x
a=
n
Inferencia en el análisis de regresión
Los supuestos para el análisis de regresión son como:
• Existen datos de medición para a x y z.
• la variable dependiente es una variable aleatoria.
• para cada valor de x, existe una distribución condicional de la qué es de naturaleza normal
• la desviación estándar de toda las distribuciones condicionales son iguales
EL error estándar de estimación
La determinante primaria de la exactitud es el grado de dispersión de la población: cuanto mas dispersa este, menor será la exactitud de la estimación. El grado de dispersión en la población se puede estimar a partir del grado de dispersión en las observaciones de la muestra con respecto a la línea de regresión calculada, utilizando la formula.
Se = " (yi -yc)
n-2
en la cual:
yi = cada valor de y
yc = valor de línea de regresión correspondiente a partir de la ecuación de regresión.
n = números de observaciones.
La formula anterior no se utiliza por lo general para cálculos reales, es mas fácil trabajar con la formula simplificada
Se " y2 - a y - b xy
n - 2
Inferencia de acerca de la pendiente de una línea de regresión
Aun cuando es muy poca o nula relación entre dos variables de aun población, es posible obtener valores maestrales que hacen que parezca que la variables están relacionadas, es importantes probar los resultados tales de caculo, a fin determinar si son significativos (es decir si los parámetros verdaderos no son cero), Si no existe ninguna relación se esperaría obtener aun pendiente cero, se pone a prueba la hipótesis nula contra la hipótesis alternativa.
La significación del coeficiente de regresión se puede probar comparándolo con su desviación estándar
t = valor de la muestra - valor esperado
Desviación estándar
Análisis de regresión lineal múltiple
La regresión múltiple comprende tres o más variables. Existe solo una variable dependiente, pero hay dos o mas tipo independiente. Esta operación al desarrollo de una ecuación que se pede utilizar para predecir valore de y, respecto a valores dados de la diferencia variables independientes adicionales es incrementar la capacidad predicativa sobre la de la regresión lineal simple.
Las técnicas de los mínimos cuadrados se utilizan para obtener ecuaciones de regresión.
Yc= a +b1x1+b2x2+…bkxk
a = ordenada en el origen
b1= pendiente
k = numero de variables independientes
Un análisis de regresión simple de dos variable da lugar a la ecuación de una recta, un problema de tres variables produce un plano, y un problema de k variables implica un hiperplano de a
(k +1) dimensiones.
Análisis de Correlación
EL objetivo de un estudio de correlación es determinar la consistencia de una relación entre observaciones por partes. EL termino “correlación “significa relación mutua, ye que indica el grado en el que los valores de una variable se relacionan con los valores de otra. Se considera tres técnicas de correlación uno para datos de medición, otro para datos jerarquizados y el último para clasificaciones nominales.
Datos Continuos: r de Pearson
EL grado de relación entre dos variables continuas se resume mediante un coeficiente de correlación que se conoce como “r de Pearson “en honor del gran matemático Kart Pearson, quien ideo este método. Esta técnica es valida mientras si es posible establecer ciertos supuestos bastante estrictos. Tales supuestos son los siguientes:
• Tanto x como y son variables continuas aleatorias. Es decir, a diferencia del análisis de referencia de regresión, no es aceptable seleccionar ciertos valores de x, y después medir y; tanto y como x deben de variar libremente.
• La distribución conjunta de frecuencia es normal. Esto recibe el nombre de de distribución normal divariada.
Carácter de r
El coeficiente de relación presenta dos propiedades que establecen la naturaleza de una relación entre dos variables. Una es su signo (+ o -) y la otra, es su magnitud. El signo es igual al de la pendiente de una recta que podría “ajustarse” a los datos si estos se graficaran en un diagrama de dispersión, y la magnitud de r indica cuan cerca esta de la “recta” tales puntos.
Método practicar para calcular r
Dado que los cálculos necesarios pueden requerir mucho tiempo especialmente cuando se resta las medias del grupo de cada observación se elevan a cuadrado esas diferencias. Existe una versión, la cual simplifica los cálculos:
r= n ("xy)-("x)("y) _
"n("x2)-("x)2 •"n("y2)("y)2
Existen 3 formas posibles para obtener el valor de r en el caso de datos de medición: estandarizar cada conjunto y hallar el producto medio, calcular el coeficiente de determinación r2 y obtener su raíz cuadrada como utilizar la formula. Para un conjunto de datos los tres métodos producirán el mismo valor para r no obstante cada método agrega algo a la comprensión del significado del termino “correlación”
Inferencia acerca del coeficiente de correlación
Intervalo de confianza para la correlación de la población
El valor del coeficiente de correlación de la muestra se puede utilizar como un estimado de la correlación verdadera de población existen varios métodos para obtener un método de confianza para pero quizás la forma mas directa es usar un diagrama.
Si se examinan el diagrama se observara que el intervalo de los valores potenciales (no conocidos) se indica a lo largo de la escala vertical los posibles valores r de la muestra se indica en la escala inferior una serie de curvas representan tamaño de muestras seleccionadas.
Prueba de significación de r
Puede ser necesario evaluar una aseveración con respecto al valor de . La forma mas sencilla es obtener un intervalo de confianza para r y observar si el valor propuesto esta incluido en el intervalo de ser así se rechaza a Ho y se acepta la alternativa.
Datos jerarquizados de: r Spearman
Es una técnica no paramétrica que utiliza para medir la fuerza de una relación por pares de 2 variables cuando los datos se encuentran en forma jerarquizados. El objeto de calcular un coeficiente de correlación estos ejemplos es determinar el grado en el que dos conjuntos de jerarquización concuerdan o no. Esta técnica también se puede extender a calificaciones u otro tipo de medición si estas se convierten a rangos.
Las medidas de l grado de concordancia son sol cuadrados de las diferencias entre los dos conjuntos de rangos: si la suma de éstos es pequeña, esto significa que hay acuerdo; si la suma es grande, esto indica lo contrario. EL calculo real de la correlación comprende la formula.
rsp = 1 - 6"d2
n(n2 -1)
En la cual n es el número de observaciones y "d2 es la suma de los cuadrados de la diferencia entre los rangos. El coeficiente de correlación de jerarquía obtenido recibe el nombre de r Spearman. La suma de la diferencia es cero. Esto no sirve como una comprobación útil de los cálculos aunque no es necesaria en la fórmula.
El procedimiento es como el siguiente:
• Obtener la diferencia en rango para cada par de observaciones
• Como comprobaciones, verificar que la diferencias se sumen a 0
• elevar el cuadrado la diferencias
• sumar los cuadrados de la diferencia para obtener "d2
• Calcular rsp
Si el valor rsp es pequeño para situaciones en donde n es mayor que 10, la hipótesis nula de rsp = 0 puede ser probada utilizándola la fórmula
rsp - 0
t=
"(1- rsp 2) (n -2)
Datos nominales: el coeficiente de contingencia
Cuando ambas variables se miden en escalas nominales ( es decir , categorías ) , el análisis es fácilmente mediante el desarrollo de una tabla de contingencia semejante a la que se utilizo en el análisis de k proporciones ( prueba de ji cuadrada ), el procedimiento en realidad de aun extensión del análisis de una tabla r * k.
Una medida de relación es calcular el coeficiente de contingencia en C, donde
x2
C=
X2 + N
Un aspecto interesante de una tabla ji cuadrada es que l tamaño máximo posible de x2 es función de N, de las observaciones y del tamaño de la tabla.
En le caso de tabla con los valores cuadrado, esto lleva obtener un valor máximo de C de
K - 1
C max =
k
En el cual k es el número de fila o columnas. La comprar C con C max se pude obtener una idea de la intensidad de la asociación entre la variables.
Esta es una relación moderada, no muy intensa. Su interpretación exacta en parte de la naturaleza de los datos y de los resultados comparables que se obtengan de otros estudios, por lo que es difícil establecer valores definitivos dé intensidades.
Se bebe observar que la formula no fórmula no produce automáticamente el signo del coeficiente de contingencia. DE ahí que no siempre resulte evidente el existe aun relación positiva o negativa.
Ventajas:
• Nos e requiere de supuestos con respectos a la formula de población
• Solamente se necesita una medición nominal ( categorías)
Limitaciones
• El limite superior de C es menor que 1.00 incluso Para un correlación perfecta.
• El límite superior depende del tamaño de la tabla, por lo que no son comparables los coeficientes de contingencia de tablas de tamaño diferente
• El coeficiente de contingencia no es directamente comprable con otras medidas de correlación, como la r de Pearson y la r de Spearman, o incluso con otras tablas de contingencia de tamaño diferente.
• Cada casilla deberá tener una frecuencia esperada por lo menos 5.
• C max solamente se puede calcular a partir de tabla de valores al cuadrado
El análisis de la correlación produce un numero que nos muestra el grado de las variable encambio el análisis de la regresión da lugar a una ecuación matemática para obtener estos datos necesarios en el análisis de la regresión y la correlación es necesario la observación de las variables relacionadas en la regresión los valores de y son predichos a partir de los valores de x y del variable independiente
El análisis de regresión es un conjunto de métodos estadísticos para la formulación matemática de modelos de relaciones entre variables, las cuales pueden ser usados para predecir o hacer inferencias estadísticas. El análisis de regresión tiene los siguientes usos, el primero es obtener los estimadores de los parámetros, estimar la varianza del error, obtener los errores estandares de los parámetros estimados, probar las hipótesis sobre los parámetros, calculo de valores estimados basados en la ecuación estimada, estimar el ajuste o la falta de ajuste del modelo.
Buenas Noche profe soy la alunma melayda jimenez de la seccion 0003 revise el material que dejo lo analizare para estar preparada para la proxima samana....que tenga buenas noche
Buenas noches prof Lino Chavez espero este bien, este es mi analisis de
Regresión y Correlación es el conjunto de tecnicas estadisticas empleado para medir la intensidad de la asociación entre dos variables. Consiste en determinar que tan intensa es la relación entre dos variables. Normalmente, el primer paso es mostrar los datos en un diagrama de dispersión. Diagrama de dispersión: es aquel grafico que representa la relación entre dos variables. Bariable dependiente: es la variable que se predice o calcula. Cuya representación es Y . Variable independiente: es la variable que proporciona las bases para el calculo. Cuya representación es: X1,X2,X3.......
buenas tardes profesor lino estube revisando su pagina y observe el material dejado en la mismo.
resumen
La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muéstrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación
profesor nos vemos en clase que siga pasando feliz dia
feliz año profesor gracias por el material publicado.
feliz año profesor espero ... aqui esta mi analisis de la regrecion y correlacion ...
La Regresión Y La Correlación
La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación. En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muestrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
Regresión lineal
La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación matemática lineal que describe la reacción entre dos variables.
La regresión puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo. La finalidad de una ecuación de regresión seria estimar los valores de una variable con base en los valores conocidos de la otra.
Ecuación Lineal
Dos características importantes de una ecuación lineal
• la independencia de la recta
• la localización de la recta en algún punto. Una ecuación lineal tiene la forma
y = a + bx
En la que a y b son valores que se determina a partir de los datos de la muestra; a indica la altura de la recta en x= 0, y b señala su pendiente. La variable y es la que se habrá de predecir, y x es la variable predictora.
EL error estándar de estimación
La determinante primaria de la exactitud es el grado de dispersión de la población: cuanto mas dispersa este, menor será la exactitud de la estimación. El grado de dispersión en la población se puede estimar a partir del grado de dispersión en las observaciones de la muestra con respecto a la línea de regresión calculada, utilizando la formula.
Se = " (yi -yc)
n-2
en la cual:
yi = cada valor de y
yc = valor de línea de regresión correspondiente a partir de la ecuación de regresión.
n = números de observaciones.
La formula anterior no se utiliza por lo general para cálculos reales, es mas fácil trabajar con la formula simplificada
Se " y2 - a y - b xy
n - 2
Inferencia de acerca de la pendiente de una línea de regresión
Aun cuando es muy poca o nula relación entre dos variables de aun población, es posible obtener valores maestrales que hacen que parezca que la variables están relacionadas, es importantes probar los resultados tales de caculo, a fin determinar si son significativos (es decir si los parámetros verdaderos no son cero), Si no existe ninguna relación se esperaría obtener aun pendiente cero, se pone a prueba la hipótesis nula contra la hipótesis alternativa.
Análisis de Correlación
EL objetivo de un estudio de correlación es determinar la consistencia de una relación entre observaciones por partes. EL termino “correlación “significa relación mutua, ye que indica el grado en el que los valores de una variable se relacionan con los valores de otra. Se considera tres técnicas de correlación uno para datos de medición, otro para datos jerarquizados y el último para clasificaciones nominales
Regresión y Correlación
La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muestrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos
Los datos necesarios para análisis de regresión y correlación provienen de observaciones de variables relacionadas.
Regresión lineal
La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación matemática lineal que describe la reacción entre dos variables.
La regresión puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo.
La finalidad de una ecuación de regresión seria estimar los valores de una variable con base en los valores conocidos de la otra.
Otra forma de emplear una ecuación de regresión es para explicar los valores de una variable en término de otra. Es decir se puede intuir una relación de causa y efecto entre dos variables. El análisis de regresión únicamente indica qué relación matemática podría haber, de existir una. Ni con regresión ni con la correlación se pude establecer si una variable tiene “causa “ciertos valores de otra variable.
Ecuación Lineal
Dos características importantes de una ecuación lineal
la independencia de la recta
la localización de la recta en algún punto. Una ecuación lineal tiene la forma
y = a + bx
En la que a y b son valores que se determina a partir de los datos de la muestra; a indica la altura de la recta en x= 0, y b señala su pendiente. La variable y es la que se habrá de predecir, y x es la variable predictora.
Determinación de la ecuación matemática
En la regresión, los valores de y son predichos a partir de valores de x dados o conocidos. La variable y recibe le nombre variable dependiente y la variable x, el de variable independiente.
Métodos de mínimos cuadrados
EL procedimiento mas utilizado por adaptar una recta aun conjunto de punto se le que conoce como método de mínimos cuadrados. La recta resultante presenta 2 característica importantes
es nula la suma desviaciones verticales en los puntos a partir de la recta
es mínima la suma de los cuadrados de dicha desviaciones
(yi - yc)2
En el cual
Yi = valor esperado de y
Yc= valor calculado de y utilizando la ecuación de mínimos cuadrados con el valor correspondientes x para yi
Los valores de a y b para la recta es Yc = a + bx que minimiza la suma de los cuadrados de la desviación “ecuaciones normales “
y = na + (x)
xy= a (x) +b (x2)
En las que n es el numero de pares de observaciones. Evaluando las cantidades x, y, etc. Se puede resolver estas dos ecuaciones simultáneamente para determinar a b. la ecuaciones puede despejarse. Se obtuvieron dos formulas aun para a y otra para b.
n(xy)- (x)(y)
b=
n(x2)-(x)2
y - b x
a=
n
Inferencia en el análisis de regresión
Los supuestos para el análisis de regresión son como:
Existen datos de medición para a x y z.
la variable dependiente es una variable aleatoria.
para cada valor de x, existe una distribución condicional de la qué es de naturaleza normal
la desviación estándar de toda las distribuciones condicionales son iguales
EL error estándar de estimación
La determinante primaria de la exactitud es el grado de dispersión de la población: cuanto mas dispersa este, menor será la exactitud de la estimación. El grado de dispersión en la población se puede estimar a partir del grado de dispersión en las observaciones de la muestra con respecto a la línea de regresión calculada, utilizando la formula.
Se = " (yi -yc)
n-2
en la cual:
yi = cada valor de y
yc = valor de línea de regresión correspondiente a partir de la ecuación de regresión.
n = números de observaciones.
La formula anterior no se utiliza por lo general para cálculos reales, es mas fácil trabajar con la formula simplificada
Se "y2 - a y - b xy
n - 2
Inferencia de acerca de la pendiente de una línea de regresión
Aun cuando es muy poca o nula relación entre dos variables de aun población, es posible obtener valores maestrales que hacen que parezca que la variables están relacionadas, es importantes probar los resultados tales de caculo, a fin determinar si son significativos (es decir si los parámetros verdaderos no son cero), Si no existe ninguna relación se esperaría obtener aun pendiente cero, se pone a prueba la hipótesis nula contra la hipótesis alternativa.
La significación del coeficiente de regresión se puede probar comparándolo con su desviación estándar
t = valor de la muestra - valor esperado
Desviación estándar
Análisis de regresión lineal múltiple
La regresión múltiple comprende tres o más variables. Existe solo una variable dependiente, pero hay dos o mas tipo independiente. Esta operación al desarrollo de una ecuación que se pede utilizar para predecir valore de y, respecto a valores dados de la diferencia variables independientes adicionales es incrementar la capacidad predicativa sobre la de la regresión lineal simple.
Las técnicas de los mínimos cuadrados se utilizan para obtener ecuaciones de regresión.
Yc= a +b1x1+b2x2+…bkxk
a = ordenada en el origen
b1= pendiente
k = numero de variables independientes
Un análisis de regresión simple de dos variable da lugar a la ecuación de una recta, un problema de tres variables produce un plano, y un problema de k variables implica un hiperplano de a
(k +1) dimensiones.
Análisis de Correlación
EL objetivo de un estudio de correlación es determinar la consistencia de una relación entre observaciones por partes. EL termino “correlación “significa relación mutua, ye que indica el grado en el que los valores de una variable se relacionan con los valores de otra. Se considera tres técnicas de correlación uno para datos de medición, otro para datos jerarquizados y el último para clasificaciones nominales.
Datos Continuos: r de Pearson
EL grado de relación entre dos variables continuas se resume mediante un coeficiente de correlación que se conoce como “r de Pearson “en honor del gran matemático Kart Pearson, quien ideo este método. Esta técnica es valida mientras si es posible establecer ciertos supuestos bastante estrictos. Tales supuestos son los siguientes:
Tanto x como y son variables continuas aleatorias. Es decir, a diferencia del análisis de referencia de regresión, no es aceptable seleccionar ciertos valores de x, y después medir y; tanto y como x deben de variar libremente.
La distribución conjunta de frecuencia es normal. Esto recibe el nombre de de distribución normal divariada.
Carácter de r
El coeficiente de relación presenta dos propiedades que establecen la naturaleza de una relación entre dos variables. Una es su signo (+ o -) y la otra, es su magnitud. El signo es igual al de la pendiente de una recta que podría “ajustarse” a los datos si estos se graficaran en un diagrama de dispersión, y la magnitud de r indica cuan cerca esta de la “recta” tales puntos.
La regresión y la correlación son dos técnicas estrechamente relacionadas y muchas veces son confundidas.
- el análisis de correlación y regresión comprende el análisis de los datos de una muestra dada,esto para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables.
-el análisis de regresión con una formula o ecuacion matemática busca describir dicha relación.
El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación.
La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos
Los datos necesarios para análisis de regresión y correlación provienen de observaciones de variables relacionadas.
ANDRI RODRIGUEZ SECCION 001DE ADM DE DESASTRE
REGRECION Y CORRELACION
La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muestrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos
Los datos necesarios para análisis de regresión y correlación provienen de observaciones de variables relacionadas.
Regresión lineal
La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación matemática lineal que describe la reacción entre dos variables.
La regresión puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo.
La finalidad de una ecuación de regresión seria estimar los valores de una variable con base en los valores conocidos de la otra.
Otra forma de emplear una ecuación de regresión es para explicar los valores de una variable en término de otra. Es decir se puede intuir una relación de causa y efecto entre dos variables. El análisis de regresión únicamente indica qué relación matemática podría haber, de existir una. Ni con regresión ni con la correlación se pude establecer si una variable tiene “causa “ciertos valores de otra variable.
Ecuación Lineal
Dos características importantes de una ecuación lineal
la independencia de la recta
la localización de la recta en algún punto. Una ecuación lineal tiene la forma
y = a + bx
En la que a y b son valores que se determina a partir de los datos de la muestra; a indica la altura de la recta en x= 0, y b señala su pendiente. La variable y es la que se habrá de predecir, y x es la variable predictora.
Determinación de la ecuación matemática
En la regresión, los valores de y son predichos a partir de valores de x dados o conocidos. La variable y recibe le nombre variable dependiente y la variable x, el de variable independiente.
Métodos de mínimos cuadrados
EL procedimiento mas utilizado por adaptar una recta aun conjunto de punto se le que conoce como método de mínimos cuadrados. La recta resultante presenta 2 característica importantes
es nula la suma desviaciones verticales en los puntos a partir de la recta
es mínima la suma de los cuadrados de dicha desviaciones
(yi - yc)2
En el cual
Yi = valor esperado de y
Yc= valor calculado de y utilizando la ecuación de mínimos cuadrados con el valor correspondientes x para yi
Los valores de a y b para la recta es Yc = a + bx que minimiza la suma de los cuadrados de la desviación “ecuaciones normales “
y = na + (x)
xy= a (x) +b (x2)
En las que n es el numero de pares de observaciones. Evaluando las cantidades x, y, etc. Se puede resolver estas dos ecuaciones simultáneamente para determinar a b. la ecuaciones puede despejarse. Se obtuvieron dos formulas aun para a y otra para b.
n(xy)- (x)(y)
b=
n(x2)-(x)2
y - b x
a=
n
Inferencia en el análisis de regresión
Los supuestos para el análisis de regresión son como:
Existen datos de medición para a x y z.
la variable dependiente es una variable aleatoria.
para cada valor de x, existe una distribución condicional de la qué es de naturaleza normal
la desviación estándar de toda las distribuciones condicionales son iguales
EL error estándar de estimación
La determinante primaria de la exactitud es el grado de dispersión de la población: cuanto mas dispersa este, menor será la exactitud de la estimación. El grado de dispersión en la población se puede estimar a partir del grado de dispersión en las observaciones de la muestra con respecto a la línea de regresión calculada, utilizando la formula.
Se = " (yi -yc)
n-2
en la cual:
yi = cada valor de y
yc = valor de línea de regresión correspondiente a partir de la ecuación de regresión.
n = números de observaciones.
La formula anterior no se utiliza por lo general para cálculos reales, es mas fácil trabajar con la formula simplificada
Se "y2 - a y - b xy
n - 2
Inferencia de acerca de la pendiente de una línea de regresión
Aun cuando es muy poca o nula relación entre dos variables de aun población, es posible obtener valores maestrales que hacen que parezca que la variables están relacionadas, es importantes probar los resultados tales de caculo, a fin determinar si son significativos (es decir si los parámetros verdaderos no son cero), Si no existe ninguna relación se esperaría obtener aun pendiente cero, se pone a prueba la hipótesis nula contra la hipótesis alternativa.
La significación del coeficiente de regresión se puede probar comparándolo con su desviación estándar
t = valor de la muestra - valor esperado
Desviación estándar
Análisis de regresión lineal múltiple
La regresión múltiple comprende tres o más variables. Existe solo una variable dependiente, pero hay dos o mas tipo independiente. Esta operación al desarrollo de una ecuación que se pede utilizar para predecir valore de y, respecto a valores dados de la diferencia variables independientes adicionales es incrementar la capacidad predicativa sobre la de la regresión lineal simple.
Las técnicas de los mínimos cuadrados se utilizan para obtener ecuaciones de regresión.
Yc= a +b1x1+b2x2+…bkxk
a = ordenada en el origen
b1= pendiente
k = numero de variables independientes
Un análisis de regresión simple de dos variable da lugar a la ecuación de una recta, un problema de tres variables produce un plano, y un problema de k variables implica un hiperplano de a
(k +1) dimensiones.
Análisis de Correlación
EL objetivo de un estudio de correlación es determinar la consistencia de una relación entre observaciones por partes. EL termino “correlación “significa relación mutua, ye que indica el grado en el que los valores de una variable se relacionan con los valores de otra. Se considera tres técnicas de correlación uno para datos de medición, otro para datos jerarquizados y el último para clasificaciones nominales.
Datos Continuos: r de Pearson
EL grado de relación entre dos variables continuas se resume mediante un coeficiente de correlación que se conoce como “r de Pearson “en honor del gran matemático Kart Pearson, quien ideo este método. Esta técnica es valida mientras si es posible establecer ciertos supuestos bastante estrictos. Tales supuestos son los siguientes:
Tanto x como y son variables continuas aleatorias. Es decir, a diferencia del análisis de referencia de regresión, no es aceptable seleccionar ciertos valores de x, y después medir y; tanto y como x deben de variar libremente.
La distribución conjunta de frecuencia es normal. Esto recibe el nombre de de distribución normal divariada.
Carácter de r
El coeficiente de relación presenta dos propiedades que establecen la naturaleza de una relación entre dos variables. Una es su signo (+ o -) y la otra, es su magnitud. El signo es igual al de la pendiente de una recta que podría “ajustarse” a los datos si estos se graficaran en un diagrama de dispersión, y la magnitud de r indica cuan cerca esta de la “recta” tales puntos.
Buenas Tardes prof, ya revise el material que nos facilito por este medio,, muy excelente la informacion... El lunes no asisti a su clase por motivos de salud.. Le deseo un feliz dia...
hola prof ruenos diazs espero este bien nos vemos el proximo martes feliz fin de semana...
La Regresión Y La Correlación
La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación. En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muestrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
Regresión lineal
La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación matemática lineal que describe la reacción entre dos variables.
La regresión puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo. La finalidad de una ecuación de regresión seria estimar los valores de una variable con base en los valores conocidos de la otra.
Ecuación Lineal
Dos características importantes de una ecuación lineal
• la independencia de la recta
• la localización de la recta en algún punto. Una ecuación lineal tiene la forma
y = a + bx
En la que a y b son valores que se determina a partir de los datos de la muestra; a indica la altura de la recta en x= 0, y b señala su pendiente. La variable y es la que se habrá de predecir, y x es la variable predictora.
EL error estándar de estimación
La determinante primaria de la exactitud es el grado de dispersión de la población: cuanto mas dispersa este, menor será la exactitud de la estimación. El grado de dispersión en la población se puede estimar a partir del grado de dispersión en las observaciones de la muestra con respecto a la línea de regresión calculada, utilizando la formula.
Se = " (yi -yc)
n-2
en la cual:
yi = cada valor de y
yc = valor de línea de regresión correspondiente a partir de la ecuación de regresión.
n = números de observaciones.
La formula anterior no se utiliza por lo general para cálculos reales, es mas fácil trabajar con la formula simplificada
Se " y2 - a y - b xy
n - 2
Inferencia de acerca de la pendiente de una línea de regresión
Aun cuando es muy poca o nula relación entre dos variables de aun población, es posible obtener valores maestrales que hacen que parezca que la variables están relacionadas, es importantes probar los resultados tales de caculo, a fin determinar si son significativos (es decir si los parámetros verdaderos no son cero), Si no existe ninguna relación se esperaría obtener aun pendiente cero, se pone a prueba la hipótesis nula contra la hipótesis alternativa.
Análisis de Correlación
EL objetivo de un estudio de correlación es determinar la consistencia de una relación entre observaciones por partes. EL termino “correlación “significa relación mutua, ye que indica el grado en el que los valores de una variable se relacionan con los valores de otra. Se considera tres técnicas de correlación uno para datos de medición, otro para datos jerarquizados y el último para clasificaciones nominale
GRACIAS POR LA INFORMACION PUBLICADA MUY BUENA CHAO...