domingo, 14 de junio de 2009

REGRESION LINEALSIMPLE

ANTES DE DEFINIR EL TERMINO REGRESION REVISAREMOS LA NOTACION MATEMATICA ELEMENTAL PARA DES CRIBIR LA RELACION ENTRE VARIABLES X Y Y

LA EXPRESION ES :

Y=F(X)

INDICA QUE LA VARIABLE Y ES FINCION DELA VARIABLE X. SE ENTIENDE POR FUNCION UNA REGLA QUE ASOCIA CADA POSIBLE VALOR DE X CON UN SOLO VALOR DE Y

UNA VEZ QUE SE ESPECIFICA LA NATURALEZA DE LA FUNCION, SE PUEDE CALCULAR EL VALOR DE Y PARA CUALQUIER VALOR DADO DE X. COMO LA FUNCION DESCRIBE A Y EN TERMINO DE X SE DICE QUE Y ES LA VARIABLE DEPENDIENTE Y X LA INDEPENDIENTE.

VARIABLE DEPENDIENTE=F(VARIABLE INDEPENDIENTE)

sábado, 13 de junio de 2009

DESVIACION ESTANDAR Y VARIANZA

LA DESVIASION ESTANDAR ES LA MEDIDA DE DISPERCION MAS ADECUADA POR SUS PROPIEDADES ALGEBRAICAS SE LE CONOCE TAMBIEN COMO DESVIACION TIPICA. SU SIMBOLO ES S YSE LE DEFINE ASI:

S=ALA RAIZ DE LASUMARORIA(X-X)2/N



OSEA COMO LA DESVIASION PROMEDIO DE LOS DATOS DE UNA DISTRIBUCION RESPECTO ASU MEDIA . UNA VES HALLADA EN UN CASO CONCRETO, DEBE SER EXPRESADA EN LAS MISMAS UNIDADES DE LA VARIABLE ESTUDIADA

DESVIACION MEDIA

HASTA FINES DEL SIGLO PASADO, LA DESVIACION MEDIA FUE LA MEDIDA DE DISPERSION DE MAS USO.

SU DES PLASAMIENTO DEL ARSENAL ESTADISTICO SE DEBIO ALA ESPARCION DEL CONCEPTO DE DESVIACION ESTANDAR, OTRA MEDIDA DE DISPERCION CON MEJORES PROPIEDADES ALGEBRAICAS Y QUE GENERA VALORES NUMERICOS MUY PARECIDOS A LOS QUE SE OBTIENEN CON LA DESVIACION MEDIA .

LA DESVIACION MEDIA SE DEFINE COMO LA DESVIACION PROMEDIO DE LOS VALORES ABSOLUTOS DE LAS DESVIACIONES DE LOS DATOS DE UNA VARIABLE CON RESPECTO A SU MEDIA Y SE EXPRESA EN LAS MISMAS UNIDADES DE LA VARIABLE

LA MEDIA,LA MEDIANA Y LA MODA EN VARIABLE NOMINALY ORDINAL

AL ABLAR DE LOS DIFERENTES TIPOS DE VARIABLES DIJIMOS QUE LAS NOMINALES SON SIMPLES CLASIFICADORAS PORQUE AL MEDIRLAS EN LA ESCALA ADECUADA RESULTA UNA CLASIFICASION DE LAS OBSERBACIONES EN UN CONJUNTO DE CATEGORIAS MUTUAMENTE EXCLUYENTES, QUE NO REQUIERE DE ORDEN ALGUNO PARA CONSEQUIR CLARIDAD Y COHERENCIA. AFIRMAMOS TAMBIEN QUE UNA VARIABLE ES ORDINAL PORQUE SUS CATEGORIAS GUARDAN RELACIONES DE "MAYOR QUE". LO CUAL EXIGE QUE SE LES DE EL ORDEN APROPIADO DE AMBOS TIPOS DE VARIABLES VIMOS QUE SI SE ASIGNAN NUMEROS ASU SUSCEPTIBLES DE NINGUNA OPERACIONARITMETICA PUES CARESEN DE PROPIEDADES NUMERICAS

martes, 9 de junio de 2009

DESVIACION CUARTIL

es la medida de dispercion mas usada en relecion con la mediana; algunos autores la llaman rango semiintercuantial. se le simboliza por QY se le define por la forma


Q=Q3-Q1/2


en la cual Q1yQ3 son los puntos bajos los cuales se alla el 25% y el 75% de los datos, respectibamente.

A esto se les da un nombre especifico : Q3 es el tercer cuartil y Q1 el primer cuartil por otro lado recordemos que la mediana es el punto bajo el cual se halla el 50% de los datos ; por esta razon en terminologia de cuartiles el valor mediano es el segundo cuartil cuyo simbolo es Q2

sábado, 30 de mayo de 2009

INTERPRETACION DE LA ECUACION DE REGRESION LINEAL SIMPLE

UNA ECUACION DE REGRECION LINEAL SIMPLE SIRVE PARA PREDECIR CON CIERTA APREOXIMACION LOS VALORES DE LA VARIABLE DEPENDIENTE EN FUNCION DE LOS DE LA INDEPENDIENTE.

EN OTRAS PALABLAS SIRVE PARA ESTIMAR LOS VALORES REALES DE Y.

jueves, 28 de mayo de 2009

miércoles, 20 de mayo de 2009

MEDIDAS DE DISPERSION

Una medida de tendensia central, por si sola, no describe ni rwesume adecuadamente una distribucion de datos;es nesesario acompañarla de un indicador que de cuenta del grado de heterogeneidad o dispercion con que se distribuyen los datos de la variabler. Una medida de dispersion dice cianto se desvian los datos respecto ala tendencias centrales .

Dos omas distribuciones pueden tener iguales valores de tendencia central y, no obtante mostrar grados de dispercion diferentes .

lunes, 18 de mayo de 2009

SEGUNDA PARTE DE LA MEDIA Y LA MODA EN VARIABLES

TENIENDO ENCUENTA LO ANTERIOR CONSIDERAMOS HAORA LAS MEDIDAS DE TENDENSIA CENTRAL EMPEZANDO PORLA MAS SIMPLES:LA MODA COMO ELLA DEPENDE DE LAS CLASES O CATEGORIAS DE LA VARIABLE Y NO DE LOS VALORES ABSOLUTOS DE ESTAS ES CLARO QUE PUEDE SER DETERMINADO EN VCARIABLE NOMINAL Y ORDINAL

viernes, 15 de mayo de 2009

domingo, 10 de mayo de 2009

domingo, 26 de abril de 2009

DISTRIBUCION ACUMULADAS Y POLIGONOS DE FRECUENCIAS ACUMULADAS

Ablamos con propiedad de distribucion de frecuencias acumuladas siempre y cuando las categorias de la variable se maneja sean ordenables .
En otras palabras: para variables ordinales se calculan las alturas de los datos usando el factor constante

GRAFICO DE LINEA

Es bastante util para comparar los datos de dos o mas distribuciones. Consiste en unir, por medio de segmentos de recta, los puntos de coordenadas determinados por los datos de dos variables que se corresponden o de variables que dependen del tipo.
El trazo del grafico puede o no comenzar en el eje de coordenadas; esto no tiene importancia y depende del diseño del grafico.
PROCEDIMIENTO

1.-La poblacion es funcion del tiempo. Es decir, la magnitud tiempo es la variable independiente ;se debe ubicar las unidades de tiempo en el eje horizontal y los datos

2.-Trazados los ejes de coordenadas , se marcan puntos igualmente espaciados para los años dados . Luego se midela distancia entre el origende coordenadasy el punto correspondiente al ultimo

3.-se determinan los 3/4 de la distacia anterior y se establece una relacion entre la longitud resultante y el dato mayor de la serie, que se localiza en la columna de totales.

viernes, 24 de abril de 2009

HISTOGRAMA Y POLIGONO DE FRECUENCIAS

Se da el nombre de histogramas a los graficos de barras cuando r´presentan variables cardinales, principalmente continuas.Si se unen con segmentos de recta los puntos medios de los techos de los rectangulos, resulta un poligono de frecuencias.
La construccion de un histograma es basicamente el mismo que para cualquier grafico de barras,


PROCEDIMIENTO
1.-Las siete categorias de la variablecardinal continua estan agrupadas en intervalos de amplitud constante:
2.-trazados los ejes coordenados , se procede a marcar el inicio y el termino de cada barra, habiendo fijado prebiamente su anchura.
3.-Se determinan tres cuartas partes de 10cm y con este valor (7.5cm) y la maxima frecuencia se establese una razon
4.-S calcula las alturas de las barras para todos los intervalos por via rapida

PICTOGRAMA

Es uno de los graficos que mas atrae la atencion del lector, razon por la cual se recurre a el con frecuencia.Consiste en representar, por medio de figuras, determinadas magnitudes . Su desventaja principal es que no permite comparaciones satisfactorias.
para construir se procede asi:

1.-se escoje una grafica aluciva al asunto que se describe y se le asigna un valor o unidad de medida:

2.-las cantidades menores que la unidad de medida se representa mediante un simbolo mutilado.

3.-terminado el grafico, se añade las indicaciones necesarias para su facil lectura.

GRAFICO CIRCULAR

Sele yama tambien grafico de pstel y es bastante util para representar proporciones o porsentajes.Es, de hecho, una forma alternativa al grafico de barras para representar una distribucion de variable nominal.
Se utiliza una circunferencia ,cuyo circulo se divide en sectores tales que sus medidas angulares sean proporcionales a los valores que representan .
Se obtiene al igual que para el tipo de grafico ya estudiado, mediante una regla de tres simples , se establese la relasion entre una unidad de medida y una unidad de valor.
Asi la relacion que se establese es:

360°/100%=306

la cual da el numero de grados por cada unidad porcental. consecuente, para encontrar la medida angular que corresponderia a un conjunto de frecuencias porcentuales cuya suma es 100% se multiplica cada una de estas por 3.6

CALCULO DE LA MEDIA,LA MEDIANAY LAMODA(DATOS NO AGRUPADOS)

Las diversas formas en que se pueden distribuir los datos de una variable numerica determinan los valores de sus tendencias centrales.
Para hayar, la media, no podriamos limitarnos a sumar la categoria (4,6,8,10,12) y dividir entre 5 cometeriamos un error de procedemiento inadmisible, por no tomar encuenta sus frecuencias.
En una distribucion de datos no agrupados . la media se obtiene mediante la formula:
N0=n+1-2

y se construye una distribucion de frecuencias acumuladas, ascendente o decendente.
La mediana es el dato de la variable cuya frecuencia acumulada contiene o señala su numero ordinal y la moda es el dato de mayor frecuencia .llenar primero una estructura donde todos ellos aparezcan claramente y hace posteriormente las sustituciones y lecturas que se necesitan la estructura es la siguiente.

CALCULO DE LA MEDIA,LA MEDIANAY LAMODA(DATOS AGRUPADOS)

Agrupados un conjunto de datos, surge la pregunta de como resumirlo; esdecir, como medir sus tendencias centrales.
Para hallar el promedio aritmetico se supone que todos los valores prtenecientes a una clase se localizan en su punto medio.Asi una distribucion de datos en clase se convierte en una distribucion simple de frecuencia, y por ende , la formula para calcular la media en esta ultima distribucion es valida para calcular en aquella.
x=afx/f.
X es la marca de clase o punto medio de cada intervalo ;f, su frecuencia. El primer paso sea hallar los puntos medios de cada inte0rvalo.
MEDIA,primero se identifica el intevalo donde se encuentra, la media estara en el intervalo cuya frecuencia acumulada sea inmediatamente mayor ala mitad de los datos de la distribicion tal procedimiento conduce a esta formula

Me=1+ (n/2-fd/fJ)J

Nes el total de datos de la distribucion ; y, referidos exclusivamente al intevalo donde cae la media,
L es el limite real imferior :fd, la frecuencia acumulada inmediatamente menor a la del intevalo;fj la frecuencia y J, la anchira real.