miércoles, 16 de julio de 2008

ESTOCASTICAS: son suceciones de variables aleatorias siendo su indice el tiempo, son observaciones tomadas a intervalos iguales, con lo cual las aplicaciones usuales corresponde a datos observados cada año, mes.es aquella cuyo valor solo puede saberse con exactitud una vez observado.

COMENTARIO: una estocastica es la que al ver su valor se puede saber con exactitud.

CONSTANTE: generalmente esta constante debe ser casi igual a cero cuando se obtienen estimaciones finales un valor grande para esta constante suele ser indicativo de problemas de condicioamiento en los datos, esto no varia en forma aleatoria alrededor de un

viernes, 13 de junio de 2008

REGRESION:consiste en predecir los valores de una variable Y conociendo los valores de otra variable X la regresion se dibuja a traves del diagrama de dispersion, tambien nos dice la influencia que tiene una sobre la otra.

CORRELACION: las correlaciones varian respecto a su fuerza y se puede ver las diferencias que hay entre si, una correlacion puede salir como positiva o negariva respecto a su direccion.

COMENTARIO.
La regresion significa volver al pasado para poder conocer que es lo que pasara en un futuro basandose en lo que anteriormente ha pasado, en la correlacion si la nube es estrecha y alargada, se representa por una línea recta, lo que indica que la relación es fuerte; si la nube de puntos tiene una tendencia elíptica o circular, la relación es débil.
En realidad la correlación es una medida sobre el grado de relación entre dos variables, sin importar cual es la causa y cual es el efecto.

GRAFICA DE SERIES DE TIEMPO
Una serie de tiempo esta dado por un conjunto de observaciones que están ordenadas en el tiempo, y que estas pueden representar el cambio de una variable ya sea de tipo económica, física, química, biológica, etc, a lo largo esa historia.
El objetivo del análisis de una serie de tiempo es el conocimiento de su patrón de comportamiento, para así poder prever su evolución en el futuro cercano, suponiendo por supuesto que las condiciones no variarán significativamente.

COMENTARIO
este metodo se puede usar en varios ambitos y sirve para darse cuenta que podemos cambiar viendo lo que ocurrio en el pasado, este metodo mide el tiempo por meses o por años, esto se usa en empresas para saber como varian sus precios y para saber otros fenomenos.

domingo, 18 de mayo de 2008

ÁREA BAJO LA CURVA

Es el área que esta entre la curva y la línea base y que contiene el 100% o todos los casos, en una distribucion normal dada.
la curva normal es una distribución de frecuencias que se obtuvo de una fórmula matemática lo cuál en estadística es un modelo teórico. sin embargo se utiliza en esta ciencia para describir distribuiciones de puntajes, para intérpretar la desviación y para hacer informe de probalidades.
Actualmente la curva se conoce como "curva de campana". la altura máxima de la curva está en la media. Es asintótica porque las colas de la curva nunca tocan la línea de base sino que se prolongan indefinidamente en uno y otro sentido.

COMENTARIO
La curva nos ayuda a saber un problema, por ejemplo si queremos saber cuántos alumnos ganaron el curso de estadistica, por medio de la curva sale la respuesta que a nosotros nos interesa saber, el área bajo la curva nos ayuda a fácilitar a resolver un problema o fénomeno, en medio de la curva colocamos la media y por medio de eso nos guiamos para poner los demas datos y allí nos damos cuenta en donde estan concentrados los datos.

diagrama de cajas






curva normal

DISTRIBUCION DE PORCENTAJE BAJO LA CURVA
el área bajo la curva es la mas exacta en estadística, que nos proporciona una respuesta de un problema, a través de la distribución de porcentajes podremos saber cuanto es el porcentaje de un problema que nos dan.
VALORES ESTANDARIZADOS
Los valores estandarizados se utiliza para saber el numero de desviaciones que hay entre un numero dado y la media, en este proceso se necesita encontrar la Z eso quiere decir que la mediala transformamos Z. el valor Z que corresponde a un valor que mide la distancia que hay entre la media y variable para medir esa distancia se hace por medio de la desviacion estándar, se utiliza la tabla para encontrar los diferentes porcentajes que corresponden a los valores de Z.
_
FORMULA: Z=X-X/S
DIAGRAMAS DE CAJAS(BOXPLOT)
Definiciones,
los diagramas de caja-bigotes son una presentación visual que describe varias características importantes, al mismo tiempo tales como la dispersión y simetría.
un diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos.
presentación visual que describe al mismo tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión, el alejamiento de la simetría y la de valores extremos (puntos atípicos) es decir valores que se alejan de una manera poco usual del resto de los datos.
COMENTARIO
Se utiliza para saber caracteristicas de datos, como cuando se alejan datos de los otros datos, en este metodo es necesario encontrar el cuartil 1, cuartil 2, y el cuartil 3 asi como tambien la media que es otro dato importante, a veces la media queda cerca de los cuartiles ya que muchos datos se encuentran en un mismo lugar.
CARACTERISTICAS DEL DIAGRAMA DE CAJAS.
1)LIMITE INFERIOR: Las opiniones por encima de este limite se consideran atipicas.
2)TERCER CUARTIL: Por debajo de este valor se encuentran como maximo 75%.
3)MEDIANA: Divide a la distribucion en dos partes iguales.
4) PRIMER CUALTIL: se encuetran como maximo el 25% de las opiniones.
5) LIMITE INFERIOR: Extremo inferior del bigote
6) VALORES ATIPICOS: Opiniones que estan apartados del cuerpo principal de datos.
7) MEDIA ARITMETICA: Es lo que tradicionalmente se conoce como promedio.
RELACION ENTRE EL DIAGRAMA DE CAJAS Y LA CURVA NORMAL
La relacion que podemos encontrar es que en las dos es necesario la media, y las dos nos proporcionan informacion acerca de los datos, en donde se encuentran, en donde se concentran mas.

jueves, 27 de marzo de 2008


estadística

es una ciencia matemática que se refiere a la recolección, estudio e interpretación de los datos obtenidos en un estudio. Es aplicable a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, ciencias de la salud como la Psicología y la Medicina, y usada en la toma de decisiones en áreas de negocios e instituciones gubernamentales.La Estadística se divide en dos ramas:La estadística descriptiva, que se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de descriptores numéricos son la media y la desviación estándar. Resúmenes gráficos incluyen varios tipos de figuras y gráficos.La inferencia estadística, que se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta lo aleatorio e incertidumbre en las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población de estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen ANOVA, series de tiempo y minería de datos.Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada.
TEOREMA DE CHEBYSHEV
la desigualdad de Chebyshev es un resultado estadístico que ofrece una cota inferior a la probabilidad de que el valor de una variable aleatoria con varianza finita esté a una cierta distancia de su esperanza matemática o de su media; equivalentemente, el teorema proporciona una cota superior a la probabilidad de que los valores caigan fuera de esa distancia respecto de la media. El teorema es aplicable incluso en distribuciones que no tienen forma de "curva de campana" y acota la cantidad de datos que están o no "en medio".El teorema de Chebyshev se aplica a cualquier tipo de datos, pero sólo nos indica “por lo menos que porcentaje” debe caer entre ciertos límites. Pero para casi todos los datos, el porcentaje real de datos que cae entre esos limites es bastante mayor que el que especifica el teorema de Chebyshev.
COMENTARIO:
El teorema de chebyshev mas que todo nos indica que porcentaje debe caer entre cada limite
y de que los valores caigan fuera de ese distancia respecto de la media.

VARIABLES ESTADÍSTICASal hacer un estudio de una determinada población, observamos una característica o propiedad de sus elementos o individuos.Por ejemplo, con los alumnos y alumnas de nuestra clase, podemos estudiar el lugar de residencia, el número de hermanos, la estatura, etc. Cada una de estas características estudiadas se llama variable estadística.Aunque este es el concepto que vamos a utilizar, también reciben el nombre de carácter estadístico.Dependiendo de la característica podemos distinguir varios tipos de variables:Variable cualitativa. Es aquella característica que no podemos expresar con números y hay que expresarla con palabras. Por ejemplo, el lugar de residencia.Variable cuantitativa. Es cualquier característica que se puede expresar con números. Por ejemplo, el número de hermanos o la estatura. Dentro de esta variable podemos distinguir dos tipos:Variable cuantitativa discreta. Es aquella variable que puede tomar únicamente un número finito de valores. Por ejemplo, el número de hermanos.
Variable cuantitativa continua. Es aquella variable que puede tomar cualquier valor dentro de un intervalo real. Por ejemplo, la estatura.Naturalmente, siempre que hacemos un estudio estadístico en una población, el número de individuos será muy pequeño o muy grande, pero siempre será un número finito. Por tanto, podríamos decir que todas las variables son discretas. Sin embargo, mientras que al estudiar el número de hermanos en un instituto de 500 alumnos y alumnas, nos vamos a encontrar entre cinco y diez valores distintos; al estudiar la estatura de todos con dos cifras decimales, nos podemos encontrar muchos más. En este último caso, aunque podamos tener 30 valores distintos, que es un número finito, hablaremos de variable continua. Esto se debe a que para trabajar con estos datos resulta mucho más fácil agruparlos en intervalos que hacerlo de forma aislada. Para hacer cálculos con una variable continua, utilizaremos el punto medio de cada intervalo, al que llamaremos marca de clase.
TIPOS DE POBLACIONPoblacion finita: es aquella que indica que es posible alcanzarse o sobreparse al contar.Poblaicon infinita: es infinita si se incluye un gran conjunto de medidas y observaciones que no pueden alcansarse en el conteo. son poblaciones infinitas porque hipoteticamente no existe limite en cuanto al numero de observaciones que cada uno de ellos puede gnerar.
MUESTRAun conjunto de medidas observaciones formadas a partir de una poblacion dada. es un subconjunto de la poblacion.muestra representativa: un subconjunto representativo seleccionado de una poblacion de la cual se obruvo.
PARAMETRO:Son las caracteristicas medibles en una poblaicon completa se le asigna un simblolo representado por una letra griega. en estadistica se llama parametro a un valor representativo de una poblacion, como la medio aritmetica, una proporcion o su desviacion tipica
ESCALA DE LIKERTConsiste en un conjunto de items presentados en forma de afirmaciones o juicios ante los cuales se pide la reaccion de los sujetos. es decir, se presenta cada afirmacion y se pide al sujeto que externe su reaccion eligiendo uno de los cinco puntos de la escala. a cada punto se le asigna un valor numerico.
COMO SE CONSTRUYE UNA ESCALA DE LIKERTEn terminos generales, una escala de likert se construye generando un elevado numero de afirmaciones que califiquen al objeto de actitud y se administran a un grupo piloto para obtener las puntuaciones del grupo en cada afirmacion. estas puntuaciones se correlacionan con las puntuaciones del grupo a toda la escala y las afirmaciones cuyas puntuaciones se correlacionen significativamente con las puntuaciones de toda la escala, se selecciona para integrar el instrumento de medicion.