Datos personales

Mi foto
Chiclayo, Lambayeque, Peru
Estudios Profesionales en Estadistica - Pregrado y Postgrado en la Universidad Nacional Pedro Ruiz Gallo - Lambayeque. Experiencia en investigacion. Para cualquier duda o consulta sobre temas estadisticos: statconsultora@hotmail.com

jueves, 28 de octubre de 2010

Miarando de otra manera: Estadistica Pragmatica

Robert Kass afirma que las marcadas diferencias entre las corrientes bayesiana y frecuentista han socavado – más que ayudado – al aprendizaje de la ciencia estadística. El frecuentista critica al bayesiano porque realiza inferencias subjetivas al escoger la distribución a priori de los parámetros de interés; el bayesiano critica al frecuentista porque la interpretación de confianza y significación sólo tiene sentido cuando se tiene en cuenta un número grande de experimentos controlados: por ejemplo, un intervalo de confianza del 95% se interpreta como que al calcular ese mismo intervalo 100 veces en muestras aleatorias, entonces 95 intervalos contendrán al parámetro de interés.

La verdad es que en la vida real, estos conceptos bayesianos o frecuentistas son de vital importancia y han ayudado a resolver cientos de miles de problemas de investigación. Por esto, Kass afirma que los estadísticos prácticos modernos deben tener una mente abierta para apreciar el papel que juegan los supuestos teóricos y no para recitar correctamente la interpretación de un intervalo de confianza. Así que, Kass hace un llamado para entrar en una especie de filosofía moderna que él llama, pragmatismo estadístico y que se basa en los siguientes puntos:
  • Los intervalos de confianza, la significación estadística y la probabilidad a posteriori son todas herramientas inferenciales valiosas.
  • Las situaciones de azar simple pueden suplir las intuiciones básicas acerca de la probabilidad de un evento.
  • Las frecuencias de largo plazo son importantes matemáticamente, tienen sentido interpretativo y pedagógico, sin embargo, es posible la asignación de probabilidades a eventos únicos: por ejemplo, que en un intervalo de confianza esté el parámetro de interés.
  • La interpretación subjetiva de la probabilidad a posteriori es importante para entender la inferencia bayesiana, pero no es fundamental en su uso.
  • Las inferencias estadísticas de todo tipo usan modelos estadísticos que requieren supuestos: las variables aleatorias, los intervalos de confianza y las probabilidades a posteriori viven en el mundo irreal de la teoría y se usan para concluir acerca del comportamiento de los datos reales.


El profesional estadistico avezado debe tener en cuenta que el mundo real está constituido por los datos recolectados y que el mundo fantástico, muy útil y matemáticamente fundamentado pero en últimas irreal, está ligado a modelos probabilísticos de los cuales se extrae una muestra aleatoria para realizar inferencias acerca de uno o varios parámetros que definen el comportamiento estructural de un modelo supuesto. De esta manera, por ejemplo, en el mundo real se tiene acceso al promedio muestral de un conjunto de datos; en el mundo irreal, se tiene un estimador llamado, equis barra, que no denota una cantidad fija sino una variable aleatoria.

Fuente:

http://www.stat.cmu.edu/~kass/papers/bigpic.pdf

viernes, 3 de septiembre de 2010

Importancia de la Normalidad de los datos

Al iniciar el análisis estadístico de una serie de datos, y después de la etapa de detección y corrección de errores, un primer paso consiste en describir la distribución de las variables estudiadas y, en particular, de los datos numéricos. Además de las medidas descriptivas correspondientes, el comportamiento de estas variables puede explorarse gráficamente de un modo muy simple.

Una de las distribuciones teóricas mejor estudiadas en los textos de bioestadística y más utilizada en la práctica es la distribución normal, también llamada distribución gaussiana2, 3, 4, 5. Su importancia se debe fundamentalmente a la frecuencia con la que distintas variables asociadas a fenómenos naturales y cotidianos siguen, aproximadamente, esta distribución. Caracteres morfológicos (como la talla o el peso), o psicológicos (como el cociente intelectual) son ejemplos de variables de las que frecuentemente se asume que siguen una distribución normal. No obstante, y aunque algunos autores6, 7 han señalado que el comportamiento de muchos parámetros en el campo de la salud puede ser descrito mediante una distribución normal, puede resultar incluso poco frecuente encontrar variables que se ajusten a este tipo de comportamiento.

El uso extendido de la distribución normal en las aplicaciones estadísticas puede explicarse, además, por otras razones. Muchos de los procedimientos estadísticos habitualmente utilizados asumen la normalidad de los datos observados. Aunque muchas de estas técnicas no son demasiado sensibles a desviaciones de la normal y, en general, esta hipótesis puede obviarse cuando se dispone de un número suficiente de datos, resulta recomendable contrastar siempre si se puede asumir o no una distribución normal. La simple exploración visual de los datos puede sugerir la forma de su distribución. No obstante, existen otras medidas, gráficos de normalidad y contrastes de hipótesis que pueden ayudarnos a decidir, de un modo más riguroso, si la muestra de la que se dispone procede o no de una distribución normal. Cuando los datos no sean normales, podremos o bien transformarlos8 o emplear otros métodos estadísticos que no exijan este tipo de restricciones (los llamados métodos no paramétricos).

La distribución normal posee ciertas propiedades importantes que conviene destacar:

Tiene una única moda, que coincide con su media y su mediana.

La curva normal es asintótica al eje de abscisas. Por ello, cualquier valor entre y es teóricamente posible. El área total bajo la curva es, por tanto, igual a 1.

Es simétrica con respecto a su media . Según esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor.

La distancia entre la línea trazada en la media y el punto de inflexión de la curva es igual a una desviación típica . Cuanto mayor sea , más aplanada será la curva de la densidad.

El área bajo la curva comprendido entre los valores situados aproximadamente a dos desviaciones estándar de la media es igual a 0.95. En concreto, existe un 95% de posibilidades de observar un valor comprendido en el intervalo .

La forma de la campana de Gauss depende de los parámetros . La media indica la posición de la campana, de modo que para diferentes valores de la gráfica es desplazada a lo largo del eje horizontal. Por otra parte, la desviación estándar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de , más se dispersarán los datos en torno a la media y la curva será más plana. Un valor pequeño de este parámetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribución.

Como se deduce de este último apartado, no existe una única distribución normal, sino una familia de distribuciones con una forma común, diferenciadas por los valores de su media y su varianza. De entre todas ellas, la más utilizada es la distribución normal estándar, que corresponde a una distribución de media 0 y varianza 1.

martes, 13 de julio de 2010

Estadistica Bayesiana: Filtros

¿Qué son los filtros bayesianos?

Este tipo de estadísticas se utiliza en múltiples campos, tradicionalmente donde más se ha utilizado ha sido en estudios epidemiológicos, como modo de diagnosticar enfermedades de acuerdo con los síntomas observados y el historial del enfermo. Un cuadro clínico de síntomas, como el resultado de un análisis de sangre, la temperatura, vómitos etc., permite diagnosticar varias enfermedades como posibles.

Pero, si una enfermedad es hereditaria y otra es tropical, aunque el cuadro clínico responda a otras enfermedades, si el paciente tiene antecedentes familiares de la primera, o ha vuelto recientemente de un viaje a país tropical, el médico se decidirá por diagnosticar la enfermedad que corresponda en cada caso, aunque la pura probabilidad señale a una tercera enfermedad como la más probable.

Modelos matemáticos capaces de aprender


Cuando pretendemos utilizar un modelo matemático que de respuesta a problemas de este tipo, donde junto a datos mensurables y concretos hay se añade la experiencia adquirida, el método más eficaz es la estadística bayesiana. En resumen, un filtro bayesiano es una herramienta matemática que permite, retroalimentar la fórmula que calcula la probabilidad de un acontecimiento, con la experiencia adquirida anteriormente en casos similares, de modo que la formula "aprende" y cada vez da respuestas que en principio acierten con más probabilidad que en el pasado, pues el peso de cada una de las antiguas “creencias”, (o síntomas), aumenta o disminuye de acuerdo con la experiencia adquirida.


Un filtro bayesiano nunca es categórico, es decir, nunca garantiza al 100% la calidad de la respuesta, pero al incorporar la experiencia anterior, permite mejorar cada vez más la probabilidad de acertar en la respuesta. Es por ello que este tipo de estadísticas es especialmente adecuado en los casos en que solicita un pronóstico sobre la posibilidad que ocurra determinado suceso.

Usos de la estadística Bayesiana


La estadística de Bayes, resulta de particular utilidad, cuando se valora, junto a datos objetivos, la convicción personal sobre la posibilidad que ocurra o no un suceso. Por ejemplo, sería el sistema adecuado para pronosticar resultados de las quinielas a partir de aseveraciones del tipo “es muy probable que el equipo X gane al Z”, “tal árbitro es casero”, o “la lluvia perjudica al equipo A”, es decir obtener una valoración subjetiva de la probabilidad, a diferencia de la respuesta dada por una estadística puramente frecuentista, que solo devuelve conclusiones dicotómicas, correcto o falso.


En el mundo informático la estadística bayesiana se utiliza en multitud de campos; en la limpieza de ruidos en todo tipo de señales analógicas, en la elección del camino a seguir en internet por los paquetes de información, en la ponderación que hacen los buscadores de las páginas web, para reconstruir imágenes digitales a partir ficheros comprimidos con pérdida, en traducciones automáticas, etc. Su uso es amplísimo y todos los días se encuentran nuevas utilidades en campos relacionados de alguna manera con la “inteligencia artificial”, dada la posibilidad de crear procesos basados en esta estadística, con capacidad para “aprender”.

Riesgos de esta estadística


No obstante, la estadística bayesiana, incorporar inevitablemente la opinión personal del investigador, lo que puede producir, desde sesgos inadvertidos en el resultado, a resultados “matemáticos” que han sido manipulados de forma voluntaria en una dirección preestablecida. Este error no depende tanto del método empleado como de la ecuanimidad del investigador. Ello es claramente notorio en las encuestas de opinión, donde las “respuestas” obtenidas, suelen estar claramente condicionadas por la ideología de quien encarga la encuesta.


En cualquier caso, un filtro bayesiano, por su propia esencia, no puede dar resultados concluyentes, por lo que da siempre lugar a la aparición de falsos positivos y falsos negativo, o sea, hay casos en los que el filtro de Bayes fracasa, bien por marcar como correctos casos erróneos o por lo contrario. No obstante el hecho de incorporar la experiencia al resultado, consigue reducir el coeficiente de error con el paso del tiempo.

sábado, 22 de mayo de 2010

OpenOffice.org software gratuito

Dejo el enlace para trabajar el word ecxel power point, similar al office de microsoft, solo que en version gratuita.

Enlace de descarga:
http://openoffice.softonic.com/

miércoles, 5 de mayo de 2010

Las hipotesis estadisticas..

Tenemos que empezar por definir que es una hipótesis y que es prueba de hipótesis.
Hipótesis es una aseveración de una población elaborado con el propósito de poner aprueba, para verificar si la afirmación es razonable se usan datos. En el análisis estadístico se hace una aseveración, es decir, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera.
Por tanto, la prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad; se emplea para determinar si la hipótesis es una afirmación razonable.
Prueba de una hipótesis: se realiza mediante un procedimiento sistemático. Siguiendo este procedimiento sistemático, al llegar al paso cinco se puede o no rechazar la hipótesis, pero debemos de tener cuidado con esta determinación ya que en la consideración de estadística no proporciona evidencia de que algo sea verdadero. Esta prueba aporta una clase de prueba más allá de una duda razonable. Analizaremos cada paso en detalle
Objetivo de la prueba de hipótesis.
El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico (muestral), sino hacer un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del parámetro.
Procedimiento sistemático para una prueba de hipótesis de una muestra
.Paso 1: Plantear la hipótesis nula Ho y la hipótesis alternativa H1.
Cualquier investigación estadística implica la existencia de hipótesis o afirmaciones acerca de las poblaciones que se estudian. La hipótesis nula (Ho) se refiere siempre a un valor especificado del parámetro de población, no a una estadística de muestra. La letra H significa hipótesis y el subíndice cero no hay diferencia. Por lo general hay un “no” en la hipótesis nula que indica que “no hay cambio” Podemos rechazar o aceptar Ho. La hipótesis nula es una afirmación que no se rechaza a menos que los datos maestrales proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parámetro.
La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación que se acepta si los datos maestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa. Se le conoce también como la hipótesis de investigación. El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parámetro.
Paso 2: Seleccionar el nivel de significancia.
Nivel de significacia: Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota mediante la letra griega α, tambiιn es denominada como nivel de riesgo, este termino es mas adecuado ya que se corre el riesgo de rechazar la hipótesis nula, cuando en realidad es verdadera. Este nivel esta bajo el control de la persona que realiza la prueba. Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de significación indicará la probabilidad de no aceptarla, es decir, estén fuera de área de aceptación. El nivel de confianza (1-α), indica la probabilidad de aceptar la hipótesis planteada, cuando es verdadera en la población.
La distribución de muestreo de la estadística de prueba se divide en dos regiones, una región de rechazo (conocida como región crítica) y una región de no rechazo (aceptación). Si la estadística de prueba cae dentro de la región de aceptación, no se puede rechazar la hipótesis nula. La región de rechazo puede considerarse como el conjunto de valores de la estadística de prueba que no tienen posibilidad de presentarse si la hipótesis nula es verdadera. Por otro lado, estos valores no son tan improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa la región de no rechazo de la de rechazo.
Tipos de errores
Cualquiera sea la decisión tomada a partir de una prueba de hipótesis, ya sea de aceptación de la Ho o de la Ha, puede incurrirse en error: Un error tipo I se presenta si la hipótesis nula Ho es rechazada cuando es verdadera y debía ser aceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa α. Un error tipo II, se denota con la letra griega β se presenta si la hipótesis nula es aceptada cuando de hecho es falsa y debía ser rechazada.
En cualquiera de los dos casos se comete un error al tomar una decisión equivocada.
Para que cualquier ensayo de hipótesis sea bueno, debe diseñarse de forma que minimice los errores de decisión. En la práctica un tipo de error puede tener más importancia que el otro, y así se tiene a conseguir poner una limitación al error de mayor importancia. La única forma de reducir ambos tipos de errores es incrementar el tamaño de la muestra, lo cual puede ser o no ser posible. La probabilidad de cometer un error de tipo II denotada con la letra griega beta β, depende de la diferencia entre los valores supuesto y real del parámetro de la población. Como es más fácil encontrar diferencias grandes, si la diferencia entre la estadística de muestra y el correspondiente parámetro de población es grande, la probabilidad de cometer un error de tipo II, probablemente sea pequeña.
El estudio y las conclusiones que obtengamos para una población cualquiera, se habrán apoyado exclusivamente en el análisis de una parte de ésta. De la probabilidad con la que estemos dispuestos a asumir estos errores, dependerá, por ejemplo, el tamaño de la muestra requerida. Las contrastaciones se apoyan en que los datos de partida siguen una distribución normal
Existe una relación inversa entre la magnitud de los errores α y β: conforme a aumenta, β disminuye. Esto obliga a establecer con cuidado el valor de a para las pruebas estadísticas. Lo ideal sería establecer α y β.En la práctica se establece el nivel α y para disminuir el Error β se incrementa el número de observaciones en la muestra, pues así se acortan los limites de confianza respecto a la hipótesis planteada .La meta de las pruebas estadísticas es rechazar la hipótesis planteada. En otras palabras, es deseable aumentar cuando ésta es verdadera, o sea, incrementar lo que se llama poder de la prueba (1- β) La aceptación de la hipótesis planteada debe interpretarse como que la información aleatoria de la muestra disponible no permite detectar la falsedad de esta hipótesis.
Paso 3: Cálculo del valor estadístico de prueba
Valor determinado a partir de la información muestral, que se utiliza para determinar si se rechaza la hipótesis nula., existen muchos estadísticos de prueba para nuestro caso utilizaremos los estadísticos z y t. La elección de uno de estos depende de la cantidad de muestras que se toman, si las muestras son de la prueba son iguales a 30 o mas se utiliza el estadístico z, en caso contrario se utiliza el estadístico t. O dependiendo si es prueba de varianza, de correlaciones, etc.

viernes, 2 de abril de 2010

Epidemiologia

La epidemiología es, en la acepción más común, el "estudio de las epidemias" es decir, de las "enfermedades que afectan transitoriamente a muchas personas en un sitio determinado"
Su significado deriva del griego Epi (sobre) Demos (Pueblo) Logos (ciencia). Una definición técnica es la que propone que la epidemiología es "el estudio de la distribución y determinantes de enfermedades en poblaciones humanas"
Ambas definiciones, se corresponden con el significado que la disciplina ha tenido en dos momentos históricos muy distintos.
Es así como la primera definición corresponde a la conceptualización surgida en los albores de la epidemiología, cuando ésta centró su interés en el estudio de procesos infecciosos transmisibles (pestes) que afectaban grandes grupos humanos. Estas enfermedades, llamadas epidemias, resultaban en un gran número de muertes frente a las cuales, la medicina de aquella época no tenía nada efectivo que ofrecer .
La literatura científica reconoce en el Inglés John Snow al padre de la epidemiología. Snow, utilizando magistralmente el método científico, aportó importantes avances al conocimiento de la epidemia de cólera que, en aquella época, afectaba a la ciudad de Londres. Las acertadas conclusiones de Snow acerca de la etiología, forma de transmisión y control de la enfermedad se anticiparon a los progresos que en este sentido hicieran la microbiología, la infectología y la clínica .
La segunda definición constituye una más actualizada y en ese sentido de mayor amplitud y especificidad. Es posible afirmar que la evolución científica, tecnológica y el cambio en el nivel de vida de las poblaciones, modificaron el tipo de enfermedades que afectaban en mayor número y más gravemente a la población.
Esta modificación puso de relieve enfermedades no infecciosas cuya elevada frecuencia de aparición no era consecuencia de los mecanismos clásicos de transmisión conocidos para las enfermedades infecciosas transmisibles. Estas enfermedades son conocidas hoy como enfermedades crónicas no transmisibles (ECNT. Non Commmunicable Diseases en (NCD en Inglés) y también son materia importante de estudio en la epidemiología moderna..
De acuerdo con lo expuesto, hoy en día se acepta la siguiente definición de epidemiología como la más simplificada y completa:

Epidemiología es la disciplina que estudia la enfermedad en poblaciones humanas
A partir de ella se mencionan sus principios implícitos:
  • La epidemiología es una disciplina médica o de las ciencias de la salud.
  • El sujeto de estudio de la epidemiología es un grupo de individuos (colectivo) que comparten alguna(s) característica(s) que los reúne.
  • La enfermedad y su estudio toman en esta definición la connotación más amplia.
En otros textos se puede aprecias que la epidemiologia, es referido al estudio de la salud y las enfermedades de la poblaciones humanas o, con mayor presicion a los modelos de salud y enfermedad, si como los factores que influyen en en estos factores.


La epidemiología es la disciplina científica que estudia la distribución, frecuencia, determinantes, relaciones, predicciones y control de los factores relacionados con la salud y enfermedad en poblaciones humanas. La epidemiología en sentido estricto, que podría denominarse humana, ocupa un lugar especial en la intersección entre las ciencias biomédicas y las ciencias sociales y aplica los métodos y principios de estas ciencias al estudio de la salud y la enfermedad en poblaciones humanas determinadas. Pero existe también una epidemiología veterinaria y también podría hablarse de una epidemiología zoológica y botánica, íntimamente relacionada con la ecologia.
La epidemiología se considera una ciencia básica de la medicina preventiva y una fuente de información para la de salud pública. La epidemiología estudia, sobre todo, la relación causa-efecto entre exposición y enfermedad. Las enfermedades no se producen de forma aleatoria; tienen causas, muchas de ellas sociales, que pueden evitarse. Por tanto, muchas enfermedades podrían prevenirse si se conocieran sus causas. Los métodos epidemiológicos han sido cruciales para identificar numerosos factores etiológicos que, a su vez, han justificado la formulación de políticas sanitarias encaminadas a la prevención de enfermedades, lesiones y muertes prematuras.
La epidemiología surgió del estudio de las epidemias de enfermedades infecciosas; de ahí su nombre. Ya en el siglo XX los estudios epidemiológicos se extendieron a las enfermedades y problemas de salud en general, analizados mediante diversos métodos, entre los cuales los de la demografía y la estadística son especialmente importantes.


fuente: Bioestadistica Medica - Beth Dawson y Robert G. Trapp 4ta edicion

jueves, 18 de marzo de 2010

La Estadistica en la Salud Publica

Introducción

La necesidad de un enfoque estadístico esta actualmente bien reconocido en la investigación y en la práctica de las disciplinas que constituyen la salud pública. Ya que estas estudian comunidades o poblaciones en las que claramente se aplican las leyes de los grandes números y de las fluctuaciones aleatorias. La estadística permite analizar situaciones en las que los componentes aleatorios contribuyen de forma importante en la variabilidad de los datos obtenidos. En salud pública los componentes aleatorios se deben, entre otros aspectos, al conocimiento o a la imposibilidad de medir algunos determinantes de los estados de salud y enfermedad, así como a la variabilidad en las respuestas por los pacientes, similares entre si, que son sometidos al mismo tratamiento.

La extensión de los conocimientos y aptitudes de carácter estadístico que necesitan adquirir los profesionales de la salud pública son importantes, porque el conocimiento de los principios y métodos estadísticos y la competencia en su aplicación se necesitan para el ejercicio eficaz de la salud pública, y adicionalmente para la comprensión e interpretación de los datos sanitarios; a fin de discriminar entre opiniones arbitrarias o discrecionales, con respecto a las verdaderamente evaluadas en un contexto científico.

Definición de estadística

En salud pública se emplean, consciente o no, muchos conceptos estadísticos al adoptar decisiones relativas a diagnósticos clínicos, o bien al predecir probables resultados de un programa de intervención en la población. Y considerando que la estadística es una excelente base para comprender muchos fenómenos reales y para orientar la resolución de problemas relativos a estos, es importante poder definirla mediante el conocimiento de diferentes autores:

Ligia Moya (1989)
"la rama del saber que trata del desarrollo y aplicación de métodos eficientes de recolección, elaboración, presentación, análisis e interpretación de datos numéricos"

Lwanga y Tye (1987)
"disciplina que comprende los métodos estadísticos y el estudio de métodos científicos de acopio, tratamiento, reducción, presentación, análisis e interpretación de datos y de hacer deducciones y sacar conclusiones de datos numéricos"

Spiegel (1992)
"estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis"

Tavera Barquin (1980)
"es la ciencia que estudia la aplicación de los métodos estadísticos para conocer las características de los conjuntos o de los fenómenos de masa, en sus aspectos cuantitativos y cualitativos"

Daniel (2002)
"es un campo del estudio relacionado con la recopilación, organización y resumen de datos y la obtención de inferencias acerca de un conjunto de datos cuando sólo se observa una parte de ellos"

En la práctica, al margen de su definición, la estadística suele variar su nombre, particularmente debiéndose al campo o área de aplicación. De tal manera que aplicada al campo de la salud, se denominaría estadística de salud, en el área de estudio y caracterización de la población humana, se le llama estadística demográfica, en su parte social como estadística social y en las ciencias biológicas, bioestadística. Y en el ámbito de estudio de la salud pública hace acopio de todos los métodos estadísticos empleados por las diferentes disciplinas que la constituyen como las antes citadas.

El método estadísticoEl método estadístico es un conjunto de procedimientos que se emplean para describir y determinar las características de las series de datos, relativas a los fenómenos reales.

El método estadístico contempla las siguientes etapas:

Recopilación de datos
Organización de los datos
Análisis de las series de datos
Presentación de resultados
Formulación de conclusiones

Para efectuar los análisis se emplean parámetros o medidores estadísticos, que podemos definir como expresiones formulables que pueden valorar alguna característica, simple o compleja del suceso tratado. Con el propósito de conocer los límites de los valores, la homogeneidad entre ellos, su estructura, su variación, el compáralos con otros valores, establecer la probabilidad de los valores e inferir las características de una población, entre algunos aspectos.

Objetivo y aplicaciones de la estadística en salud pública
Entre los objetivos más importantes relacionados con la estadística y que contribuyen al campo de la salud pública y sectores relacionados tenemos los siguientes (11):

Permite comprender los fundamentos racionales en que se basan las decisiones en materia de diagnóstico, pronóstico y terapéutica.

Interpreta las pruebas de laboratorio y las observaciones y mediciones clínicas con un conocimiento de las variaciones fisiológicas y de las correspondientes al observador y a los instrumentos.

Proporciona el conocimiento y comprensión de la información acerca de la etiología y el pronóstico de las enfermedades, a fin de asesorar a los pacientes sobre la manera de evitar las enfermedades o limitar sus efectos.

Otorga una discernimiento de los problemas sanitarios para que eficientemente se apliquen los recursos disponibles para resolverlos.

Adicionalmente a los objetivos antes citados, resalta la utilidad de la estadística en el desarrollo del pensamiento crítico, a fin de: (a) pensar críticamente acerca de los problemas de salud; (b) evaluar correctamente los datos disponibles para la toma de decisiones e (c) identificar las decisiones y conclusiones que carecen de base científica y lógica.

Los principios y conceptos de los métodos estadísticos se aplican en diversos campos de la salud pública, tales como en estudios de variación, diagnóstico de enfermedades y de la salud de la comunidad, predicción del resultado probable de un programa de intervención, elección apropiada de intervención en paciente o comunidad, administración sanitaria, realización y análisis en la investigaciones en salud pública. (Ver Tabla 1) (12)

Estudios de variación
La variación de una característica se produce cuando su valor cambia de un sujeto a otro, o de un momento a otro en el mismo sujeto
Edad, peso, estatura, presión sanguínea, niveles de colesterol, albúmina serica, recuento de plaquetas.

Diagnóstico de enfermedades y de la salud de la comunidad
Proceso mediante el cual se identifican el estado de salud de un individuo, o de un grupo, y los factores que lo producen
Valoración de los síntomas declarados o recabados en los individuos para realizar un diagnóstico de salud

Predicción del resultado probable de un programa de intervención
Es la evaluación del resultado de un programa de intervención en una comunidad o de una enfermedad en los pacientes, a la luz de los síntomas, signos y circunstancias existentes
Programa de intervención nutricional para determinar el impacto de la aplicación de un suplemento alimenticio

Elección apropiada de intervención en paciente o comunidad
Se basa en la experiencia anterior con pacientes o comunidades de análogas características que habían sufrido una intervención
Evaluación de la eficacia de un fármaco y/u otros métodos de tratamiento

Administración sanitaria y planificación
Refiere al empleo de los datos relativos a la enfermedad en la población a fin de hacer un diagnóstico en la comunidad
Determinar el perfil sanitario de la población en términos de distribución de la enfermedad y la utilización de los recursos de salud

Realización y análisis en la investigación en salud pública
Contempla otorgar la validez a investigaciones analíticas o de encuestas descriptivas.
Probabilidad de cáncer de próstata en individuos con edad mayor a 60 años

Finalidad de la estadísticaLa estadística es un método que enseña los procedimientos lógicos, prácticos y útiles a seguir para observar un fenómeno, recolectar, elaborar, analizar, interpretar y presentar datos del mismo fenómeno expresados en detalle o síntesis a través del número, cuadro, y gráfico, con sus correspondientes notas explicativas (13). Es una disciplina cuya finalidad es:

1.- "La reducción de datos", que es un proceso de sustitución de la masa de datos originales por un pequeño número de características descriptivas, la cual se denomina Estadística Descriptiva.

2.- "El análisis científico de datos" experimentales y de los fenómenos observados que se conoce como Inferencia Estadística.

Principalmente, la estadística contiene dos grandes fases: la descriptiva y la inferencial. Es decir, conlleva dos etapas sucesivas, dado que la estadística descriptiva prescribe las características de una muestra, la inferencia estadística pretenderá desplegarlas a toda la población.

Estadística descriptiva

La estadística descriptiva se ocupa de obtener datos nuevos. Con los cuales procede a resumir y organizar esos datos para facilitar su análisis e interpretación, para lo cual utiliza medidas de tendencia central, de dispersión y posición.

A.- Medidas de tendencia central

El examen estadístico de esta medidas, debidamente sentencia, la investigación de parámetros sobre los cuales se pueda obtener un atributo de toda la información recabada; es decir las medidas de tendencia central, advierten y resumen el comportamiento de un conjunto de datos. No obstante su importancia, su análisis no debe hacerse separadamente de las medidas de dispersión, ya que estás están asociadas con el grado de concentración de la información. Las principales medidas de tendencia central son: media aritmética. mediana, moda.

B.- Medidas de dispersión

Las medidas de dispersión, tienen como propósito estudiar lo concentrada o dispersa que está la distribución de los datos con respecto a la media aritmética. Para medir el grado de dispersión de una variable, se utilizan principalmente los siguientes indicadores: rango o recorrido, desviación media, varianza y desviación típica o estándar, y coeficiente de variación.

C.- Medidas de posición

Las medidas de posición permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales, tales como los cuartiles, deciles y percentiles.

Inferencia estadística

La Inferencia estadística procede a formular estimaciones y probar hipótesis acerca de datos resumidos, y utiliza predominantemente estimaciones puntuales, por intervalo y contraste de hipótesis. Es decir, fundamentalmente es de esencia inductiva y llega a generalizar respecto de las características de una población valiéndose de observaciones empíricas de la muestra. (18, 19)



A.-Estimación puntual

El proceso de estimación puntual entraña calcular, a partir de los datos de una muestra, valores aproximados del parámetro de la población, de la cual fue extraída la muestra. Por ejemplo la media y la desviación estándar.

B.- Estimación por intervalo (intervalo de confianza)

Una estimación por intervalo de confianza para un parámetro es un intervalo construido alrededor del estimador puntual del parámetro de tal manera que podemos esperar que el verdadero valor del parámetro quede incluido en dicho intervalo. El nivel de confianza de un intervalo es una probabilidad(expresada en porcentaje) que representa la seguridad de que el intervalo encierra el verdadero valor del parámetro. Por ejemplo el intervalo de confianza para medias o una proporción.

C.- Contraste de hipótesis

En una investigación se establecen dos tipos de hipótesis, la metodológica de investigación y las estadísticas (hipótesis nula e hipótesis alterna); estas últimas permiten evaluar la hipótesis metodológica de investigación a partir de técnicas estadísticas (Ver Tabla 2). La hipótesis nula (Ho) es una afirmación que propone los resultados contrarios a los que el investigador espera encontrar. Es decir, niega la relación entre las variables. Por el contrario, la hipótesis alterna (Ha) afirma lo que el investigador desea que ocurra, y que es manifestado en la hipótesis metodólogica. Es importantes observar la naturaleza de los datos, si son cuantitativos o cualitativos (proporciones o rango), con el objeto de traducir o abstraer de manera correcta el modelo experimental, a partir del modelo matemático-estadístico propuesto.

Elección de la prueba estadística

Es necesario considerar que la prueba estadística es una correcta abstracción de la realidad. Para elegir la prueba estadística es necesario que la estructura experimental esté perfectamente aclarada. Uno de los errores más frecuentes es aplicar pruebas inadecuadas a los datos sólo porque parecen más avanzadas o por que son los que se conocen.

Conclusiones

El conocimiento de los método estadístico esta estrechamente ligado a una buena práctica de la investigación en salud. Ya que es necesario para poder interpretar correctamente y de una manera crítica los resultados obtenidos. Podemos considerar como premisa que un buen trabajo de investigación en salud debe dedicar un espacio a describir los métodos de análisis de datos utilizados; y entre los factores determinantes para un buen análisis se encuentra el tipo de diseño y el conocimiento de las variables de estudio.

sábado, 6 de marzo de 2010

Estadisticas por la WEB

Aqui dejo un enlace para hacer analisis estadistico por paginas web, en otras palabras analisis on-line. Espero les pueda servir, es basico en muchas funciones y facil para aquellos que no usan software especializado en analisis de datos

Enlace Web:
http://statpages.org/

http://statpages.org/

viernes, 12 de febrero de 2010

Muestreo Conceptos basicos

Muestreo, Conceptos y aplicaciones

Al realizar una investigación es muchas veces imposible estudiar toda nuestra población, ya que la cantidad de recursos materiales y humanos que demandan hacen inviable realizarlo. Una opción ante ello es evaluar solo una fracción representativa de todo la población y generalizar los resultados hacia toda la población (inferencia), El muestreo es el procedimiento estadístico para seleccionar dicha fracción a partir de la población, con el objeto de estudiar en ella alguna característica(s), y generalizar los resultados a la población de origen.

CONCEPTOS PREVIOS:
§ Elemento: Es un objeto o individuo en el cual se toma una medición o evaluación.
§ Población.- Es el conjunto de individuos que comparten alguna peculiaridad y de los cuales pretendemos conocer alguna característica lo llamamos también universo. Algunos autores reservan el nombre de población para el caso de que el número de elementos del colectivo sea finito dando el nombre de universo a los colectivos con infinitos individuos. Nosotros no haremos esa distinción y llamaremos población o universo a este colectivo independientemente de su tamaño finito o infinito. El número de elementos que la integran constituye el tamaño de la población, denotado por N.
§ Unidad de muestreo: Son colecciones no repetidas de la población que constituyen la población total. Si cada unidad de muestreo contiene un solo elementos de la población, entonces una unidad de muestreo y un individuo de la población son idénticos.
§ Marco muestral: Es el listado de las unidades de muestreo que componen la población.
§ Muestra.- Es una fracción o colección de unidades seleccionadas de uno ó varios marcos muéstrales. El número de unidades seleccionadas es el tamaño muestral y se denota por n.
§ Error Muestral.- Se refiere a la variación natural existente entre muestras tomadas de la misma población. Como es de comprender una muestra no es una copia exacta de la población; por lo cual no proporciona una información completa. Este error se minimiza con un diseño cuidadoso, sin embargo otros errores pueden introducirse en el diseño que son los llamados “errores no de muestreo”, debidos al sesgo de selección, no respuesta entre otros.

§ Significancia: también conocido como confiabilidad o confianza. Es la probabilidad de que la estimación efectuada se ajuste a la realidad, se denota por p. En el diseño de estudios se usan los valores de 95% (p=0,05) y 99 (p=0,01). Considerándose como aceptables para realizar inferencia probabilidades (p) menores de 0,05.
§ Intervalo de Confianza.- Cualquier información que queremos recoger está distribuida según una ley de probabilidad (Gauss o Student), así cuando calculamos un medida resultado (estadístico) en una muestra este es un valor puntual, que se acerca a la verdadera medida (parámetro) en el universo o población. Así el intervalo de valores construido en torno a un estadístico que contenga con una determinada probabilidad el verdadero valor del parámetro, se denomina intervalo de confianza, usándose generalmente el 95%. .
§ Muestreo probabilístico.- Se denomina así cuando, es posible calcular de antemano cual es la probabilidad de obtener cada una de las muestras que es posible seleccionar. Para lo cual es necesario que la selección de cada individuo de la muestra sea aleatorio.
· Muestreo no probabilístico.- Existen 2 tipos “el Muestreo intencional u opinatico” que es donde la persona que selecciona la muestra es la que procura que sea representativa, la representatividad de la muestra depende de su intención u opinión, la composición es influenciada por las preferencias del seleccionador. Asimismo tenemos “el Muestreo sin norma”, donde se toma la muestra de cualquier manera por razones de comodidad o capricho. En ambos casos pueden dar resultados útiles, sin embargo carecen de una base teórica satisfactoria para hacer generalizaciones.
§ Métodos de muestreo probabilístico
Muestreo Aleatorio simple (MAS).- Es aquel donde cada elemento de la población tiene la misma probabilidad de ser incluido en la muestra. Los elementos de la muestra se eligen al azar, que se hace haciendo uso de una tabla de números aleatorios tal como la Tabla H, que se construye en forma tal que genere series de números aleatorios para que se produzca una muestra imparcial. En ocasiones se apela al uso de sorteos. Así una muestra simple aleatoria es aquella en que sus elementos son seleccionados mediante el muestreo aleatorio simple.
Muestreo sistemático.- Es un método práctico de realizar un muestreo; consiste en calcular un periodo k, seleccionar un primer elemento al azar y luego ir cogiendo sucesivamente cada k elementos de una lista el total de la muestra. Aunque un muestreo sistemático puede no ser aleatorio de acuerdo con la definición, a menudo es razonable tratar las muestras sistemáticas como si fueran aleatorias. El riesgo de los muestreos sistemáticos es el de las periodicidades ocultas, cuando un evento no conocido se repite periódicamente. Es similar al MAS cuando no existe periodicidad por lo cual es uno de los mas usados por su practicidad.
Muestreo estratificado.- Se usa cuando tenemos información acerca de una población (es decir de su composición) y vemos que el universo esta formado por conjuntos de individuos diferentes (estratos), es allí que podemos mejorar el muestreo aleatorio por medio de la estratificación. Que consiste en dividir la población en un número de subpoblaciones o estratos. Luego seleccionamos de cada estrato una muestra aleatoria que sea proporcional al tamaño del estrato en el universo. Este procedimiento se conoce como muestreo aleatorio (simple) estratificado.

jueves, 28 de enero de 2010

Diferenciando terminos

Los términos que están relacionados a la estadística muchas veces son muy confusos, en esta oportunidad me gustaría tratar de despejar algunas dudas con respecto a términos con estadística, estadístico, estadísticas, estadística, ¿Significan lo mismo? ¿Qué significados tienen cada uno de estos términos?

Estadística: en la mayoría de las veces que se emplea este término nos referimos a la ciencia estadística, la cual está basada en fuerte sustento matemático y la teoría de las probabilidades para la descripción y el análisis de datos. A su vez se puede indicar que el término estadística tiene como origen el vocablo italiano statista (hombre de estado o político), pero se utilizó por primera vez el término statistik para referirse al análisis de los datos de estado, por lo que se le llamo inicialmente la ciencia del estado.

Estadístico: Dícese de las personas que ejercen la profesión estadística ya sea como licenciatura o como ingeniería. Por ejemplo su servidor, dueño del blog, es un estadístico que se gana los reales ejerciendo la profesión asesorando a personas de otras disciplinas. Tambien dicese de la persona que teniendo un grado de conocimiento de la ciencia estadistica los aplica y transforma a las realidades concurrentes.

Estadísticas: Generalmente se usa este término para referirse al conjunto de indicadores que definen una población o una muestra en un momento especifico, por ejemplo cuando decimos, las estadísticas demográficas del Perú, podríamos referirnos al total de habitantes, por edad, por sexo, por ámbito geográfico de residencia.

Estadista: Este término es el que lleva mayores confusiones cuando es citado. Se utiliza únicamente para referirse a las personas de estado, a las que gobiernan y entienden materias políticas y fundamentalmente de sistemas de gobierno. Por ejemplo son sinónimos de estadista los Jefe de estado, presidentes, gobernador, político. Entre los más grandes estadistas de la historia podemos encontrar a Alejandro el Grande, Gengis Kan, Pachacutec, George Washington, Sir Winston Spencer Churchill.