Estimación de la proporción poblacional en presencia de información auxiliar
- Juan Francisco Muñoz Rosas Director
- Antonio Arcos Cebrián Director
Universidad de defensa: Universidad de Granada
Fecha de defensa: 26 de abril de 2011
- Rafael Herrerías Pleguezuelo Presidente
- María del Mar Rueda García Secretaria
- Sergio Martínez Puertas Vocal
- Maria Giovanna Ranalli Vocal
- Jesús Basulto Santos Vocal
Tipo: Tesis
Resumen
En las siguientes líneas se presenta una breve descripción y justificación de la mencionada Tesis: En el campo del muestreo en poblaciones finitas, se han desarrollado numerosos y sofisticados métodos para mejorar la estimación de distintos parámetros asociados a variables cuantitativas. Sin embargo, el problema de la obtención de estimadores de parámetros asociados a variables cualitativas y que posean propiedades deseables es un tema que apenas ha sido discutido en la literatura del muestreo en poblaciones finitas. En concreto, los únicos métodos conocidos para la estimación de parámetros en el caso de variables cualitativas se basan en técnicas tradicionales que en ningún caso utilizan información auxiliar en la etapa de estimación. Destacamos que el principal parámetro objeto de estimación en estas referencias es la proporción de individuos que presentan un determinado atributo. Teniendo en cuenta las líneas anteriores, en la tesis que se presenta se pretenden lograr los siguientes objetivos: 1. Revisar exhaustivamente la bibliografía más relevante relacionada con la estimación indirecta en poblaciones finitas, la cual está basada en variables cuantitativas. 2. Plantear y definir nuevos estimadores puntuales para una proporción poblacional. Los estimadores propuestos estarán basados en información auxiliar, lo cual puede mejorar el comportamiento de los estimadores propuestos en comparación con los estimadores existentes. En concreto, intentaremos que los estimadores propuestos sean más eficientes y menos sesgados. Debido a las importantes ganancias que obtienen los estimadores basados en información auxiliar en el caso de variables cuantitativas, resultará interesante conocer el grado de ganancia en el caso de variables cualitativas. Utilizaremos estimadores de tipo razón y regresión, entre otros métodos, para la definición de los nuevos estimadores. 3. Plantear y estudiar otros temas relacionados con la estimación puntual de parámetros, tal como puede ser la estimación de las varianzas de los estimadores propuestos o la construcción de intervalos de confianza. 4. Comparar teóricamente, en términos de varianzas principalmente, los estimadores propuestos con los estimadores ya existentes. 5. Completar el estudio teórico de los estimadores e intervalos de confianza propuestos con estudios empíricos basados en estudios de simulación Monte Carlo que avalen los beneficios obtenidos por los métodos propuestos en comparación con los existentes actualmente en la literatura. Por una parte, los estudios de simulación se basarán en poblaciones simuladas con el fin de abarcar distintos escenarios que pueden presentarse en la práctica. Por ejemplo, consideraremos valores pequeños y elevados para la proporción poblacional que deseamos estimar, así como valores pequeños y elevados para los tamaños muestrales, correlaciones entre las variables, etc. Por otra parte, con el fin de analizar los métodos propuestos en situaciones reales, los estudios de simulación se basarán en datos reales extraídos del ámbito de la Economía y la Empresa. Esta memoria está estructurada como sigue: Este capítulo 1 recoge algunas indicaciones relacionadas con los distintos capítulos de esta memoria. De este modo, en la Sección 1.1 se tratan algunas cuestiones del muestreo en el siglo XXI, en la Sección 1.2 se justifica la importancia del muestreo en la administración de empresas y la economía y se proponen ejemplos de uso de muestreo en ambos escenarios. Finalmente en la Sección 1.3 se presentan numerosos ejemplos de estimadores que hacen uso de la información auxiliar en la etapa de estimación. En el capítulo 2, en primer lugar, se presenta la nomenclatura y notación básica que se utilizará en el presente trabajo. A continuación, se presentan las aportaciones realizadas en el problema de la estimación de una proporción poblacional mediante estimadores de tipo razón. Estas aportaciones se han realizado tanto en el escenario de un muestreo aleatorio simple como en el caso de muestras extraídas mediante un diseño muestral general. Destacamos que tales estimadores de tipo razón son la base sobre la que se cimienta la investigación central de la presente tesis doctoral, puesto que estos estimadores se utilizarán, en general, para formular el resto de estimadores propuestos en este trabajo. En este capítulo se ha de destacar el estudio de las propiedades teóricas de los estimadores propuestos y la comparación con el estimador estándar. Además, utilizando esta propiedades se proponen nuevos estimadores de tipo razón con menor sesgo y/o menor varianza. En último lugar, se estudian otros escenarios como la presencia de correlación negativa, la estimación de proporciones pequeñas, etc. La aportación más relevante es la definición del estimador de razón óptimo. Dicho estimador es una combinación lineal de dos de los estimadores de tipo razón descritos en este capítulo. El valor óptimo del peso utilizado en la combinación lineal se determinará mediante el criterio de mínima varianza. En el capítulo 3 se define el estimador de tipo regresión para una proporción poblacional, tanto para MAS como para un diseño muestral general, y se estudian las propiedades teóricas más importantes. Entre estas propiedades teóricas podemos destacar que posee mínima varianza, es insesgado, coincide, bajo MAS, con el estimador de tipo razón 'optimo descrito anteriormente, etc. Para cada uno de los nuevos estimadores definidos en los capítulos 2 y 3, se estudian desde un punto de vista teórico sus propiedades más importantes. Además de las comparaciones teóricas de los estimadores comentadas anteriormente, se realizan una serie de comparaciones empíricas mediante estudios de simulación Monte Carlo, los cuales están basados en poblaciones simuladas con el fin de abarcar distintos escenarios, así como basados en poblaciones reales del ámbito de la Economía y de la Empresa. Como criterio para la comparación de los distintos estimadores puntuales se utilizarán medidas comúnmente utilizadas como el sesgo relativo y el error cuadrático medio relativo, entre otras. Tanto las comparaciones teóricas como las empíricas muestran que los estimadores propuestos tienen un buen comportamiento en términos de sesgo y error cuadrático medio. En el capítulo 4 se aborda el problema de la estimación de la proporción mediante intervalos de confianza. Tales intervalos de confianza están basados en los estimadores propuestos en los capítulos 2 y 3. Al igual que en el caso de la estimación puntual, se definen intervalos de confianza en el caso de muestras extraídas bajo MAS y muestras extraídas bajo un diseño muestral general. Se utilizarán varios criterios, como la amplitud media del intervalo, la cobertura empírica, etc, para la comparación empírica de los distintos intervalos de confianza. Este trabajo finaliza con un Apéndice donde se describen todas las poblaciones, tanto las simuladas como las basadas en datos reales, utilizadas en los estudios de simulación.