Cómo construir y validar redes bayesianas con Netica

  1. López Puga, Jorge
Revista:
REMA

ISSN: 1135-6855

Año de publicación: 2012

Volumen: 17

Número: 1

Páginas: 1-17

Tipo: Artículo

Otras publicaciones en: REMA

Resumen

Las redes bayesianas son herramientas de modelado estadístico destinadas a representar un conjunto de incertidumbres relacionadas. Su estructura gráfica y su fundamento probabilístico las hace apropiadas para modelar sistemas multivariados orientados a la clasificación, el diagnóstico y la toma de decisiones. En este trabajo se describen los pasos a seguir para estimar y validar redes bayesianas utilizando el software Netica. En concreto, se describe cómo construir la estructura gráfica del modelo, cómo estimar sus parámetros, cómo usar el modelo para evaluar el impacto de evidencias sobre las variables que contiene y cómo evaluar su bondad de ajuste. Todos los pasos se describen intentando hacerlos comprensibles para los investigadores en ciencias del comportamiento y la salud.

Referencias bibliográficas

  • Aguilera, P. A., Fernández, A. Fernández, R., Rumí, R., y Salmerón, A. (En prensa). Bayesian networks in environmental modelling. Environmental Modelling & Software. doi: 10.1016/j.envsoft.2011.06.004
  • Batista, J. M., y Coenders, G. (2000). Modelos de ecuaciones estructurales. Madrid: Muralla/Hespérides.
  • Cooper, G. F., y Herskovits, E. (1992). A bayesian method for the induction of probabilistic networks from data. Machine Learning, 9, 309-347.
  • Cowell, R. G., Dawid, A. P., Lauritzen, S. L., y Spiegelhalter, D. J. (1999). Probabilistic netwoks and expert systems. Harrisonburg, VA: Springer. Das, B. (2004). Generating conditional probabilities for bayesian networks: easing the knowledge acquisition problem. Descargado el 10 de Septiembre, 2005, desde http://arxiv.org/abs/cs.AI/0411034.
  • DeMaris, A. (2002). Explained variance in logistic regression. A Monte Carlo study of proposed measures. Sociological Methods & Research, 31, 27–74.
  • Edwards, W. (1998). Hailfinder. Tools for and experiences with bayesian normative modeling. American Psychologist, 53, 416–428.
  • Franco, M., y Vivo, J. M. (2007). Análisis de curvas ROC. Principios y aplicaciones. Madrid: La Muralla.
  • Gámez, J. A. (1998). Abducción en modelos gráficos. En J. A. Gámez y J. M. Puerta (Eds.), Sistemas expertos probabilísticos (pp. 79–111). Cuenca: Servicio de Publicaciones de la Universidad de Castilla-La Mancha.
  • Glymour, C. (2001). The mind’s arrows. Bayes nets and graphical causal models in psychology. Cambridge, MA: MIT Press.
  • Glymour, C. (2003). Learning, prediction and causal Bayes nets. Trends in Cognitives Sciences, 7, 43–48.
  • Gopnik, A., Glymour, C., Sobel, D. M., Schulz, L. E., Kushnir, T., y Danks, D. (2004). A theory of causal learning in children: causal and bayes nets. Psychological Review, 111, 3–32.
  • Gopnik, A., y Schulz, L. (2004). Mechanisms of theory formation in young children. Trends in Cognitives Sciences, 8, 371–377.
  • Greiner, R., Su, X., Shen, B., y Zhou, W. (2005). Structural extension to logistic regression: discriminative parameter learning of belief net classifiers. Machine Learning, 59, 297– 322.
  • Greiner, R., y Zhou, W. (2002). Structural extension to logistic regression: discriminative parameter learning of belief net classifiers. Proceedings of the Eighteenth Annual National Conference on Artificial Intelligence, Aug, 2002, 167–173.
  • Hanley, J. A., y McNeil, B. J. (1982). The meaning and use of the area under a receiver operating characteristic (ROC) curve. Radiology, 143, 29–36.
  • Hanley, J. A., y McNeil, B. J. (1983). A method of comparing the areas under receiver operating characteristic curves derived from the same cases. Radiology, 148, 839–843.
  • Heckerman, D. (1995). A tutorial on learning with bayesian networks (Rep. Téc. MS-TR-95 06). Redmon, WA: Microsoft Research.
  • Heckerman, D., Mamdani, A., y Wellman, M. P. (1995). Real-world applications of bayesian networks. Communications of the Association for Computing Machinery, 38 (3), 24– 26.
  • Herskovits, E. H., y Dagher, A. P. (1997). Applications of bayesian networks to health care (Rep. Téc. NSI-TR-1997-02). Baltimore, MD: Noetic Systems.
  • Holyoak, K.H., y Cheng, P. W. (2011). Causal learning and inference as a rational process: the new synthesis. Annual Review of Psychology, 62, 135-163.
  • Huete, J. F. (1998). Sistemas expertos probabilísticos: modelos gráficos. En J. A. Gámez y J.M. Puerta (Eds.), Sistemas expertos probabilísticos (pp. 1–40). Cuenca: Servicio de Publicaciones de la Universidad de Castilla-La Mancha.
  • Jansen, R., Yu, H., Greenbaum, D., Kluger, N., Krogan, N. J., Chung, S., et al. (2003, Octubre 17). A bayesian network approach for predicting proteinprotein interactions from genomic data. Science, 302, 449–453.
  • Kahneman, D. (2003). Experiences of collaborative research. American Psychologist, 58,723–730.
  • Kahneman, D., Slovic, P., y Tversky, A. (1982). Judgement under uncertainty: heuristic and biases. New York: Cambridge University Press.
  • Kahneman, D., y Tversky, A. (1973). On the psychology of prediction. Psychological Review,80, 237–251.
  • Korb, K. B., y Nicholson, A. E. (2004). Bayesian artificial intelligence. Boca Raton, FL: Chapman & Hall/CRC.
  • Lagnado, D. A., Waldman, M. R., Hagmayer, Y., y Sloman, S. A. (2007). Beyond covariation: cues to causal structure. En A. Gopnik y L. Schulz (Eds.), Causal learning: psychology, philosophy, and computation (pp. 154-172). Londres: Oxford University Press.
  • Lee, S. M., Abbott, P., y Johantgen, M. (2005). Logistic regression and Bayesian networks to study outcomes using large data sets. Nursing Research, 2, 133–138.
  • Long, J. S. (1997). Regression models for categorical and limited dependent variables. Thousand Oaks, CA: SAGE Publications.
  • López, J. (2009). Modelos predictivos en actitudes emprendedoras: análisis comparativo de las condiciones de ejecución de las redes bayesianas y la regresión logística. Tesis doctoral no publicada, Facultad de Psicología, Universidad de Almería.
  • López, J. y García, J (2011a). Utilidad de las redes bayesianas en psicología. Almería: Servicio de Publicaciones de la Universidad de Almería.
  • López, J. y García, J (2011b). Eventos por variable en regresión logística y redes bayesianas para predecir actitudes emprendedoras. Revista Electrónica de Metodología Aplicada, 16, 43-58.
  • López, J. y García, J. (en prensa) Comparative Study on Entrepreneurial Attitudes Modelled with Logistic Regression and Bayes Nets. The Spanish Journal of Psychology.
  • López, J., García, J., Cano, C. J., Gea, A. B., y De la Fuente, L. (2009, Septiembre). A definition of potential entrepreneur from a probabilistic point of view. Comunicación presentada en el XI Congreso de Metodología de las Ciencias Sociales y de la Salud. Málaga.
  • López, J., García, J., De la Fuente, L., y De la Fuente, E. I. (2007). Las redes bayesianas como herramienta de modelado en psicología. Anales de Psicología, 23, 307–316.
  • López, J., y García, J. (2007). Valores, actitudes y comportamiento ecológico modelados con una red bayesiana. Medio Ambiente y Comportamiento Humano, 8, 159–175.
  • Mani, S., McDermmott, S., y Valtorta, M. (1997). MENTOR: a bayesian model for prediction of mental retardation in newborns. Research in Developmental Disabilities, 18, 303– 318.
  • Martínez, A., Martínez, S., y Martínez, H. (2002). Estadística empresarial. Almería: Servicio de Publicaciones de la Universidad de Almería.
  • Morales, M. E. (2006). Modelización y predicción en estadística universitaria. Tesis doctoral no publicada, Facultad de Ciencias Experimentales, Universidad de Almería.
  • Nadkarni, S., y Shenoy, P. P. (2004). A causal mapping approach to constructing bayesian networks. Decision Support Systems, 38, 259–281.
  • Ng, A. Y., y Jordan, M. I. (2002). On discriminative vs. generative classifiers: a comparation of logistic regresion and naive Bayes. Advances in Neural Information Processing Systems, 14, 841–848.
  • Pearl, J. (1978). An economic basis for certain methods of evaluating probabilistic forecastst. International Journal of Man-Machine Studies, 10, 175-183.
  • Ruiz, F., García, M. E., y Pérez, A. (2005). Estilos de vida en ciudad de la Habana. Hábitos físico-deportivos y de salud. Madrid: Gymnos.
  • Scheines, R., Spirtes, P., Glymour, C., Meek, C., y Richardson, T. (2005). TETRAD 3: tools for causal modeling. User’s manual. Descargado el 14 de Febrero de 2005, desde http://www.phil.cmu.edu/projects/tetrad/.
  • Serrano, J. (2003). Iniciación a la estadística bayesiana. Madrid: Muralla / Hespérides. Shen, B., Su, X., Greiner, R., Musilek, P., y Cheng, C. (2003, Noviembre). Discriminative parameter learning of general bayesian network classifiers. Comunicación presentada en la 15th IEEE International Conference on Tools with Artificial Intelligence (ICTAI-03). Sacramento, California.
  • Spirtes, P., Glymour, C., y Scheines, R. (2000). Causation, prediction and search (2ª ed.). Cambridge, MA: MIT Press.
  • Tversky, A., y Kahneman, D. (1974, Septiembre 27). Judgement under uncertainty: heuristic and biases. Science, 185, 380–400.