GeoAcademyweb platform and algorithm for automatic detection and location of geographic coordinates and toponyms in scientific articles

  1. Cascón Katchadourian, Jesús 1
  2. Rodríguez Domínguez, Carlos 2
  3. Carranza García, Francisco 2
  4. Torres Salinas, Daniel 1
  1. 1 University of Granada, Faculty of communication and documentation, Dept of Information and Communication
  2. 2 University of Granada, ETSIIT, Dept of Software Engineering
Revista:
Revista española de documentación científica

ISSN: 0210-0614 1988-4621

Año de publicación: 2023

Volumen: 46

Número: 4

Tipo: Artículo

DOI: 10.3989/REDC.2023.4.1393 DIALNET GOOGLE SCHOLAR lock_openAcceso abierto editor

Otras publicaciones en: Revista española de documentación científica

Resumen

El siguiente estudio describe las cualidades y usos del proyecto GeoAcademy, un programa diseñado con el objetivo de geolocalizar artículos científicos automáticamente, dichos artículos se descargarían de bases de datos científicas generales como Scopus o Web of Science. Esta geolocalización se realiza sobre el contenido del documento, ya sea mediante la captura de posibles coordenadas geográficas que tenga el documento, o topónimos que puedan aparecer en el documento a través de un algoritmo creado a tal efecto. En la metodología explicamos los pasos que se han dado en este proyecto para crear una base de datos de muestra con artículos que tratan sobre Sierra Nevada (España) y la creación y diseño del algoritmo. Los resultados muestran los datos técnicos de la aplicación del algoritmo sobre la base de datos y su tasa de éxito, así como una descripción de la plataforma creada para visualizar gráficamente los documentos geolocalizados en un mapa web. Finalmente, en la discusión, definimos las dificultades encontradas, las posibles aplicaciones bibliométricas y su utilidad como herramienta de consulta y recuperación de información.

Información de financiación

Financiadores

Referencias bibliográficas

  • Acheson, E., & Purves, R. S. (2021). Extracting and modeling geographic information from scientific articles. PloS one, 16(1), e0244918. https://doi.org/10.1371/journal.pone.0244918 PMid:33406109 PMCid:PMC7787447
  • Bordogna, G., Ghisalberti, G., & Psaila, G. (2012). Geographic Information Retrieval: Modeling Uncertainty of User's Context. Fuzzy Sets and Systems, 196, 105-124. https://doi.org/10.1016/j.fss.2011.04.005
  • Bornmann, L., Leydesdorff, L., Walch-Solimena, C., & Ettl, C. (2011). Mapping excellence in the geography of science: An approach based on Scopus data. Journal of Informetrics, 5(4), 537-546. https://doi.org/10.1016/j.joi.2011.05.005
  • Bornmann, L., Mutz, R., Haunschild, R., Moya-Anegon, F., Clemente, M., & Stefaner, M. (2021). Mapping the impact of papers on various status groups in excellencemapping.net: a new release of the excellence mapping tool based on citation and reader scores. Scientometric, 126, 9305-9331. https://doi.org/10.1007/s11192-021-04141-4
  • Buscaldi, D., & Magnini, B. (2010). Grounding toponyms in an italian local news corpus. Proceedings of the 6th workshop on geographic information retrieval, 1-5. https://doi.org/10.1145/1722080.1722099
  • Cascón-Katchadourian, J., & Ruiz Rodríguez, A. Á. (2016). Descripción y valoración del software MapTiler: Del mapa escaneado a la capa interactiva publicada en la web. Profesional de la Información, 25(6), 970978. https://doi.org/10.3145/epi.2016.nov.13
  • Cascón-Katchadourian, J., López-Herrera, A. G., Ruiz-Rodríguez, A. Á., & Herrera-Viedma, E. (2019). Proyecto Histocarto: aplicación de SIGs (georreferenciación y geolocalización) para mejorar la recuperación de la documentación histórica gráfica. Profesional de la Información, 28(4). https://doi.org/10.3145/epi.2019.jul.16
  • Catini, R., Karamshuk, D., Penner, O., & Riccaboni, M. (2015). Identifying geographic clusters: A network analytic approach. Research policy, 44(9), 1749-1762. https://doi.org/10.1016/j.respol.2015.01.011
  • Clarivate. (2022). Incites. Available at: https://incites.clarivate.com/#/landing.
  • Cobo, M. J., López-Herrera, A. G., Herrera-Viedma, E., & Herrera, F. (2012). SciMAT: A new science mapping analysis software tool. Journal of the American Society for Information Science and Technology, 63(8), 1609-1630. https://doi.org/10.1002/asi.22688
  • Cortés-José, J. (2001). El documento cartográfico. In J. Jiménez-Pelayo, J. Monteagudo-López-Menchero, & F. J. Bonachera-Cano, La documentación cartográfica : Tratamiento, gestión y uso, 37-113. Huelva: Universidad de Huelva.
  • CWTS. (2022). CWTS Leiden Ranking 2022. Available at: https://www.leidenranking.com/.
  • D'Ignazio, C., Bhargava, R., Zuckerman, E., & Beck, L. (2014). Cliff-clavin: Determining geographic focus for news articles. DSpace@MIT. Available at: https://hdl.handle.net/1721.1/123451.
  • Dredze, M., Paul, M. J., Bergsma, S., & Tran, H. (2013). Carmen: A twitter geolocation system with applications to public health. Workshops at the twenty-seventh AAAI conference on artificial intelligence.
  • Instituto de Estadística y Cartografía de Andalucía. (2022). Toponimía-Nomenclátor. Available at: https://www.juntadeandalucia.es/institutodeestadisticaycartografia/prodCartografia/toponimia/index.htm#:~:text=El%20Nomencl%C3%A1tor%20Geogr%C3%A1fico%20de%20Andaluc%C3%ADa,%2C%20extractivas%2C%20servicios%20y%20equipamientos.
  • Fisher, R., Radford, B. T., Knowlton, N., Brainard, R. E., Michaelis, F. B., & Caley, M. J. (2011). Global mismatch between research effort and conservation needs of tropical coral reefs. Conservation Letters, 4(1), 64-72. https://doi.org/10.1111/j.1755-263X.2010.00146.x
  • Geoacademy. (2022). Geoacademy. Available at: https://geoacademy.everyware.es/.
  • GEOUP4 (2022). GEOUP4. Las universidades en el territorio. Geolocalización de la producción científica. Available at: http://geo.up4.es/.
  • Gerstner, K., Moreno-Mateos, D., Gurevitch, J., Beckmann, M., Kambach, S., Jones, H. P., & Seppelt, R. (2017). Will your paper be used in a meta-analysis? Make the reach of your research broader and longer lasting. Methods in Ecology and Evolution, 8(6), 777-784. https://doi.org/10.1111/2041-210X.12758
  • Gritta, M., Pilehvar, M. T., Limsopatham, N., & Collier, N. (2018). What's missing in geographical parsing? Language Resources and Evaluation, 52(2), 603-623. https://doi.org/10.1007/s10579-017-9385-8 PMid:31258456 PMCid:PMC6560650
  • Imani, M. B., Chandra, S., Ma, S., Khan, L., & Thuraisingham, B. (2017). Focus location extraction from political news reports with bias correction. 2017 IEEE International Conference on Big Data (Big Data) 1956-1964. https://doi.org/10.1109/BigData.2017.8258141
  • Inoue, H., Nakajima, K., & Saito, Y. U. (2019). Localization of collaborations in knowledge creation. The Annals of Regional Science, 62(1), 119-140. https://doi.org/10.1007/s00168-018-0889-y
  • JournalMap (2022). JournalMap. Available at: https://www.journalmap.org/.
  • Karl, J. W. (2019). Mining location information from life-and earth-sciences studies to facilitate knowledge discovery. Journal of Librarianship and Information Science, 51(4), 1007-1021. https://doi.org/10.1177/0961000618759413
  • Karl, J. W., Unnasch, R. S., Herrick, J. E., & Gillan, J. (2012). JournalMap: geo-semantic searching for relevant knowledge. In Ecological Society of America Proceedings.
  • Kmoch, A., Uuemaa, E., Klug, H., & Cameron, S. G. (2018). Enhancing location-related hydrogeological knowledge. ISPRS International Journal of Geo-Information, 7(4), 132. https://doi.org/10.3390/ijgi7040132
  • Leveling, J. (2015). Tagging of temporal expressions and geological features in scientific articles. Proceedings of the 9th Workshop on Geographic Information Retrieval, 1-10. https://doi.org/10.1145/2837689.2837701
  • Mapping Research Excellence. (2022). Excellence Maps v2. Available at: https://www.excellencemapping.net/
  • Martin, L. J., Blossey, B., & Ellis, E. (2012). Mapping where ecologists work: Biases in the global distribution of terrestrial ecological observations. Frontiers in Ecology and the Environment, 10(4), 195-201. https://doi.org/10.1890/110154
  • Middleton, S. E., Kordopatis-Zilos, G., Papadopoulos, S., & Kompatsiaris, Y. (2018). Location extraction from social media: Geoparsing, location disambiguation, and geotagging. ACM Transactions on Information. Systems (TOIS), 36(4), 1-27. https://doi.org/10.1145/3202662
  • Ministerio para la transición ecológica y el reto demográfico. (2022). Programa de investigación. Convocatoria 2022. Available at: https://www.miteco.gob.es/es/red-parques-nacionales/programa-investigacion/convocatoria2022.aspx
  • Page, R. D. (2010). Enhanced display of scientific articles using extended metadata. Web Semantics: Science, Services and Agents on the World Wide Web, 8(2-3), 190-195. https://doi.org/10.1016/j.websem.2010.03.004
  • Ramos-Vacca, I. D., & Bucheli-Guerrero, V. A.. (2015). Automatic geolocation of the scientific knowledge: Geolocarti. 10th Computing Colombian Conference (10CCC), 416-424. https://doi.org/10.1109/ColumbianCC.2015.7333454
  • Scimago. (2022). Ranking Methodology. Available at: https://www.scimagoir.com/methodology.php.
  • ShanghaiRanking. (2022). ShanghaiRanking. Available at: https://www.shanghairanking.com/rankings/arwu/2021.
  • Tamames, J., & de Lorenzo, V. (2010). EnvMine: A text-mining system for the automatic extraction of contextual information. BMC bioinformatics, 11(1), 1-10. https://doi.org/10.1186/1471-2105-11-294 PMid:20515448 PMCid:PMC2901371
  • Teitler, B. E., Lieberman, M. D., Panozzo, D., Sankaranarayanan, J., Samet, H., & Sperling, J. (2008). NewsStand: A new view on news. Proceedings of the 16th ACM SIGSPATIAL international conference on Advances in geographic information systems, 1-10. https://doi.org/10.1145/1463434.1463458
  • Umultirank. (2022). Umultirank. Universities compared. Your way. Available at:https://www.umultirank.org/.
  • Van Eck, N. J., & Waltman, L. (2010). Software survey: VOSviewer, a computer program for bibliometric mapping, Scientometrics, 84(2), 523-538. https://doi.org/10.1007/s11192-009-0146-3 PMid:20585380 PMCid:PMC2883932
  • Zhang, W., & Gelernter, J. (2014). Geocoding location expressions in Twitter messages: A preference learning method. Journal of Spatial Information Science, 9, 37-70. https://doi.org/10.5311/JOSIS.2014.9.170