preloader

Trabajando con datos de GBIF

blog-image

Algunas investigaciones que realizamos en nuestra vida profesional se basan en conocer y comprender que taxones o especies se encuentran en una determinada región de nuestro interes. Una excelente herramienta que nos ayuda a conocer estos registros es la plataforma GBIF.


Contenido del post


Introducción

The Global Biodiversity Information Facility (GBIF), es una plataforma que cuenta con cientos de miles de registros de presencias tanto de flora como de fauna, registros que en su mayoría cuentan con coordenadas geográficas que son esencialmente importante para realizar el tipo de investigaciones que mencionamos anteriormente.

Así, GBIF tiene datos que dan evidencia de la presencia de una especie (u otro taxón) en un lugar determinado y en una fecha concreta. Estos datos se ofrecen en un formato estandarizado, permitiendo que queden accesibles para su libre consulta y uso de acuerdo con las licencias de uso establecidas.

Para hacer la descarga de tales registros se puede hacer de varias maneras, una de ellas es haciendo el respectivo registro en la página web (requiere usuario y contraseña), luego tenemos que ingresar el nombre científico de las especies de interes y el programa nos arroja el resultado de todos los registros, sin embargo, en muchas ocasiones el hacer la descarga se demora desde pocos minutos hasta varias horas (dependiendo del número de registros).

Este proceso lo podemos aprender en el siguiente video

Descarga de datos con rgbif

Otro camino para descargar la información es hacer uso del paquete rgbif de los desarrolladores Chamberlain S, Barve V, Mcglinn D, Oldoni D, Desmet P, Geffert L y Ram K (2022). Con el uso de este paquete el proceso de descarga de la información es mucho más rápido que por la misma página, además, nuestros datos ya estarían cargados para poder realizar las filtraciones de datos, análisis, mapas, entre otros análisis. Para poder conocer más acerca de este paquete, puedes consultar AQUÍ.


Igualmente utilizaremos otros paquetes necesarios para nuestra limpieza y visualización, los cuales mencionaremos a continuación

Paquete scrubr del desarrollador Chamberlain Scott (2022), el cual es un paquete especializado en la limpieza de los datos descargados como duplicados, coordenadas y/o fechas faltantes, entre otros. Para poder conocer más acerca de este paquete, puedes consultar AQUÍ.

Paquete maps, desarrollado por Richard A. Becker and Allan R. Wilks. R (2021), proporciona muchos contornos de mapas diferentes y puntos para ciudades, etc. Para poder conocer más acerca de este paquete, puedes consultar AQUÍ.

Paquete Tidyverse desarrollado por Wickham et al. (2019), es un conjunto de paquetes que funcionan en armonía porque comparten representaciones de datos comunes y diseño de API. El paquete Tidyverse está diseñado para facilitar la instalación y cargue los paquetes de núcleo de Tidyverse en un solo comando. Para poder conocer más acerca de este paquete, puedes consultar AQUÍ. Dentro del Tidyverse podemos encontrar el paquete ggplot2 para poder visualizar y modificar nuestro mapa.

Código en R

Primero cargamos los paquetes necesarios para poder descargar, limpiar y visualizar nuestros datos

library(rgbif)
library(maps)
library(tidyverse)

Ahora bien, para poder descagar datos hay dos vías o formas, una se basa en la descarga de datos para una sola categoría taxonómica y la otra para varias categorías taxonómicas.


Definida la especie con que vamos a trabajar, procedemos a utilizar la función occ_data del paquete rgbif, la cual realiza una búsqueda de ocurrencias del taxón o la especie en cuestión el el GBIF. Los argumentos de dicha función los podemos encontrar en la siguiente LINK. A continuación veremos algunos:

  • scientificName: Un nombre científico de la columna vertebral de GBIF. Todos los taxones incluidos y sinónimos se incluyen en la búsqueda.

  • country: El código de país de 2 letras (según ISO-3166-1) del país en el que se registró la ocurrencia. Mira Aquí

  • hasCoordinate: Retorna solo registros de ocurrencia con datos de latitud/longitud (TRUE) o todos los registros (FALSE)

  • recordedBy: La persona que registró la ocurrencia

  • identifiedByID: Nombre de la persona que proporcionó la identificación taxonómica de la ocurrencia.

  • elevation: Elevación en metros sobre el nivel del mar

  • stateProvince: El nombre de la siguiente región administrativa más pequeña que país (estado, provincia, cantón, departamento, región, etc.) en el que se produce la ubicación.

  • limit: Número de registros a retornar

Descargar datos de una categoría taxonómica en un país

En este ejercicio quiero saber la ocurrencia de la especie Onthophagus acuminatus en Colombia. O. acuminatus es una especie de escarabajo de la subfamilia Scarabaeinae, comunmente llamados escarabajos coprófagos o peloteros. Dicho escarabajo está ampliamente distribuido en la región andina y es uno de los escarabajos más abundantes en áreas protegidas y ambientes urbanos y semiurbanos, sin embargo, queremos revisar en que sitios se encuentra registrado y para cuales departamentos.


Guardamos el nombre de nuestra especie en una variable

myspecies <- c("Onthophagus acuminatus")

Descarga de datos

Ahora utilizamos la función occ_data para filtar las ocurrencias de O. acuminatus en Colombia, con un límite de 20000 ocurrencias y lo guardamos en la variable gbif_data. Recuerda que puedes filtrar también por departamentos.

gbif_data <- occ_data(scientificName = myspecies, 
                      country = 'CO', 
                      hasCoordinate = TRUE, 
                      limit = 20000)

Ahora corroboramos los datos descargados, nota que es una lista de gbif_data con dos elementos anidados meta, en el cual encontraremos datos de cantidades y data, en el cual encontraremos una tabla con todos los datos de las ocurrencias.


gbif_data$meta
## $offset
## [1] 1800
## 
## $limit
## [1] 40
## 
## $endOfRecords
## [1] TRUE
## 
## $count
## [1] 1840
names(gbif_data$data)
##   [1] "key"                            "scientificName"                
##   [3] "decimalLatitude"                "decimalLongitude"              
##   [5] "issues"                         "datasetKey"                    
##   [7] "publishingOrgKey"               "installationKey"               
##   [9] "hostingOrganizationKey"         "publishingCountry"             
##  [11] "protocol"                       "lastCrawled"                   
##  [13] "lastParsed"                     "crawlId"                       
##  [15] "basisOfRecord"                  "occurrenceStatus"              
##  [17] "lifeStage"                      "taxonKey"                      
##  [19] "kingdomKey"                     "phylumKey"                     
##  [21] "classKey"                       "orderKey"                      
##  [23] "familyKey"                      "genusKey"                      
##  [25] "speciesKey"                     "acceptedTaxonKey"              
##  [27] "acceptedScientificName"         "kingdom"                       
##  [29] "phylum"                         "order"                         
##  [31] "family"                         "genus"                         
##  [33] "species"                        "genericName"                   
##  [35] "specificEpithet"                "taxonRank"                     
##  [37] "taxonomicStatus"                "iucnRedListCategory"           
##  [39] "dateIdentified"                 "elevation"                     
##  [41] "elevationAccuracy"              "continent"                     
##  [43] "stateProvince"                  "year"                          
##  [45] "month"                          "day"                           
##  [47] "eventDate"                      "startDayOfYear"                
##  [49] "endDayOfYear"                   "lastInterpreted"               
##  [51] "license"                        "organismQuantity"              
##  [53] "isSequenced"                    "isInCluster"                   
##  [55] "recordedBy"                     "identifiedBy"                  
##  [57] "preparations"                   "samplingProtocol"              
##  [59] "geodeticDatum"                  "class"                         
##  [61] "countryCode"                    "gbifRegion"                    
##  [63] "country"                        "publishedByGbifRegion"         
##  [65] "identifier"                     "recordNumber"                  
##  [67] "catalogNumber"                  "habitat"                       
##  [69] "institutionCode"                "county"                        
##  [71] "locality"                       "eventRemarks"                  
##  [73] "gbifID"                         "collectionCode"                
##  [75] "occurrenceID"                   "projectId"                     
##  [77] "coordinateUncertaintyInMeters"  "organismQuantityType"          
##  [79] "sampleSizeUnit"                 "sampleSizeValue"               
##  [81] "eventID"                        "dynamicProperties"             
##  [83] "verbatimSRS"                    "samplingEffort"                
##  [85] "verbatimCoordinateSystem"       "type"                          
##  [87] "locationRemarks"                "eventTime"                     
##  [89] "parentEventID"                  "higherClassification"          
##  [91] "individualCount"                "verbatimEventDate"             
##  [93] "institutionID"                  "municipality"                  
##  [95] "language"                       "disposition"                   
##  [97] "collectionID"                   "sex"                           
##  [99] "networkKeys"                    "georeferenceProtocol"          
## [101] "datasetID"                      "datasetName"                   
## [103] "identificationReferences"       "vernacularName"                
## [105] "organismID"                     "name"                          
## [107] "georeferencedBy"                "rightsHolder"                  
## [109] "previousIdentifications"        "ownerInstitutionCode"          
## [111] "occurrenceRemarks"              "accessRights"                  
## [113] "verbatimElevation"              "coordinatePrecision"           
## [115] "otherCatalogNumbers"            "fieldNumber"                   
## [117] "higherGeography"                "institutionKey"                
## [119] "collectionKey"                  "georeferencedDate"             
## [121] "georeferenceVerificationStatus" "georeferenceRemarks"           
## [123] "georeferenceSources"            "modified"                      
## [125] "verbatimLocality"               "materialSampleID"              
## [127] "reproductiveCondition"          "subfamily"                     
## [129] "verbatimIdentification"         "identificationRemarks"

Limpieza de datos

Luego de descargados los datos de la plataforma, ya podemos empezar a seleccionarlos, filtrarlos y dejarlos más organizados. En este ejercicio, vamos a seleccionar las columnas de nombre científico, coordenadas, elevación y departamento de las ocurrencias descargadas.

myspecies_coords <- gbif_data$data[ , c("scientificName",
                                        "decimalLongitude", 
                                        "decimalLatitude", 
                                        "elevation",
                                        "stateProvince")]
head(myspecies_coords)
## # A tibble: 6 × 5
##   scientificName        decimalLongitude decimalLatitude elevation stateProvince
##   <chr>                            <dbl>           <dbl>     <dbl> <chr>        
## 1 Onthophagus acuminat…            -73.7            7.30      99.8 Santander    
## 2 Onthophagus acuminat…            -73.7            7.30      98.0 Santander    
## 3 Onthophagus acuminat…            -73.7            7.30     105.  Santander    
## 4 Onthophagus acuminat…            -73.7            7.30     102.  Santander    
## 5 Onthophagus acuminat…            -73.7            7.30     102.  Santander    
## 6 Onthophagus acuminat…            -73.7            7.30      99.4 Santander

También podemos observar un resumen de los datos, como cantidad, departamentos de las ocurrencias, entre otros.

# Conoceremos la cantidad de registros
dim(myspecies_coords)[1]
## [1] 1840
# Cantidad de datos por departamento
myspecies_coords  %>%
    count(stateProvince, sort = TRUE)
## # A tibble: 17 × 2
##    stateProvince       n
##    <chr>           <int>
##  1 Sucre             766
##  2 Santander         541
##  3 La Guajira        141
##  4 Huila              92
##  5 Chocó              57
##  6 Bolívar            40
##  7 Tolima             40
##  8 Antioquia          37
##  9 Valle del Cauca    37
## 10 Magdalena          33
## 11 Quindío            28
## 12 Cundinamarca        9
## 13 Nariño              7
## 14 Cesar               6
## 15 Boyacá              3
## 16 Risaralda           2
## 17 Córdoba             1

Ahora guardaremos nuestros datos en un archivo tipo csv para poder tener la información en nuestra computadora.

write.csv(myspecies_coords, 'species.csv', row.names = TRUE)

Mapeo de ocurrencias

Ahora realizaremos nuestro mapa de ocurrencias de la especie en cuestión, para ello utilizaremos la función getData para cargar la capa de división por departamentos para Colombia (Level = 1).


shp <- raster::getData('GADM', country = 'COL', level = 1)

Al igual, utilizaremos el paquete ggplot2 con el fin de visualizar nuestros datos.

mapa <- ggplot() +
  geom_point(data = myspecies_coords, 
             aes(x = decimalLongitude, y = decimalLatitude), 
             color = 'black') +
  geom_polygon(data = shp, aes(x = long, y = lat, group = group), 
               color = 'grey', fill = NA) +
  coord_fixed(ylim = c(-5, 12.5), xlim = c(-80, -67)) +
  xlab('Longitud') +
  ylab('Latitud') +
  theme(axis.title.y = element_text(size = 17),
        axis.title.x = element_text(size = 17),
        axis.text.y = element_text(size = 13),
        axis.text.x = element_text(size = 13))+
  theme_bw()

mapa

Mapa 1. Mapa de ocurrencias de O. acuminatus en Colombia.

Guardamos nuestro mapa de ocurrencias

png("mapa.png", width = 1800, height = 1800, res = 140)
print(mapa)
dev.off()

Citaciones

Finalmente obtenemos la citación de las ocurrencias

gbif_citation(gbif_data)
## Warning: gbif_citation() for occ_search() and occ_data() is deprecated. 
## Use rgbif::occ_download() or rgbif::derived_dataset() instead.
## [[1]]
## <<rgbif citation>>
##    Citation: Borja-Acosta K G, Neita-Moreno J (2024). Colección de Entomología
##         del Instituto de Investigación de Recursos Biológicos Alexander von
##         Humboldt (IAvH-E). Version 2.12. Instituto de Investigación de Recursos
##         Biológicos Alexander von Humboldt. Occurrence dataset
##         https://doi.org/10.15472/vmpedy accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[2]]
## <<rgbif citation>>
##    Citation: Instituto de Investigación de Recursos Biológicos Alexander von
##         Humboldt, Agencia Nacional de Hidrocarburos (2022). Línea base general
##         de escarabajos para el valle medio del Magdalena - VMM. Version 1.2.
##         Instituto de Investigación de Recursos Biológicos Alexander von
##         Humboldt. Sampling event dataset https://doi.org/10.15472/lgpfm7
##         accessed via GBIF.org on 2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[3]]
## <<rgbif citation>>
##    Citation: Carvajal Cogollo J E, Morales Alba A F, Martínez Dueñas D C,
##         Quiroga Huertas K A, Bello Guio G, Eguis Avendaño J A, García Monroy J
##         S, Gómez Camargo J, Serrato Rivera Y G, Peña Ramírez L J, Pineda
##         Cendales S, Morales González Ó E, Higuera Rojas D F, Sarmiento Garavito
##         L P, Pérez Gómez D K, Morales González O E (2022). Caracterización de
##         fauna en diferentes gradientes altitudinales del departamento de
##         Boyacá, Colombia. Version 1.5. Universidad Pedagógica y Tecnológica de
##         Colombia. Occurrence dataset https://doi.org/10.15472/glb3hd accessed
##         via GBIF.org on 2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by/4.0/legalcode
## 
## [[4]]
## <<rgbif citation>>
##    Citation: Ecopetrol. S.A., Instituto de Investigación de Recursos Biológicos
##         Alexander von Humboldt (2022). Entomofauna de la Ecoreserva La Tribuna
##         (Neiva, Huila) - Proyecto FIBRAS. Version 1.1. Instituto de
##         Investigación de Recursos Biológicos Alexander von Humboldt. Occurrence
##         dataset https://doi.org/10.15472/yr14ff accessed via GBIF.org on
##         2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[5]]
## <<rgbif citation>>
##    Citation: Martínez Silva P, Gutiérrez Bautista H H (2020). Coleópteros
##         presentes en un proceso de restauración pasiva en bosque seco tropical.
##         Version 2.2. Corporación Universitaria del Huila. Occurrence dataset
##         https://doi.org/10.15472/2qq6hc accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[6]]
## <<rgbif citation>>
##    Citation: Neita J C, Borja-Acosta K (2021). Insectos del municipio
##         Cimitarra, Santander - Proyecto Santander BIO. Version 1.2. Instituto
##         de Investigación de Recursos Biológicos Alexander von Humboldt.
##         Occurrence dataset https://doi.org/10.15472/po6pzh accessed via
##         GBIF.org on 2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[7]]
## <<rgbif citation>>
##    Citation: Lopera A, Lizcano D J (2021). Registros biológicos asociados al
##         monitoreo de la diversidad de escarabajos en paisajes ganaderos de
##         bosque 2013 - 2017. Asociación GAICA. Occurrence dataset
##         https://doi.org/10.15472/6ttvzs accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[8]]
## <<rgbif citation>>
##    Citation: Mendivil Nieto J A, Giraldo Echeverri C, Quevedo Vega C J (2022).
##         Escarabajos estercoleros asociados a sistemas de ganadería sostenible
##         en diferentes regiones de Colombia. Version 2.4. Fundación Centro para
##         la Investigación en Sistemas Sostenibles de Producción Agropecuaria -
##         Cipav. Occurrence dataset https://doi.org/10.15472/yje84v accessed via
##         GBIF.org on 2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/publicdomain/zero/1.0/legalcode
## 
## [[9]]
## <<rgbif citation>>
##    Citation: Murillo Barahona D A, Rengifo Murillo L (2023). Colección
##         Entomológica de la Universidad Tecnológica del Chocó. Version 6.5.
##         Universidad Tecnológica del Chocó. Occurrence dataset
##         https://doi.org/10.15472/rmbpsh accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/publicdomain/zero/1.0/legalcode
## 
## [[10]]
## <<rgbif citation>>
##    Citation: Lopera A, Quintana Vargas A (2021). Coleópteros de los bosques
##         montanos del Oriente Antioqueño, Cañón del río Melcocho, en el
##         municipio de El Carmen de Viboral, Antioquia - Proyecto Colombia BIO.
##         Version 1.3. Instituto de Investigación de Recursos Biológicos
##         Alexander von Humboldt. Occurrence dataset
##         https://doi.org/10.15472/npzc22 accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[11]]
## <<rgbif citation>>
##    Citation: Borja-Acosta K G, Leyton Ramos L M (2024). Colección de Tejidos
##         del Instituto de Investigación de Recursos Biológicos Alexander von
##         Humboldt (IAvH-CT). Version 20.9. Instituto de Investigación de
##         Recursos Biológicos Alexander von Humboldt. Occurrence dataset
##         https://doi.org/10.15472/9uddlh accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[12]]
## <<rgbif citation>>
##    Citation: Bonell Rojas W Y (2018). Caracterización biológica en la Serranía
##         de San Lucas 2015. Version 2.0. Parques Nacionales Naturales de
##         Colombia. Occurrence dataset https://doi.org/10.15472/uarl1x accessed
##         via GBIF.org on 2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[13]]
## <<rgbif citation>>
##    Citation: Ramirez Hernandez L M (2019). Estudio de Biodiversidad Mina
##         Calenturitas, Temporada de Lluvias. INERCO Consultoría Colombia.
##         Occurrence dataset https://doi.org/10.15472/uecnoz accessed via
##         GBIF.org on 2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by/4.0/legalcode
## 
## [[14]]
## <<rgbif citation>>
##    Citation: Quintana Vargas A (2021). Biodiversidad de un bosque seco tropical
##         del Valle Medio del río Magdalena: evaluación integrada a través de
##         multitaxones. Version 1.2. Instituto de Investigación de Recursos
##         Biológicos Alexander von Humboldt. Occurrence dataset
##         https://doi.org/10.15472/ptmv1d accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[15]]
## <<rgbif citation>>
##    Citation: Guañarita Bañol A M (2021). Caracterizaciones rápidas de
##         biodiversidad en grupos biológicos de la planicie del valle del río
##         Cauca. Version 4.2. Universidad Icesi. Occurrence dataset
##         https://doi.org/10.15472/dbjjay accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[16]]
## <<rgbif citation>>
##    Citation: Hurtado Guerra A M (2020). Caracterización biológica de la ventana
##         Beltrán, corregimiento Paquiló, Municipio de Beltrán, Cundinamarca.
##         Version 2.4. Instituto de Investigación de Recursos Biológicos
##         Alexander von Humboldt. Occurrence dataset
##         https://doi.org/10.15472/hr8ml2 accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[17]]
## <<rgbif citation>>
##    Citation: González A (2021). Escarabajos coprófagos (Coleoptera:
##         Scarabaeidae: Scarabaeinae) de bosques secos Colombianos de la
##         Colección Entomológica del Instituto Alexander von Humboldt. Version
##         4.5. Instituto de Investigación de Recursos Biológicos Alexander von
##         Humboldt. Occurrence dataset https://doi.org/10.15472/hjh6ys accessed
##         via GBIF.org on 2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[18]]
## <<rgbif citation>>
##    Citation: Vergara Navarro E V, González Almario C, Sandoval Caceres Y P
##         (2022). Colección Taxonómica Nacional de Insectos “Luis María Murillo”
##         (CTNI). Version 2.6. Corporación Colombiana de Investigación
##         Agropecuaria - AGROSAVIA. Occurrence dataset
##         https://doi.org/10.15472/fvudyo accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[19]]
## <<rgbif citation>>
##    Citation: León González J (2021). Escarabajos coprófagos (Scarabaeidae:
##         Scarabaeinae) del eje cafetero Colombiano. Version 7.3. Instituto de
##         Investigación de Recursos Biológicos Alexander von Humboldt. Occurrence
##         dataset https://doi.org/10.15472/dm9u19 accessed via GBIF.org on
##         2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[20]]
## <<rgbif citation>>
##    Citation: Jaramillo N, Marín J D, Wolff Echeverri M, Duque Veléz P, Veléz
##         Bravo A, Jaramillo J G (2023). Colección Entomológica de Piedras
##         Blancas. Version 2.6. Museo Entomológico de Comfenalco - Antioquia.
##         Occurrence dataset https://doi.org/10.15472/xblw2v accessed via
##         GBIF.org on 2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by/4.0/legalcode

Descargar datos de varias categorías taxonómicas en una rango de coordenadas

En este ejercicio quiero saber la ocurrencia de las especies de escarabajos coprófagos en Colombia. Dicho escarabajos están ampliamente distribuidos en Colombia, sin embargo, queremos revisar en que sitios se encuentran registrados en un rango de coordenadas específico.


Guardamos el nombre de nuestra especie en una variable

myspecies2 <- c("Sulcophanaeus noctis", "Phanaeus meleagris", 
               "Onthophagus bidentatus", "Ontherus kirschii", 
               "Copris susanae")

Descarga de datos

Ahora utilizamos la función occ_data para filtar las ocurrencias de algunas especies de escarabajos coprófagos en Colombia, con un límite de 20000 ocurrencias y lo guardamos en la variable gbif_data. Recuerda que puedes filtrar también por departamentos.

gbif_data2 <- occ_data(scientificName = myspecies2, 
                      hasCoordinate = TRUE, 
                      limit = 20000, 
                      decimalLongitude = "-76, -74", 
                      decimalLatitude = "3, 8")

Ahora corroboramos los datos descargados, nota que es una lista de gbif_data con dos elementos anidados meta, en el cual encontraremos datos de cantidades y data, en el cual encontraremos una tabla con todos los datos de las ocurrencias, asimismo, podrás notar que hay más elementos, esto es debido a que tenemos un conjunto de datos para cada especie seleccionada.


names(gbif_data2)
## [1] "Sulcophanaeus noctis"   "Phanaeus meleagris"     "Onthophagus bidentatus"
## [4] "Ontherus kirschii"      "Copris susanae"
names(gbif_data2[[myspecies2[1]]])
## [1] "meta" "data"
names(gbif_data2[[myspecies2[1]]]$meta)
## [1] "offset"       "limit"        "endOfRecords" "count"
names(gbif_data2[[myspecies2[1]]]$data)
##   [1] "key"                      "scientificName"          
##   [3] "decimalLatitude"          "decimalLongitude"        
##   [5] "issues"                   "datasetKey"              
##   [7] "publishingOrgKey"         "installationKey"         
##   [9] "hostingOrganizationKey"   "publishingCountry"       
##  [11] "protocol"                 "lastCrawled"             
##  [13] "lastParsed"               "crawlId"                 
##  [15] "projectId"                "basisOfRecord"           
##  [17] "individualCount"          "occurrenceStatus"        
##  [19] "sex"                      "lifeStage"               
##  [21] "taxonKey"                 "kingdomKey"              
##  [23] "phylumKey"                "classKey"                
##  [25] "orderKey"                 "familyKey"               
##  [27] "genusKey"                 "speciesKey"              
##  [29] "acceptedTaxonKey"         "acceptedScientificName"  
##  [31] "kingdom"                  "phylum"                  
##  [33] "order"                    "family"                  
##  [35] "genus"                    "species"                 
##  [37] "genericName"              "specificEpithet"         
##  [39] "taxonRank"                "taxonomicStatus"         
##  [41] "iucnRedListCategory"      "dateIdentified"          
##  [43] "elevation"                "elevationAccuracy"       
##  [45] "continent"                "stateProvince"           
##  [47] "year"                     "month"                   
##  [49] "day"                      "eventDate"               
##  [51] "startDayOfYear"           "endDayOfYear"            
##  [53] "lastInterpreted"          "license"                 
##  [55] "isSequenced"              "isInCluster"             
##  [57] "recordedBy"               "identifiedBy"            
##  [59] "preparations"             "samplingProtocol"        
##  [61] "geodeticDatum"            "class"                   
##  [63] "countryCode"              "gbifRegion"              
##  [65] "country"                  "publishedByGbifRegion"   
##  [67] "identifier"               "recordNumber"            
##  [69] "habitat"                  "verbatimEventDate"       
##  [71] "institutionID"            "county"                  
##  [73] "locality"                 "municipality"            
##  [75] "verbatimCoordinateSystem" "gbifID"                  
##  [77] "language"                 "collectionCode"          
##  [79] "occurrenceID"             "type"                    
##  [81] "catalogNumber"            "disposition"             
##  [83] "institutionCode"          "collectionID"            
##  [85] "organismQuantity"         "organismQuantityType"    
##  [87] "georeferenceProtocol"     "dynamicProperties"       
##  [89] "verbatimSRS"              "samplingEffort"          
##  [91] "vernacularName"           "eventTime"               
##  [93] "identificationRemarks"    "eventRemarks"            
##  [95] "georeferencedBy"          "modified"                
##  [97] "datasetID"                "datasetName"             
##  [99] "verbatimLocality"         "locationRemarks"         
## [101] "occurrenceRemarks"        "verbatimElevation"       
## [103] "georeferenceRemarks"      "name"

Limpieza de datos

Luego de descargados los datos de la plataforma, ya podemos empezar a seleccionarlos, filtrarlos y dejarlos más organizados. En este ejercicio, vamos a seleccionar las columnas de nombre científico, coordenadas, elevación y departamento de las ocurrencias descargadas.

df_final = data.frame()
for (s in 1:length(myspecies2)) {
  if(is.null(gbif_data2[[s]]$data)==FALSE){
    coords <- gbif_data2[[s]]$data[ , c("scientificName", "decimalLongitude", 
                                       "decimalLatitude", "stateProvince")]
    df_final <- rbind(df_final, coords)
  }
}
head(df_final)
## # A tibble: 6 × 4
##   scientificName                  decimalLongitude decimalLatitude stateProvince
##   <chr>                                      <dbl>           <dbl> <chr>        
## 1 Sulcophanaeus noctis (Bates, 1…            -74.3            5.84 Boyacá       
## 2 Sulcophanaeus noctis (Bates, 1…            -74.3            5.84 Boyacá       
## 3 Sulcophanaeus noctis (Bates, 1…            -74.3            5.84 Boyacá       
## 4 Sulcophanaeus noctis (Bates, 1…            -74.3            5.84 Boyacá       
## 5 Sulcophanaeus noctis (Bates, 1…            -74.3            5.84 Boyacá       
## 6 Sulcophanaeus noctis (Bates, 1…            -74.3            5.84 Boyacá

También podemos observar un resumen de los datos, como cantidad, departamentos de las ocurrencias, entre otros

# Conoceremos la cantidad de registros
dim(df_final)[1]
## [1] 135
# Cantidad de datos por departamento
df_final  %>%
  group_by(scientificName) %>%
    count(stateProvince, sort = TRUE)
## # A tibble: 14 × 3
## # Groups:   scientificName [4]
##    scientificName                        stateProvince     n
##    <chr>                                 <chr>         <int>
##  1 Sulcophanaeus noctis (Bates, 1887)    Santander        30
##  2 Phanaeus meleagris Blanchard, 1845    Boyacá           28
##  3 Sulcophanaeus noctis (Bates, 1887)    Antioquia        24
##  4 Phanaeus meleagris Blanchard, 1845    Santander        14
##  5 Onthophagus bidentatus Drapiez, 1819  Santander        10
##  6 Sulcophanaeus noctis (Bates, 1887)    Boyacá            7
##  7 Phanaeus meleagris Blanchard, 1845    Antioquia         6
##  8 Copris susanae Darling & Génier, 2018 Cundinamarca      5
##  9 Copris susanae Darling & Génier, 2018 Boyacá            4
## 10 Sulcophanaeus noctis (Bates, 1887)    Bolívar           2
## 11 Sulcophanaeus noctis (Bates, 1887)    Tolima            2
## 12 Onthophagus bidentatus Drapiez, 1819  Cundinamarca      1
## 13 Phanaeus meleagris Blanchard, 1845    Quindío           1
## 14 Sulcophanaeus noctis (Bates, 1887)    Caldas            1

Ahora guardaremos nuestros datos en un archivo csv para poder tener la información en nuestra computadora.


write.csv(df_final, 'species.csv', row.names = TRUE)

Mapeo de ocurrencias

Ahora realizaremos nuestro mapa de ocurrencias de la especie en cuestión, para ello utilizaremos la función getData para cargar la capa de división por departamentos para Colombia (Level = 1).

shp <- raster::getData('GADM', country = 'COL', level = 1)

Al igual, utilizaremos el paquete ggplot2 con el fin de visualizar nuestros datos.

mapa2 <- ggplot() +
  geom_point(data = df_final, 
             aes(x = decimalLongitude, y = decimalLatitude, 
                 shape = scientificName), 
             color = 'black') +
  geom_polygon(data = shp, aes(x = long, y = lat, group = group), 
               color = 'grey', fill = NA) +
  coord_fixed(ylim = c(2.5, 8.5), xlim = c(-76.5, -73.5)) +
  xlab('Longitud') +
  ylab('Latitud') +
  theme(axis.title.y = element_text(size = 17),
        axis.title.x = element_text(size = 17),
        axis.text.y = element_text(size = 13),
        axis.text.x = element_text(size = 13))+
  labs(shape = "Especies")+
  theme_bw()+
  theme(legend.text = element_text(face = "italic"))

mapa2

Mapa 2. Mapa de ocurrencias de cinco (5) especies de escarabajos coprófagos en una región de Colombia.


Guardamos nuestro mapa de ocurrencias

png("mapa2.png", width = 1800, height = 1800, res = 140)
print(mapa2)
dev.off()

Citaciones

Finalmente obtenemos la citación de las ocurrencias

gbif_citation(gbif_data)
## Warning: gbif_citation() for occ_search() and occ_data() is deprecated. 
## Use rgbif::occ_download() or rgbif::derived_dataset() instead.
## [[1]]
## <<rgbif citation>>
##    Citation: Borja-Acosta K G, Neita-Moreno J (2024). Colección de Entomología
##         del Instituto de Investigación de Recursos Biológicos Alexander von
##         Humboldt (IAvH-E). Version 2.12. Instituto de Investigación de Recursos
##         Biológicos Alexander von Humboldt. Occurrence dataset
##         https://doi.org/10.15472/vmpedy accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[2]]
## <<rgbif citation>>
##    Citation: Instituto de Investigación de Recursos Biológicos Alexander von
##         Humboldt, Agencia Nacional de Hidrocarburos (2022). Línea base general
##         de escarabajos para el valle medio del Magdalena - VMM. Version 1.2.
##         Instituto de Investigación de Recursos Biológicos Alexander von
##         Humboldt. Sampling event dataset https://doi.org/10.15472/lgpfm7
##         accessed via GBIF.org on 2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[3]]
## <<rgbif citation>>
##    Citation: Carvajal Cogollo J E, Morales Alba A F, Martínez Dueñas D C,
##         Quiroga Huertas K A, Bello Guio G, Eguis Avendaño J A, García Monroy J
##         S, Gómez Camargo J, Serrato Rivera Y G, Peña Ramírez L J, Pineda
##         Cendales S, Morales González Ó E, Higuera Rojas D F, Sarmiento Garavito
##         L P, Pérez Gómez D K, Morales González O E (2022). Caracterización de
##         fauna en diferentes gradientes altitudinales del departamento de
##         Boyacá, Colombia. Version 1.5. Universidad Pedagógica y Tecnológica de
##         Colombia. Occurrence dataset https://doi.org/10.15472/glb3hd accessed
##         via GBIF.org on 2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by/4.0/legalcode
## 
## [[4]]
## <<rgbif citation>>
##    Citation: Ecopetrol. S.A., Instituto de Investigación de Recursos Biológicos
##         Alexander von Humboldt (2022). Entomofauna de la Ecoreserva La Tribuna
##         (Neiva, Huila) - Proyecto FIBRAS. Version 1.1. Instituto de
##         Investigación de Recursos Biológicos Alexander von Humboldt. Occurrence
##         dataset https://doi.org/10.15472/yr14ff accessed via GBIF.org on
##         2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[5]]
## <<rgbif citation>>
##    Citation: Martínez Silva P, Gutiérrez Bautista H H (2020). Coleópteros
##         presentes en un proceso de restauración pasiva en bosque seco tropical.
##         Version 2.2. Corporación Universitaria del Huila. Occurrence dataset
##         https://doi.org/10.15472/2qq6hc accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[6]]
## <<rgbif citation>>
##    Citation: Neita J C, Borja-Acosta K (2021). Insectos del municipio
##         Cimitarra, Santander - Proyecto Santander BIO. Version 1.2. Instituto
##         de Investigación de Recursos Biológicos Alexander von Humboldt.
##         Occurrence dataset https://doi.org/10.15472/po6pzh accessed via
##         GBIF.org on 2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[7]]
## <<rgbif citation>>
##    Citation: Lopera A, Lizcano D J (2021). Registros biológicos asociados al
##         monitoreo de la diversidad de escarabajos en paisajes ganaderos de
##         bosque 2013 - 2017. Asociación GAICA. Occurrence dataset
##         https://doi.org/10.15472/6ttvzs accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[8]]
## <<rgbif citation>>
##    Citation: Mendivil Nieto J A, Giraldo Echeverri C, Quevedo Vega C J (2022).
##         Escarabajos estercoleros asociados a sistemas de ganadería sostenible
##         en diferentes regiones de Colombia. Version 2.4. Fundación Centro para
##         la Investigación en Sistemas Sostenibles de Producción Agropecuaria -
##         Cipav. Occurrence dataset https://doi.org/10.15472/yje84v accessed via
##         GBIF.org on 2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/publicdomain/zero/1.0/legalcode
## 
## [[9]]
## <<rgbif citation>>
##    Citation: Murillo Barahona D A, Rengifo Murillo L (2023). Colección
##         Entomológica de la Universidad Tecnológica del Chocó. Version 6.5.
##         Universidad Tecnológica del Chocó. Occurrence dataset
##         https://doi.org/10.15472/rmbpsh accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/publicdomain/zero/1.0/legalcode
## 
## [[10]]
## <<rgbif citation>>
##    Citation: Lopera A, Quintana Vargas A (2021). Coleópteros de los bosques
##         montanos del Oriente Antioqueño, Cañón del río Melcocho, en el
##         municipio de El Carmen de Viboral, Antioquia - Proyecto Colombia BIO.
##         Version 1.3. Instituto de Investigación de Recursos Biológicos
##         Alexander von Humboldt. Occurrence dataset
##         https://doi.org/10.15472/npzc22 accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[11]]
## <<rgbif citation>>
##    Citation: Borja-Acosta K G, Leyton Ramos L M (2024). Colección de Tejidos
##         del Instituto de Investigación de Recursos Biológicos Alexander von
##         Humboldt (IAvH-CT). Version 20.9. Instituto de Investigación de
##         Recursos Biológicos Alexander von Humboldt. Occurrence dataset
##         https://doi.org/10.15472/9uddlh accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[12]]
## <<rgbif citation>>
##    Citation: Bonell Rojas W Y (2018). Caracterización biológica en la Serranía
##         de San Lucas 2015. Version 2.0. Parques Nacionales Naturales de
##         Colombia. Occurrence dataset https://doi.org/10.15472/uarl1x accessed
##         via GBIF.org on 2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[13]]
## <<rgbif citation>>
##    Citation: Ramirez Hernandez L M (2019). Estudio de Biodiversidad Mina
##         Calenturitas, Temporada de Lluvias. INERCO Consultoría Colombia.
##         Occurrence dataset https://doi.org/10.15472/uecnoz accessed via
##         GBIF.org on 2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by/4.0/legalcode
## 
## [[14]]
## <<rgbif citation>>
##    Citation: Quintana Vargas A (2021). Biodiversidad de un bosque seco tropical
##         del Valle Medio del río Magdalena: evaluación integrada a través de
##         multitaxones. Version 1.2. Instituto de Investigación de Recursos
##         Biológicos Alexander von Humboldt. Occurrence dataset
##         https://doi.org/10.15472/ptmv1d accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[15]]
## <<rgbif citation>>
##    Citation: Guañarita Bañol A M (2021). Caracterizaciones rápidas de
##         biodiversidad en grupos biológicos de la planicie del valle del río
##         Cauca. Version 4.2. Universidad Icesi. Occurrence dataset
##         https://doi.org/10.15472/dbjjay accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[16]]
## <<rgbif citation>>
##    Citation: Hurtado Guerra A M (2020). Caracterización biológica de la ventana
##         Beltrán, corregimiento Paquiló, Municipio de Beltrán, Cundinamarca.
##         Version 2.4. Instituto de Investigación de Recursos Biológicos
##         Alexander von Humboldt. Occurrence dataset
##         https://doi.org/10.15472/hr8ml2 accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[17]]
## <<rgbif citation>>
##    Citation: González A (2021). Escarabajos coprófagos (Coleoptera:
##         Scarabaeidae: Scarabaeinae) de bosques secos Colombianos de la
##         Colección Entomológica del Instituto Alexander von Humboldt. Version
##         4.5. Instituto de Investigación de Recursos Biológicos Alexander von
##         Humboldt. Occurrence dataset https://doi.org/10.15472/hjh6ys accessed
##         via GBIF.org on 2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[18]]
## <<rgbif citation>>
##    Citation: Vergara Navarro E V, González Almario C, Sandoval Caceres Y P
##         (2022). Colección Taxonómica Nacional de Insectos “Luis María Murillo”
##         (CTNI). Version 2.6. Corporación Colombiana de Investigación
##         Agropecuaria - AGROSAVIA. Occurrence dataset
##         https://doi.org/10.15472/fvudyo accessed via GBIF.org on 2024-02-05..
##         Accessed from R via rgbif (https://github.com/ropensci/rgbif) on
##         2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[19]]
## <<rgbif citation>>
##    Citation: León González J (2021). Escarabajos coprófagos (Scarabaeidae:
##         Scarabaeinae) del eje cafetero Colombiano. Version 7.3. Instituto de
##         Investigación de Recursos Biológicos Alexander von Humboldt. Occurrence
##         dataset https://doi.org/10.15472/dm9u19 accessed via GBIF.org on
##         2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by-nc/4.0/legalcode
## 
## [[20]]
## <<rgbif citation>>
##    Citation: Jaramillo N, Marín J D, Wolff Echeverri M, Duque Veléz P, Veléz
##         Bravo A, Jaramillo J G (2023). Colección Entomológica de Piedras
##         Blancas. Version 2.6. Museo Entomológico de Comfenalco - Antioquia.
##         Occurrence dataset https://doi.org/10.15472/xblw2v accessed via
##         GBIF.org on 2024-02-05.. Accessed from R via rgbif
##         (https://github.com/ropensci/rgbif) on 2024-02-05
##    Rights: http://creativecommons.org/licenses/by/4.0/legalcode

Resumen

En este post pudimos aprender como descargar, limpiar y visualizar las ocurrencias sobre los taxones de nuestro interes. Recuerda que puedes explorar más estas herramientas con el fin de responder tus propias preguntas de investigación.

Aprendimos igual que podemos realizar el análisis en una región, departamento, país, continente o a nivel global, es solo modificar algunas líneas en nuestro código y ¡voilá!

No siendo más, nos despedimos no sin antes deseando poder encontrarnos de nuevo en algún momento, mientras ¡sean felices!


Más información

Estos análisis se han realizado utilizando el software R (v.4.1.0) y Rstudio (v. 1.4.1717)

Recuerda que todos nuestros códigos están almacenados en GitHub