# Versión de R
R.version.string[1] "R version 4.3.2 (2023-10-31 ucrt)"
Caso de estudio de EVM
FIESTA es una biblioteca de software para análisis de datos de inventarios forestales. En este documento se explica el uso de FIESTA mediante un caso de ejemplo basado en un conjunto de datos interpretados por funcionarios e investigadores de instituciones que forman parte de la Mesa de Monitoreo por Puntos de SIMOCUTE.
FIESTA (Forest Inventory Estimation and Analysis) es una biblioteca de software, desarrollada en el lenguaje de programación R, para el análisis de datos de inventarios forestales basados en muestras. Fue desarrollada por el Programa de Inventario y Análisis Forestal (FIA) del Servicio Forestal del Departamento de Agricultura (USDA) de los Estados Unidos.
En este documento se detalla el análisis, mediante FIESTA, de un conjunto de datos de 26125 puntos de muestreo de 1045 parcelas de monitoreo, ubicadas en la zona norte de Costa Rica. Estos datos provienen de un ejercicio de interpretación de puntos de muestreo, realizado en el marco del Sistema Nacional de Monitoreo del Uso, Cobertura y Ecosistemas de Costa Rica (SIMOCUTE), en el cual participaron 26 investigadores y funcionarios de diferentes instituciones y organizaciones que forman parte de la Mesa de Monitoreo por Puntos. La interpretación se realizó con la plataforma Collect Earth Online, un sistema colaborativo para la interpretación de imágenes satelitales.
Para cada punto se interpretaron las variables:
La interpretación se realizó en dos tiempos:
El documento fue desarrollado en el sistema de publicación técnica y científica Quarto, el cual combina código en R y sus salidas (tablas, gráficos, mapas) con texto en Markdown.
Para trabajar con FIESTA, se debe instalar:
De acuerdo con su documentación, la versión mínima de R que requiere FIESTA, a la fecha de escritura de este documento (2023-12-02), es la 4.2.0. Puede consultar la versión de su instalación al ejecutar el siguiente comando en la consola de R:
La salida del comando anterior debe indicar que la versión de su instalación de R es mayor o igual a 4.2.0.
El paquete FIESTA está disponible en CRAN (Comprehensive R Archive Network), un repositorio en línea que alberga una amplia colección de paquetes y extensiones para el lenguaje de programación R, lo que facilita su instalación y actualización a nuevas versiones.
Para usar FIESTA, debe instalarse primero. Puede utilizar la función install.packages().
El resultado de la instalación puede verificarse al cargar el paquete con la función library().
Si el comando anterior no genera ningún mensaje de error, FIESTA debe haberse instalado adecuadamente.
Además de FIESTA, se recomienda instalar los siguientes paquetes para procesamiento y visualización de datos.
# Paquete para el desarrollo de documentos computacionales
install.packages("rmarkdown")
# Colección de paquetes para análisis de datos
install.packages("tidyverse")
# Estilos para gráficos de tidyverse
install.packages("ggthemes")
# Paquete para limpieza de datos
install.packages("janitor")
# Paquete para tablas interactivas
install.packages("DT")
# Paquete para graficación interactiva
install.packages("plotly")
# Paquete para mapas interactivos
install.packages("leaflet")
# Funciones adicionales para leaflet
install.packages("leaflet.extras")
# Funciones adicionales para leaflet
install.packages("leafem")Luego de instalarlos, debe cargar los paquetes con la función library().
Este documento, junto con otros similares, forma parte de un repositorio en GitHub, una plataforma en línea para compartir código fuente de aplicaciones, basada en el sistema de control de versiones Git. El repositorio contiene el código fuente del documento y los datos que se utilizan en los ejemplos. Su dirección es https://github.com/mesa-monitoreo-puntos/fiesta.
Puede descargar el repositorio, como un archivo ZIP, de https://github.com/mesa-monitoreo-puntos/fiesta/archive/refs/heads/main.zip
También puede “clonar” el repositorio mediante el comando clone de Git:
# Clonación de este repositorio
git clone https://github.com/mesa-monitoreo-puntos/fiesta.git
Una vez que el repositorio haya sido descargado o clonado, puede abrirse con RStudio o con otra herramienta de desarrollo.
En esta sección se definen algunas variables generales del proceso, incluyendo:
# Ruta a los datos de puntos de muestreo
ARCHIVO_PUNTOS <- "../../datos/Resul_Fin_2Grupos_SinReplicas_csv_Fix.csv"
# Colores
COLOR_VEGETACION = "#00a600" # Corine EU - Coniferous forest
COLOR_SIN_VEGETACION = "#dcdcc8" # Corine CR - Tierras desnudas o degradadas
COLOR_AGUA = "#00ccf2" # Corine EU - Water courses
COLOR_NUBES_Y_SOMBRAS = "#800080" # Púrpura
COLOR_SIN_INFORMACION = "#000000" # Negro
COLOR_MC_BOSQUES = "#266900" # Corine CR - Bosque denso
COLOR_AGRICULTURA = "#Becd05" # Corine CR - Mosaico de cultivos
COLOR_GANADERIA_Y_PASTOS = "#ffffa6" # Corine CR - Pastos limpios
COLOR_ZONAS_HUMEDALES = "#00ccf2" # Corine EU - Water courses
COLOR_NO_CLASIFICACION = "#000000" # Negro
COLOR_INFRAESTRUCTURA = "#f6d9df" # Corine CR - Zona urbana continua
COLOR_OTRAS_TIERRAS = "#005acf" # Corine CR - Canales
COLOR_NULO = "#808080" # Gris
# Paleta de colores de tipos de cobertura de la tierra
COLORES_COBERTURA <-
c(
"1000-Vegetacion" = COLOR_VEGETACION,
"T1-1000-Vegetacion" = COLOR_VEGETACION,
"T2-1000-Vegetacion" = COLOR_VEGETACION,
"2000-Sin vegetacion" = COLOR_SIN_VEGETACION,
"T1-2000-Sin vegetacion" = COLOR_SIN_VEGETACION,
"T2-2000-Sin vegetacion" = COLOR_SIN_VEGETACION,
"3000-Agua" = COLOR_AGUA,
"T1-3000-Agua" = COLOR_AGUA,
"T2-3000-Agua" = COLOR_AGUA,
"4000-Nubes y sombras" = COLOR_NUBES_Y_SOMBRAS,
"T1-4000-Nubes y sombras" = COLOR_NUBES_Y_SOMBRAS,
"T2-4000-Nubes y sombras" = COLOR_NUBES_Y_SOMBRAS,
"5000-Sin informacion" = COLOR_SIN_INFORMACION,
"T1-5000-Sin informacion" = COLOR_SIN_INFORMACION,
"T2-5000-Sin informacion" = COLOR_SIN_INFORMACION,
"Nulo" = COLOR_NULO,
"T1-Nulo" = COLOR_NULO,
"T2-Nulo" = COLOR_NULO
)
# Paleta de colores de tipos de uso de la tierra
COLORES_USO <-
c(
"1000-MC bosques" = COLOR_MC_BOSQUES,
"T1-1000-MC bosques" = COLOR_MC_BOSQUES,
"T2-1000-MC bosques" = COLOR_MC_BOSQUES,
"2000-Agricultura" = COLOR_AGRICULTURA,
"T1-2000-Agricultura" = COLOR_AGRICULTURA,
"T2-2000-Agricultura" = COLOR_AGRICULTURA,
"3000-Ganad y past" = COLOR_GANADERIA_Y_PASTOS,
"T1-3000-Ganad y past" = COLOR_GANADERIA_Y_PASTOS,
"T2-3000-Ganad y past" = COLOR_GANADERIA_Y_PASTOS,
"4000-Zonas humed" = COLOR_ZONAS_HUMEDALES,
"T1-4000-Zonas humed" = COLOR_ZONAS_HUMEDALES,
"T2-4000-Zonas humed" = COLOR_ZONAS_HUMEDALES,
"5000-Infraest" = COLOR_INFRAESTRUCTURA,
"T1-5000-Infraest" = COLOR_INFRAESTRUCTURA,
"T2-5000-Infraest" = COLOR_INFRAESTRUCTURA,
"6000-Otras tierras" = COLOR_OTRAS_TIERRAS,
"T1-6000-Otras tierras" = COLOR_OTRAS_TIERRAS,
"T2-6000-Otras tierras" = COLOR_OTRAS_TIERRAS,
"7000 No clasif" = COLOR_NO_CLASIFICACION,
"T1-7000 No clasif" = COLOR_NO_CLASIFICACION,
"T2-7000 No clasif" = COLOR_NO_CLASIFICACION,
"Nulo" = COLOR_NULO,
"T1-Nulo" = COLOR_NULO,
"T2-Nulo" = COLOR_NULO
)
# Área de estudio en hectáreas
AREA_ESTUDIO = 318167.67Los datos de los puntos de muestreo se proporcionaron en un archivo CSV. En el siguiente bloque de código se cargan en el dataframe puntos. Los nombres de las columnas se “limpian” para evitar la presencia de números al inicio y otros problemas que dificultan su manejo. Los valores nulos (NA) se convierten a hileras de texto.
# Carga de datos de puntos de muestreo
puntos <- read_delim(ARCHIVO_PUNTOS)
# Limpieza de los nombres de columnas
puntos <- clean_names(puntos)
# Reemplazo de valores NA por la hilera "Nulo"
puntos <-
puntos |>
mutate(
t1_cobertura = replace_na(t1_cobertura, "Nulo"),
t2_cobertura = replace_na(t2_cobertura, "Nulo"),
t1_uso = replace_na(t1_uso, "Nulo"),
t2_uso = replace_na(t2_uso, "Nulo")
)
# Coversión a de t1_cobertura, t2_cobertura, t1_uso y t2_uso a factores
puntos <-
puntos |>
mutate(
t1_cobertura = factor(t1_cobertura, levels = unique(t1_cobertura)),
t2_cobertura = factor(t2_cobertura, levels = unique(t2_cobertura)),
t1_uso = factor(t1_uso, levels = unique(t1_uso)),
t2_uso = factor(t2_uso, levels = unique(t2_uso))
)El dataframe puntos contiene más de 40 columnas, provenientes del archivo CSV. Algunas de las más importantes para efectos de este análisis son:
plot_id: identificador de la parcela.sample_id: identificador del punto de muestreo.t1_cobertura: interpretación de la variable de cobertura de la tierra en t1.t2_cobertura: interpretación de la variable de cobertura de la tierra en t2.t1_uso: interpretación de la variable de uso del suelo en t1.t2_uso: interpretación de la variable de uso del suelo en t2.La siguiente tabla muestra las columnas mencionadas.
# Despliegue de los datos de puntos de muestreo en una tabla
puntos |>
select(plot_id, sample_id, t1_cobertura, t2_cobertura, t1_uso, t2_uso) |>
datatable(
caption = "Puntos de muestreo de cobertura y uso de la tierra",
rownames = FALSE,
colnames = c(
"plot_id", "sample_id",
"t1_cobertura", "t2_cobertura",
"t1_uso", "t2_uso"
),
options = list(
pageLength = 5,
language = list(url = '//cdn.datatables.net/plug-ins/1.10.11/i18n/Spanish.json')
)
)En esta sección, se analizan los datos con paquetes de R como los de la colección de Tidyverse, Plotly R para gráficos estadísticos interactivos y Leaflet R para mapas interactivos.
Primero se analiza la variable de cobertura de la tierra y posteriormente la variable de uso del suelo.
El siguiente mapa interactivo, implementado con el paquete Leaflet, muestra la distribución espacial de la interpretación de la variable de cobertura de la tierra en t1 y t2.
# Conversión de datos de puntos de muestreo a objeto sf (vectorial de puntos)
geo_puntos <-
puntos |>
select(plot_id, sample_id, lon, lat, t1_cobertura, t2_cobertura) |>
st_as_sf(
coords = c("lon", "lat"),
crs = 4326
)
colores <-
colorFactor(
palette = c(
COLOR_VEGETACION, COLOR_SIN_VEGETACION, COLOR_AGUA,
COLOR_NUBES_Y_SOMBRAS, COLOR_SIN_INFORMACION, COLOR_NULO
),
levels = c(
"1000-Vegetacion", "2000-Sin vegetacion", "3000-Agua",
"4000-Nubes y sombras", "5000-Sin informacion", "Nulo"
)
)
leaflet() |>
addTiles(group = "OSM") |>
addProviderTiles(
provider = providers$Esri.WorldImagery,
group = "ESRI World Imagery"
) |>
addProviderTiles(
provider = providers$CartoDB.DarkMatter,
group = "Dark Matter"
) |>
addCircleMarkers(
data = geo_puntos,
radius = 2,
fillColor = ~colores(geo_puntos$t1_cobertura),
color = ~colores(geo_puntos$t1_cobertura),
# clusterOptions = markerClusterOptions(),
popup = paste(
paste0("<strong>Parcela: </strong>", geo_puntos$plot_id),
paste0("<strong>Muestra: </strong>", geo_puntos$sample_id),
paste0("<strong>Cobertura en t1: </strong>", geo_puntos$t1_cobertura),
paste0("<strong>Cobertura en t2: </strong>", geo_puntos$t2_cobertura),
sep = '<br/>'
),
group = "Cobertura en t1"
) |>
addLegend(
position = "bottomleft",
pal = colores,
values = geo_puntos$t1_cobertura,
title = "Cobertura en t1",
group = "Cobertura en t1"
) |>
addCircleMarkers(
data = geo_puntos,
radius = 2,
fillColor = ~colores(geo_puntos$t2_cobertura),
color = ~colores(geo_puntos$t2_cobertura),
# clusterOptions = markerClusterOptions(),
popup = paste(
paste0("<strong>Parcela: </strong>", geo_puntos$plot_id),
paste0("<strong>Muestra: </strong>", geo_puntos$sample_id),
paste0("<strong>Cobertura en t1: </strong>", geo_puntos$t1_cobertura),
paste0("<strong>Cobertura en t2: </strong>", geo_puntos$t2_cobertura),
sep = '<br/>'
),
group = "Cobertura en t2"
) |>
addLegend(
position = "bottomleft",
pal = colores,
values = geo_puntos$t2_cobertura,
title = "Cobertura en t2",
group = "Cobertura en t2"
) |>
addLayersControl(
baseGroups = c("OSM", "ESRI World Imagery", "Dark Matter"),
overlayGroups = c("Cobertura en t1", "Cobertura en t2"),
)