# Versión de R
R.version.string[1] "R version 4.3.2 (2023-10-31 ucrt)"
Caso de estudio de EVM
FIESTA es una biblioteca de software para análisis de datos de inventarios forestales. En este documento se explica el uso de FIESTA mediante un caso de ejemplo basado en un conjunto de datos de manglares interpretados por el CATIE.
FIESTA (Forest Inventory Estimation and Analysis) es una biblioteca de software, desarrollada en el lenguaje de programación R, para el análisis de datos de inventarios forestales basados en muestras. Fue desarrollada por el Programa de Inventario y Análisis Forestal (FIA) del Servicio Forestal del Departamento de Agricultura (USDA) de los Estados Unidos.
En este documento se detalla el análisis, mediante FIESTA, de un conjunto de datos de 43389 puntos de muestreo de manglares de Costa Rica. Estos datos fueron interpretados por el Centro Agronómico Tropical de Investigación y Enseñanza (CATIE).
Para cada punto se interpretaron las variables:
La interpretación se realizó en varios tiempos, de los cuales se están considerando dos para este análisis:
El documento fue desarrollado en el sistema de publicación técnica y científica Quarto, el cual combina código en R y sus salidas (tablas, gráficos, mapas) con texto en Markdown.
Para trabajar con FIESTA, se debe instalar:
De acuerdo con su documentación, la versión mínima de R que requiere FIESTA, a la fecha de escritura de este documento (2023-12-02), es la 4.2.0. Puede consultar la versión de su instalación al ejecutar el siguiente comando en la consola de R:
La salida del comando anterior debe indicar que la versión de su instalación de R es mayor o igual a 4.2.0.
El paquete FIESTA está disponible en CRAN (Comprehensive R Archive Network), un repositorio en línea que alberga una amplia colección de paquetes y extensiones para el lenguaje de programación R, lo que facilita su instalación y actualización a nuevas versiones.
Para usar FIESTA, debe instalarse primero. Puede utilizar la función install.packages().
El resultado de la instalación puede verificarse al cargar el paquete con la función library().
Si el comando anterior no genera ningún mensaje de error, FIESTA debe haberse instalado adecuadamente.
Además de FIESTA, se recomienda instalar los siguientes paquetes para procesamiento y visualización de datos.
# Paquete para el desarrollo de documentos computacionales
install.packages("rmarkdown")
# Colección de paquetes para análisis de datos
install.packages("tidyverse")
# Estilos para gráficos de tidyverse
install.packages("ggthemes")
# Paquete para limpieza de datos
install.packages("janitor")
# Paquete para tablas interactivas
install.packages("DT")
# Paquete para graficación interactiva
install.packages("plotly")
# Paquete para mapas interactivos
install.packages("leaflet")
# Funciones adicionales para leaflet
install.packages("leaflet.extras")
# Funciones adicionales para leaflet
install.packages("leafem")Luego de instalarlos, debe cargar los paquetes con la función library().
Este documento, junto con otros similares, forma parte de un repositorio en GitHub, una plataforma en línea para compartir código fuente de aplicaciones, basada en el sistema de control de versiones Git. El repositorio contiene el código fuente del documento y los datos que se utilizan en los ejemplos. Su dirección es https://github.com/mesa-monitoreo-puntos/fiesta.
Puede descargar el repositorio, como un archivo ZIP, de https://github.com/mesa-monitoreo-puntos/fiesta/archive/refs/heads/main.zip
También puede “clonar” el repositorio mediante el comando clone de Git:
# Clonación de este repositorio
git clone https://github.com/mesa-monitoreo-puntos/fiesta.git
Una vez que el repositorio haya sido descargado o clonado, puede abrirse con RStudio o con otra herramienta de desarrollo.
En esta sección se definen algunas variables generales del proceso.
# Ruta a los datos de puntos de muestreo
ARCHIVO_PUNTOS <- "../../datos/catie/ceo-Mangle-1998-2005-2007-2016-2021-sample-data-2022-03-23.csv"
# Colores
COLOR_BOSQUE = "#266900" # Corine CR - Bosque denso
COLOR_HUMEDAL = "#00ccf2" # Corine EU - Water courses
COLOR_NO_DETERMINABLE = "#000000" # Negro
COLOR_PASTOS = "#ffffa6" # Corine CR - Pastos limpios
COLOR_AGRICULTURA = "#Becd05" # Corine CR - Mosaico de cultivos
COLOR_OTRAS_CLASES = "#005acf" # Corine CR - Canales
COLOR_PLANTACION_FORESTAL = "#55ff00" # Corine CR - Plantación forestal
COLOR_NULO = "#808080" # Gris
# Paleta de colores de tipos de uso de la tierra
COLORES_USO <-
c(
"Bosque" = COLOR_BOSQUE,
"T1-Bosque" = COLOR_BOSQUE,
"T2-Bosque" = COLOR_BOSQUE,
"Humedal" = COLOR_HUMEDAL,
"T1-Humedal" = COLOR_HUMEDAL,
"T2-Humedal" = COLOR_HUMEDAL,
"No determinable" = COLOR_NO_DETERMINABLE,
"T1-No determinable" = COLOR_NO_DETERMINABLE,
"T2-No determinable" = COLOR_NO_DETERMINABLE,
"Pastos" = COLOR_PASTOS,
"T1-Pastos" = COLOR_PASTOS,
"T1-Pastos" = COLOR_PASTOS,
"Agricultura" = COLOR_AGRICULTURA,
"T1-Agricultura" = COLOR_AGRICULTURA,
"T2-Agricultura" = COLOR_AGRICULTURA,
"Otras clases" = COLOR_OTRAS_CLASES,
"T1-Otras clases" = COLOR_OTRAS_CLASES,
"T2-Otras clases" = COLOR_OTRAS_CLASES,
"Plantación Forestal" = COLOR_PLANTACION_FORESTAL,
"T1-Plantación Forestal" = COLOR_PLANTACION_FORESTAL,
"T2-Plantación Forestal" = COLOR_PLANTACION_FORESTAL,
"Nulo" = COLOR_NULO,
"T1-Nulo" = COLOR_NULO,
"T2-Nulo" = COLOR_NULO
)
# Área de estudio en hectáreasLos datos de los puntos de muestreo se proporcionaron en un archivo CSV. En el siguiente bloque de código se cargan en el dataframe puntos. Los nombres de las columnas se “limpian” para evitar la presencia de números al inicio y otros problemas que dificultan su manejo. Los valores nulos (NA) se convierten a hileras de texto.
# Carga de datos de puntos de muestreo
puntos <- read_delim(ARCHIVO_PUNTOS)
# Cambio de tipo de datos
puntos <-
puntos |>
mutate(
plotid = as.numeric(plotid),
sampleid = as.numeric(sampleid)
)
# Adición de una columna con números consecutivos, como identificador único
puntos <-
puntos |>
mutate(
id = row_number()
) |>
select(id, everything())
# Limpieza de los nombres de columnas
puntos <- clean_names(puntos)
# Cambio de nombre de columnas
puntos <- puntos |>
rename(
plot_id = plotid,
sample_id = sampleid,
t1_uso = clase_de_uso_1998,
t2_uso = clase_de_uso_21
)
# Eliminación de espacios en blanco al inicio y al final
puntos <- puntos |>
mutate(
t1_uso = trimws(t1_uso),
t2_uso = trimws(t2_uso)
)
# Reemplazo de valores NA por la hilera "Nulo"
puntos <-
puntos |>
mutate(
t1_uso = replace_na(t1_uso, "Nulo"),
t2_uso = replace_na(t2_uso, "Nulo")
)
# Coversión de t1_uso y t2_uso a factores
puntos <-
puntos |>
mutate(
t1_uso = factor(t1_uso, levels = unique(t1_uso)),
t2_uso = factor(t2_uso, levels = unique(t2_uso))
)El dataframe puntos contiene más de 40 columnas, provenientes del archivo CSV. Algunas de las más importantes para efectos de este análisis son:
plot_id: identificador de la parcela.sample_id: identificador del punto de muestreo.t1_uso: interpretación de la variable de uso del suelo en t1.t2_uso: interpretación de la variable de uso del suelo en t2.La siguiente tabla muestra las columnas mencionadas.
# Despliegue de los datos de puntos de muestreo en una tabla
puntos |>
select(plot_id, sample_id, t1_uso, t2_uso) |>
datatable(
caption = "Puntos de muestreo de uso de la tierra",
rownames = FALSE,
colnames = c(
"plot_id", "sample_id",
"t1_uso", "t2_uso"
),
options = list(
pageLength = 5,
language = list(url = '//cdn.datatables.net/plug-ins/1.10.11/i18n/Spanish.json')
)
)En esta sección, se analizan los datos con paquetes de R como los de la colección de Tidyverse, Plotly R para gráficos estadísticos interactivos y Leaflet R para mapas interactivos.
El siguiente mapa interactivo, implementado con el paquete Leaflet, muestra la distribución espacial de la interpretación de la variable de uso del suelo en t1 y t2.
# Conversión de datos de puntos de muestreo a objeto sf (vectorial de puntos)
geo_puntos <-
puntos |>
select(plot_id, sample_id, lon, lat, t1_uso, t2_uso) |>
st_as_sf(
coords = c("lon", "lat"),
crs = 4326
)
colores <-
colorFactor(
palette = c(
COLOR_BOSQUE, COLOR_HUMEDAL, COLOR_NO_DETERMINABLE, COLOR_PASTOS,
COLOR_AGRICULTURA, COLOR_OTRAS_CLASES, COLOR_PLANTACION_FORESTAL
),
levels = c(
"Bosque", "Humedal", "No determinable", "Pastos",
"Agricultura", "Otras clases", "Plantación Forestal"
)
)
leaflet() |>
addTiles(group = "OSM") |>
addProviderTiles(
provider = providers$Esri.WorldImagery,
group = "ESRI World Imagery"
) |>
addProviderTiles(
provider = providers$CartoDB.DarkMatter,
group = "Dark Matter"
) |>
addCircleMarkers(
data = geo_puntos,
radius = 2,
fillColor = ~colores(geo_puntos$t1_uso),
color = ~colores(geo_puntos$t1_uso),
# clusterOptions = markerClusterOptions(),
popup = paste(
paste0("<strong>Parcela: </strong>", geo_puntos$plot_id),
paste0("<strong>Muestra: </strong>", geo_puntos$sample_id),
paste0("<strong>Uso en t1: </strong>", geo_puntos$t1_uso),
paste0("<strong>Uso en t2: </strong>", geo_puntos$t2_uso),
sep = '<br/>'
),
group = "Uso en t1"
) |>
addLegend(
position = "bottomleft",
pal = colores,
values = geo_puntos$t1_uso,
title = "Uso en t1",
group = "Uso en t1"
) |>
addCircleMarkers(
data = geo_puntos,
radius = 2,
fillColor = ~colores(geo_puntos$t2_uso),
color = ~colores(geo_puntos$t2_uso),
# clusterOptions = markerClusterOptions(),
popup = paste(
paste0("<strong>Parcela: </strong>", geo_puntos$plot_id),
paste0("<strong>Muestra: </strong>", geo_puntos$sample_id),
paste0("<strong>Uso en t1: </strong>", geo_puntos$t1_uso),
paste0("<strong>Uso en t2: </strong>", geo_puntos$t2_uso),
sep = '<br/>'
),
group = "Uso en t2"
) |>
addLegend(
position = "bottomleft",
pal = colores,
values = geo_puntos$t2_uso,
title = "Uso en t2",
group = "Uso en t2"
) |>
addLayersControl(
baseGroups = c("OSM", "ESRI World Imagery", "Dark Matter"),
overlayGroups = c("Uso en t1", "Uso en t2"),
)