Si querés procesar datos de la Encuesta Permanente de Hogares (EPH) elaborada por el Instituto Nacional de Estadística y Censos de la República Argentina (INDEC) mediante el lenguaje de programación R, la librería eph
tiene por objeto facilitar tu trabajo.
El paquete cumple un rol fundamental en la democratización de la posibilidad de procesar los datos publicados por INDEC y así obtener conclusiones independientes de aquellas publicadas en los informes elaborados por el organismo. Dado que la información de la EPH constituye una de las principales fuentes para el análisis de las problemáticas sociales presentes en Argentina, el paquete no sólo posibilita investigaciones académicas y periodísticas, sino que también contribuye a la formulación de políticas públicas fundamentadas en evidencia.
Algunas de sus funciones son:
get_microdata()
: Descarga las bases de microdatos,
organize_panels()
: Permite armar un pool de datos en panel de la EPH continua,
organize_cno()
: Clasifica las ocupaciones según el Clasificador Nacional de Ocupaciones (CNO) 2001
organize_caes()
: Clasifica las actividades económicas según el Clasificador de Actividades Economicas para encuestas Sociodemograficas (CAES) Mercosur 1.0 y el CAES Mercosur
organize_labels()
: Etiqueta las bases siguiendo el último diseño de registro
map_agglomerates()
: Mapa de indicadores por aglomerado
El paquete también cuenta con dataframes útiles para el trabajo con la EPH. Algunos de estos son:
diccionario_regiones
: Diccionario de regiones según el diseño de registro de la EPH
diccionario_aglomerados
: Diccionario de aglomerados según el diseño de registro de la EPH
centroides_aglomerados
: Tabla de centroides de los aglomerados (basado en https://www.indec.gob.ar/indec/web/Nivel4-Tema-1-39-120)
adulto_equivalente
: Tabla de valores de adulto equivalente segun sexo y edad (ver definición mtodológica)
Para descargar la versión estable desde CRAN:
install.packages("eph")
Para descargar desde R-universe:
install.packages("eph", repos = "https://ropensci.r-universe.dev")
Para la versión en desarrollo:
# install.packages('devtools')
# si no tiene instalado devtools
devtools::install_github("holatam/eph")
Ejemplo de descarga de microdatos
# Cargo la libreria
library(eph)
base_individual <- get_microdata(
year = 2018:2019, # especifco el año
trimester = 1, # el trimestre
type = "individual", # y el tipo de base
vars = c("PONDERA", "ESTADO", "CAT_OCUP")
) # opcionalmente, puedo especificar las variables que deseo utilizar.
base_individual
#> # A tibble: 117,320 × 3
#> PONDERA ESTADO CAT_OCUP
#> <int> <int> <int>
#> 1 684 4 0
#> 2 1008 3 0
#> 3 1008 1 1
#> 4 1008 2 0
#> 5 886 1 2
#> 6 594 3 0
#> 7 594 3 0
#> 8 546 3 0
#> 9 509 1 3
#> 10 509 1 3
#> # ℹ 117,310 more rows
Podés citar este paquete como “se obtuvieron y/o normalizaron los datos de la Encuesta Permanente de Hogares (EPH-INDEC) utilizando el paquete de R ‘eph’ (Kozlowski et al, 2020)”.
La referencia completa para incluir en la bibliografía es:
Carolina Pradier, Guido Weksler, Pablo Tiscornia, Natsumi Shokida, Germán Rosati, & Diego Kozlowski. (2023). ropensci/eph V1.0.0 (1.0.0). Zenodo. https://doi.org/10.5281/zenodo.8352221
Si necesitás la entrada bib:
@software{carolina_pradier_2023_8352221,
author = {Carolina Pradier and
Guido Weksler and
Pablo Tiscornia and
Natsumi Shokida and
Germán Rosati and
Diego Kozlowski},
title = {ropensci/eph V1.0.0},
month = sep,
year = 2023,
publisher = {Zenodo},
version = {1.0.0},
doi = {10.5281/zenodo.8352221},
url = {https://doi.org/10.5281/zenodo.8352221}
}
Este paquete se propone incorporar cualquier función de propósitos generales que utilice como base los datos de la Encuesta Permanente de Hogares. Todos los aportes en este sentido son bienvenidos.
Si trabajas con la EPH y querés agregar tu función, te recomendamos que leas los siguientes consejos sobre cómo como colaborar