Caja de Herramientas para el procesamiento de la Encuesta Permanente de Hogares

Descripción

Si querés procesar datos de la Encuesta Permanente de Hogares (EPH) elaborada por el Instituto Nacional de Estadística y Censos de la República Argentina (INDEC) mediante el lenguaje de programación R, la librería eph tiene por objeto facilitar tu trabajo.

El paquete cumple un rol fundamental en la democratización de la posibilidad de procesar los datos publicados por INDEC y así obtener conclusiones independientes de aquellas publicadas en los informes elaborados por el organismo. Dado que la información de la EPH constituye una de las principales fuentes para el análisis de las problemáticas sociales presentes en Argentina, el paquete no sólo posibilita investigaciones académicas y periodísticas, sino que también contribuye a la formulación de políticas públicas fundamentadas en evidencia.

Algunas de sus funciones son:

El paquete también cuenta con dataframes útiles para el trabajo con la EPH. Algunos de estos son:

  • diccionario_regiones: Diccionario de regiones según el diseño de registro de la EPH

  • diccionario_aglomerados: Diccionario de aglomerados según el diseño de registro de la EPH

  • centroides_aglomerados: Tabla de centroides de los aglomerados (basado en https://www.indec.gob.ar/indec/web/Nivel4-Tema-1-39-120)

  • adulto_equivalente: Tabla de valores de adulto equivalente segun sexo y edad (ver definición mtodológica)

Instalación

Para descargar la versión estable desde CRAN:

Para descargar desde R-universe:

install.packages("eph", repos = "https://ropensci.r-universe.dev")

Para la versión en desarrollo:

# install.packages('devtools')
# si no tiene instalado devtools

devtools::install_github("holatam/eph")

Modo de uso

Ejemplo de descarga de microdatos

# Cargo la libreria
library(eph)

base_individual <- get_microdata(
  year = 2018:2019, # especifco el año
  trimester = 1, # el trimestre
  type = "individual", # y el tipo de base
  vars = c("PONDERA", "ESTADO", "CAT_OCUP")
) # opcionalmente, puedo especificar las variables que deseo utilizar.

base_individual
#> # A tibble: 117,320 × 3
#>    PONDERA ESTADO CAT_OCUP
#>      <int>  <int>    <int>
#>  1     684      4        0
#>  2    1008      3        0
#>  3    1008      1        1
#>  4    1008      2        0
#>  5     886      1        2
#>  6     594      3        0
#>  7     594      3        0
#>  8     546      3        0
#>  9     509      1        3
#> 10     509      1        3
#> # ℹ 117,310 more rows

Cómo citar este paquete

Podés citar este paquete como “se obtuvieron y/o normalizaron los datos de la Encuesta Permanente de Hogares (EPH-INDEC) utilizando el paquete de R ‘eph’ (Kozlowski et al, 2020)”.

La referencia completa para incluir en la bibliografía es:

Carolina Pradier, Guido Weksler, Pablo Tiscornia, Natsumi Shokida, Germán Rosati, & Diego Kozlowski. (2023). ropensci/eph V1.0.0 (1.0.0). Zenodo. https://doi.org/10.5281/zenodo.8352221

Si necesitás la entrada bib:


@software{carolina_pradier_2023_8352221,
  author       = {Carolina Pradier and
                  Guido Weksler and
                  Pablo Tiscornia and
                  Natsumi Shokida and
                  Germán Rosati and
                  Diego Kozlowski},
  title        = {ropensci/eph V1.0.0},
  month        = sep,
  year         = 2023,
  publisher    = {Zenodo},
  version      = {1.0.0},
  doi          = {10.5281/zenodo.8352221},
  url          = {https://doi.org/10.5281/zenodo.8352221}
}
  

Aportes de la comunidad

Este paquete se propone incorporar cualquier función de propósitos generales que utilice como base los datos de la Encuesta Permanente de Hogares. Todos los aportes en este sentido son bienvenidos.

Si trabajas con la EPH y querés agregar tu función, te recomendamos que leas los siguientes consejos sobre cómo como colaborar