Paquete datamedios (Versión 1.1.0)

datamedios es un paquete de R diseñado para facilitar la extracción automatizada de noticias desde medios de comunicación chilenos, por el momento haciendo web scraping de BíoBío.cl. Este paquete permite realizar búsquedas de noticias y filtrarlas por rangos de fechas, entregando los resultados en un formato estructurado y listo para su análisis. Además, incluye funcionalidades para almacenar los datos extraídos en una base de datos de manera opcional.


🔧 Instalación

Para instalarlo desde CRAN:

Instala datamedios desde la librería de CRAN:

install.packages("datamedios")
library(datamedios)

Alternativamente, para instalar el paquete desde GitHub, sigue los siguientes pasos:

  1. Asegúrate de tener instalado el paquete devtools. Si no lo tienes, instálalo ejecutando:

    install.packages("devtools")
  2. Instala datamedios desde el repositorio de GitHub:

    devtools::install_github("exetrujillo/datamedios")

🔄 Uso

Función principal: extraer_noticias_fecha

Esta función permite filtrar noticias por un rango de fechas específico, además de aplicar una frase de búsqueda. Por defecto carga los datos automáticamente a la base de datos de api-datamedios.

Parámetros:

Valor devuelto:

Un data.frame con las siguientes columnas:

Ejemplo de uso:

# Buscar noticias entre el 1 de enero y el 31 de diciembre de 2023
noticias <- extraer_noticias_fecha("estallido social", "2019-10-18", "2020-10-18")

Función secundaria: extraer_noticias_max_res

Esta función permite obtener noticias desde BíoBío.cl utilizando una frase de búsqueda. Además, puedes limitar el número de resultados a extraer. Por defecto carga los datos automáticamente a la base de datos de api-datamedios.

Parámetros:

Valor devuelto:

Un data.frame similar al de extraer_noticias_fecha, pero filtrado por max_results.

Ejemplo de uso:

# Buscar noticias relacionadas con "inteligencia artificial"
noticias <- extraer_noticias_max_res("inteligencia artificial", max_results = 100)

🔖 Documentación

Adicionalmente, el paquete incluye funciones de limpieza, manejo y visualización de las noticias extraídas. Para visitar la documentación de todos los códigos haga click aquí.

📊 Dependencias

Este paquete utiliza las siguientes dependencias de R para su correcto funcionamiento:


🗂️ Licencia

datamedios está bajo la Licencia MIT. Consulta el archivo LICENSE para más detalles.


👤 Autoría

Este paquete fue desarrollado por: