Un lago de datos es un repositorio centralizado que almacena datos en bruto, no estructurados y estructurados a cualquier escala. Los equipos a menudo vierten salidas de scraping web en Amazon S3 o Google Cloud Storage antes de realizar análisis posteriores.