Um lago de dados é um repositório centralizado que armazena dados brutos, não estruturados e estruturados em qualquer escala. As equipes frequentemente despejam saídas de raspagem da web no Amazon S3 ou Google Cloud Storage antes de análises posteriores.