Athrun Data Intelligence

Diferencias entre Pandas y PySpark

Dos de las librerías más utilizadas en el mundo de Python para el procesamiento de datos son Pandas y Pyspark (papelería de Python para spark) con características muy similares entre ellas incluyendo los nombres de algunos métodos o funciones. Generalmente la forma más global para tratar datos provenientes de archivos Excel, CSV, Parquet o Json […]