Diferencias entre Pandas y PySpark

Dos de las librerías más utilizadas en el mundo de Python para el procesamiento de datos son Pandas y Pyspark (papelería de Python para spark) con características muy similares entre ellas incluyendo los nombres de algunos métodos o funciones. Generalmente la forma más global para tratar datos provenientes de archivos Excel, CSV, Parquet o Json […]
Tiempo de creación de diferencias: medición de la productividad de los desarrolladores en Meta

En Meta, siempre buscamos formas de mejorar la productividad de nuestros ingenieros y desarrolladores. Pero, ¿cómo se mide exactamente la productividad de los desarrolladores? En este episodio del Meta Tech Podcast Pascal Hartig (@passy) se sienta con Sarita y Moritzdos ingenieros de Meta que han estado trabajando en Diff Authoring Time (DAT), un método para […]