Do GPUs Really Need New Tabular File Formats?

Este documento demuestra que los cuellos de botella en el rendimiento de escaneo de GPU en archivos Parquet se deben a configuraciones subóptimas centradas en la CPU y no al formato en sí, y muestra que aplicar configuraciones conscientes de la GPU puede aumentar el ancho de banda de lectura efectivo hasta 125 GB/s sin alterar la especificación de Parquet.

Autores originales: Jigao Luo, Qi Chen, Carsten Binnig

Publicado 2026-05-27✓ Author reviewed
📖 4 min de lectura☕ Lectura para el café

Autores originales: Jigao Luo, Qi Chen, Carsten Binnig

Artículo original bajo licencia CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Esta es una explicación generada por IA del artículo a continuación. No ha sido escrita por los autores. Para mayor precisión técnica, consulte el artículo original. Leer descargo de responsabilidad completo

Imagina que tienes una biblioteca masiva de libros (tus datos) almacenada en un almacén (tu disco duro). También tienes un bibliotecario robot superrápido (tu GPU) cuya tarea es leer estos libros y responder preguntas.

Durante años, la biblioteca se ha organizado utilizando un sistema de archivado específico llamado Parquet. Este sistema fue diseñado pensando en un bibliotecario humano: agrupa los libros en pilas pequeñas y manejables que un humano puede recoger fácilmente una por una.

Sin embargo, el bibliotecario robot es diferente. No solo recoge una pila a la vez; tiene miles de manos y puede agarrar docenas de pilas simultáneamente. Pero como la biblioteca sigue organizada para humanos, el robot pasa la mayor parte de su tiempo esperando a que le entreguen la siguiente pila, o solo está usando una pequeña fracción de sus manos. El robot es increíblemente rápido, pero la organización de la biblioteca lo está frenando.

El artículo plantea una pregunta sencilla: ¿Necesitamos inventar un sistema de archivado completamente nuevo solo para robots?

Los autores dicen: No. En su lugar, solo necesitamos reorganizar los libros existentes usando unas pocas reglas simples.

Así es como resolvieron el problema, utilizando cuatro "reglas de la carretera" principales:

1. La regla de "Más pilas" (Aumentar el número de páginas)

  • El problema: El antiguo sistema ponía todos los datos de una sección en un solo libro gigante y pesado. El robot intentaba leerlo, pero solo podía usar una mano a la vez porque el libro era demasiado grande para dividirlo.
  • La solución: Cortaron esos libros gigantes en muchas páginas más pequeñas y delgadas. Ahora, el robot puede agarrar 100 páginas a la vez con sus 100 manos.
  • El resultado: El robot ya no está esperando; está ocupado usando todas sus manos a la vez.

2. La regla de "Cajas grandes" (Aumentar el tamaño del grupo de filas)

  • El problema: El antiguo sistema enviaba al robot paquetes diminutos del tamaño de un sello postal. Aunque el robot es rápido, el camión de reparto (la conexión entre la unidad de disco y el robot) se obstruye con demasiados paquetes diminutos.
  • La solución: Comenzaron a enviar cajas de mudanza enormes y de tamaño completo en lugar de sellos postales.
  • El resultado: El camión de reparto ahora puede conducir a toda velocidad, manteniendo al robot constantemente abastecido de datos.

3. La regla de "Empaque inteligente" (Flexibilidad de codificación)

  • El problema: El antiguo sistema empaquetaba los libros usando un método genérico, de talla única. A veces esto hacía los libros más pequeños, pero a menudo no ayudaba mucho.
  • La solución: Observaron cada libro individualmente y eligieron la mejor manera de reducirlo. Si un libro tenía muchas palabras repetidas, usaron un código especial para hacerlo diminuto. Si un libro ya era corto, lo dejaron como estaba.
  • El resultado: Los libros ocupan menos espacio en la estantería, por lo que el camión de reparto tiene menos peso que transportar, lo que hace que todo el proceso sea más rápido.

4. La regla de "No envolverlo" (Sin compresión innecesaria)

  • El problema: A veces, el antiguo sistema envolvía los libros en plástico de burbujas pesado (compresión) incluso cuando los libros ya eran pequeños. Luego, el robot tenía que gastar tiempo desenrollándolos, lo que desperdiciaba energía.
  • La solución: Decidieron: "Si el plástico de burbujas no hace que el paquete sea significativamente más pequeño, no lo uses".
  • El resultado: El robot ahorra tiempo al saltarse el paso de desenrollar los libros que no lo necesitaban.

El gran final: El robot contra el humano

Los autores probaron esta nueva organización.

  • La vieja forma: El robot era lento, apenas usando sus superpoderes.
  • La nueva forma: Al simplemente reorganizar los archivos Parquet existentes (sin inventar un nuevo formato), hicieron que el robot fuera 125 veces más rápido en términos de velocidad de lectura de datos.

También demostraron que cuando el robot trabaja en sincronía con el camión de reparto (superponiendo la lectura y el procesamiento), se vuelve aún más eficiente. De hecho, este robot reorganizado fue tan rápido que casi alcanzó el límite de velocidad teórica del propio camión de reparto.

La conclusión

El artículo concluye que no necesitamos quemar la biblioteca y construir una nueva desde cero. Solo necesitamos reorganizar los libros con algunos ajustes inteligentes.

Al ajustar cómo se empaquetan y agrupan los datos, el formato Parquet existente ya puede funcionar a la velocidad del rayo en las GPU modernas. Esto ahorra a todos el trabajo de aprender un nuevo sistema y mantiene compatible todo el software antiguo, mientras aún obtenemos el enorme impulso de velocidad que queríamos.

¿Ahogado en artículos de tu campo?

Recibe resúmenes diarios de los artículos más novedosos que coincidan con tus palabras clave de investigación — con resúmenes técnicos, en tu idioma.

Probar Digest →