Top Qs
Línea de tiempo
Chat
Contexto
Apache ORC
formato de almacenamiento de datos orientado a columnas De Wikipedia, la enciclopedia libre
Remove ads
Apache ORC (Optimized Row Columnar) es un formato de almacenamiento de datos orientado a columnas, gratuito y de código abierto del ecosistema Apache Hadoop. Es similar a los otros formatos de archivo de almacenamiento en columnas disponibles en el ecosistema de Hadoop, como RCFile y Parquet. Es compatible con la mayoría de los marcos de procesamiento de datos en el entorno Hadoop.
Remove ads
En febrero de 2013, el formato de archivo Optimized Row Columnar (ORC) fue anunciado por Hortonworks en colaboración con Facebook.[1] Un mes después, se anunció el formato Apache Parquet, desarrollado por Cloudera y Twitter.[2]
Remove ads
Véase también
Portal:Software libre. Contenido relacionado con Software libre.
- Apache Hive
- Pig (herramienta de programación)
- Apache Spark
Referencias
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads