Cuando hablamos de big data, nos referimos a conjuntos de datos o combinaciones de conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan la captura, gestión, procesamiento o uso de métodos y herramientas tradicionales, como bases de datos relacionales y paquetes estadísticos generales o de visualización, siempre que sean de utilidad.
Se pueden manejar grandes volúmenes de datos no estructurados y de baja densidad. Estos pueden ser datos de valor desconocido, como un feed de Twitter, los de clics de una página web o una aplicación móvil, o un dispositivo con un sensor. Para algunas organizaciones, esto puede significar decenas de terabytes de datos.
VARIEDAD
Se refiere a los distintos tipos de datos que se encuentran disponibles, Es decir, los datos están disponibles en una variedad de formatos, desde datos numéricos estructurados en bases de datos tradicionales hasta documentos de texto no estructurados, correos electrónicos, video, audio, datos de péndulo y transacciones financieras.
VELOCIDAD
Es el ritmo acelerado en el que se reciben los datos y (posiblemente) se aplica alguna acción. Los datos de alta velocidad generalmente se transfieren directamente a la memoria en lugar de escribirse en el disco. Algunos productos inteligentes habilitados para Internet funcionan en tiempo real o casi en tiempo real y requieren evaluación y operación en tiempo real.