La desduplicación de datos es un método de reducción de las necesidades de almacenamiento mediante la eliminación de datos redundantes. En realidad, sólo una única instancia de datos se retiene en medios de almacenamiento, como el disco o la cinta.

Los datos redundantes se reemplazan con un indicador en la única copia de datos. Por ejemplo, un típico sistema de correo electrónico puede contener 100 instancias del mismo archivo adjunto de un megabyte. Si la plataforma del correo electrónico tiene copia de seguridad o está archivada, todas las instancias están guardadas; se requieren 100 MB de espacio de almacenamiento. En realidad, con la deduplicación de datos sólo una instancia del adjunto se almacena. Cada instancia posterior hace referencia a la copia original guardada. En este ejemplo, una demanda de almacenamiento de 100 MB se puede reducir en sólo 1 MB.