Detección de DeepFakes mediante la Ley de Benford
La Ley de Benford establece que, dado un conjunto de datos numéricos para alguna cantidad natural (ej: población de ciudades, precios en la bolsa, etc) la estadística de sus Primeros Dígitos sigue la distribución explicada en el siguiente gráfico y es descripta por la ecuación p(d) = log 10 1 + 1 d , (1) donde d es el Primer Dígito en base 10.
Es decir, que es mucho más probable que el Primer Dígito de un conjunto numérico sea 1 que cualquier otro número, seguido del 2, etc. hasta el 9 que es el menos frecuente.
A partir de esta ley, un grupo de investigación forense comenzó a desarrollar una serie de técnicas que detectan imágenes falsas generadas por redes neuronales, analizando y comparando datos estadísticos en imágenes naturales e imágenes alteradas mediante GANs. En las imágenes naturales, las probabilidades de distribución de variables especificas usualmente siguen un comportamiento que prueba estar totalmente alterado cuando la imagen es modificada.
Así, se propuso un detector de imágenes GAN extremadamente preciso con esfuerzo computacional limitado.
Con esta misma lógica, la Ley de Benford también es usada para el estudio de datos de compresión de JPEGs con el objetivo de determinar si una imagen se comprimió una, dos o más veces (inclusive detectando operaciones como rotación o escala).