“Este trabajo representa un importante paso adelante en el fortalecimiento de nuestra ventaja informativa mientras combatimos sofisticadas campañas de desinformación y amenazas sintéticas de los medios”, dice Bustamante. Hive fue seleccionada de un grupo de 36 empresas para probar su tecnología de atribución y detección profunda de falsificaciones con el DOD. El contrato podría permitir al departamento detectar y contrarrestar el fraude mediante IA a escala.
La defensa contra los deepfakes es “existencial”, afirma Kevin Guo, director ejecutivo de Hive AI. “Esta es la evolución de la guerra cibernética”.
La tecnología de Hive se basa en una gran cantidad de contenido, algunos generados por IA y otros no. Capta señales y patrones en el contenido generado por IA que son invisibles para el ojo humano pero que pueden detectarse mediante un modelo de IA.
“Resulta que cada imagen creada por uno de estos generadores tiene ese tipo de patrón si sabes dónde buscar”, dice Guo. El equipo de Hive realiza un seguimiento constante de los nuevos modelos y actualiza su tecnología en consecuencia.
Las herramientas y metodologías desarrolladas a través de esta iniciativa tienen el potencial de adaptarse para un uso más amplio, no solo abordando desafíos de defensa específicos, sino también protegiendo a las instituciones civiles contra la desinformación, el fraude y el engaño, dijo el DOD en un comunicado.
La tecnología de Hive ofrece un rendimiento de alto nivel en el descubrimiento de contenido generado por IA, afirma Siwei Lyu, profesor de ciencias informáticas e ingeniería en la Universidad de Buffalo. No participó en el trabajo de Hive, pero probó sus herramientas de detección.
Ben Zhao, profesor de la Universidad de Chicago, que también ha publicado de forma independiente evaluado La tecnología deepfake de Hive AI está de acuerdo, pero señala que está lejos de ser infalible.
“Hive es ciertamente mejor que la mayoría de las entidades comerciales y algunas de las técnicas de búsqueda que probamos, pero también demostramos que no es nada difícil de eludir”, dice Zhao. El equipo descubrió que los adversarios podían alterar las imágenes de una manera que eludía la detección de Hive.