Eindelijk spreekt Barack Obama zich zonder meel in de mond uit over zijn opvolger. Hij kijkt recht in de camera en zegt luid en duidelijk: ‘President Trump is a total and complete dipshit.’ Maar ... zo te zien zegt hij dit vanuit het Oval Office, de werkkamer van de president. Hoe kan Obama dat gezegd hebben terwijl hij zelf nog president was?
Zo valt de uitzending van Tegenlicht over deep fake news met de deur in huis: deze technologie zal weldra binnen bereik zijn van talloze anonieme bloggers en trollen op Facebook. Wat doet dat met de maatschappij en de burger, als je niets en niemand in de media nog kunt vertrouwen?
Deep fake is het volgende niveau in het manipuleren van video en audio, met dank aan zelflerende netwerken. Als je dertig seconden goede kwaliteit geluidsmateriaal hebt van iemand, kun je die persoon alles laten zeggen wat je wilt. Daarin zitten namelijk alle klanken die iemand gebruikt. Een computer kan daaruit een willekeurige gesproken tekst samenstellen, met de stem van die persoon.
Om in een video het gezicht van persoon A te vervangen door dat van persoon B is meer nodig, onder andere de inzet van neurale deep-learning-netwerken. Een neuraal netwerk is een stuk software waarvan de werking lijkt op hoe onze hersencellen communiceren en nieuwe taken leren.
In de trainingsfase destilleert deze software uit honderden beelden van het gezicht van A, respectievelijk B, ieders gezichtskenmerken. Eerst leert het netwerk alleen maar om, met als input een videobeeld waar A in voorkomt, op basis van de gezichtskenmerken van A een gezicht van A te reconstrueren (en hetzelfde voor B). Dat lijkt een zinloze exercitie: een zeer omslachtige manier om een kopie van een gezicht te maken.
Maar de truc is, dat je dit netwerk nu ook een gezicht van A kunt laten reconstrueren met als input een videobeeld waar B in voorkomt. Met andere woorden: het gezicht van B in de video wordt vervangen door het gezicht van A.