Rafał Korycki
Streszczenie
Pojawienie się cyfrowych nagrań audio sprawiło, że wykonywanie badań autentyczności stało się dużo trudniejsze, a w wieIu wypadkach wręcz niemożliwe. Powszechnie dostępne rozwiązania oraz darmowe oprogramowanie służące do edycji dźwięku pozwalają fałszerzom na wycinanie i wstawianie poszczególnych słów w sposób dowolny i bez wprowadzania słyszalnych znieształceń. Obecnie najczęściej wykorzystywanym rozwiązaniem używanym do wykrywania montażu jest analiza wahań częstotliwości prądu sieci energetycznej: Celem niniejszej pracy jest przedstawienie problemu detekcji śladów ingerencji w ciągłość zapisu oraz omówienie podstawowych metod wykorzystywanych do badania autentyczności cyfrowych nagrań fonicznych. Przedstawiono metody pomiaru częstotliwości, które następnie porównano z tradycyjnie używaną transformacją Fouriera, wykorzystywaną podczas wyodrębniania i analizy sygnału sieci energetycznej. Zaprezentowano możliwość graficznego wykrywania śladów montażu za pomocą analiz czasowo-częstotliwościowych wykonanych z użyciem wybranych transformacji czasowo-częstotliwościowych, których czytelność może być poprawiona dzięki zastosowaniu metody przemieszczenia. Rozwiązanie to umożliwia analizę minimalnych zmian tła akustycznego, które to zmiany mogą być oznaką modyfikacji nagrania. Trzecią przedstawioną metodą jest analiza przesunięcia ramek w plikach dźwiękowych skomprymowanych wykorzystaniem stratnych koderów psychoakustycznych. Wpływ parametrów algorytmu kompresji oraz kształtu użytego okna zostanie zaprezentowany na przykładzie kodera MP3. Ostatnim prezentowanym zagadnieniem są techniki analizy polispektralnej. W skrócie przedstawiono możliwość wykorzystania powyższych narzędzi w detekcji śladów ingerencji w ciągłość zapisów oraz możliwość ich zastosowania do analizy sygnału mowy.
Słowa klucze: badanie autentyczności, częstotliwość sieci energetycznej, detekcja montażu, analiza czasowo-częstotliwościowa, metoda przemieszczenia, dekoder odwrotny, MP3, analiza bispektralna, HOSA.
Summary
Since digital audio recordings appeared, audio authentication has became more difficult and in most cases impossible. Currently available technologies and free editing software allow the forger to cut or paste any single word without audible artifacts. Nowadays, the most frequently used solution in tampering detection is the Electric Network Frequency (ENF) method. This paper describes the problem of tampering detection and discusses the main methods used for authenticity analysis of digital audio recordings. For the first topic, frequency measurement algorithms are described and compared with simple Fourier transform generally used in forensic ENF extraction. Time-frequency analysis plots computed by selected transforms are presented and improved with reassignment method in purpose of visual inspection of modified recordings. Using these solutions, one can analyze minimal changes of background sounds, which can indicate tampering. The third approach is based on checking frame offsets in compressed audio files by using perceptual audio coding. The influence of compression algorithm parameters and window shapes are presented using MP3 encoder as an example. Additionally, the techniques from polyspectral analysis are described shortly. The usage of these tools in detecting forgeries is shown and the effectiveness in analyzing human speech is discussed.
Keywords: authenticity analysis, electric network frequency, tampering detection, time-frequency analysis, reassignment method, inverse decoder, MP3, bispectral analysis, HOSA.