240712
跑Kaggel上跑通DeepFake检测baseline方法
服务器上配环境
看baseline代码
240713
看baseline代码,MEL频谱、FFT
Fourier真牛,FFT变换是一个工具,把FFT想成一个黑盒子,输入是时空里我们观察到的一段信号,经过FFT之后,得到的是组成这个信号的频率成分。
240714
FFT、Window-Fourier Transform、Wavelet Transform,写MEL频谱图这个步骤有点慢,一直卡在这儿
FFT虽然能分析出频率成分,但是根据他分析出来的频率成分我们是得不出来之前的频率长啥样的。
对于平稳信号的FFT可以顺利分析出其中的频率成分,但若遇上非平稳信号,FFT缺乏对时间和频率的定位。所以引出了加窗FFT,通过对窗格内的信号进行FFT来进行频率分析。但是窗口大小是固定的,大小也是很难确定的。
后来,再进一步,发明了Wavelet Transform,将FFT里无限长的三角函数基,换成了会衰减的小波基,通过这样变换分析出来的频率是随时间变换的。
没记了。。。