Ich habe Audiodateien von Tierultraschallanrufen. 20kHz-70kHz ist mein Interessenbereich (was ich studieren möchte). Das Audio wurde mit 250 kHz abgetastet. Kann ich Wavelet-Analyse verwenden, um Anrufe in diesem Frequenzbereich zu untersuchen?

Brock McKean, Startup Engineer

Wavelet- und FFT-Analyse werden Sie beide dazu bringen, das zu bekommen, wonach Sie suchen, aber von den Geräuschen her sind Sie sich nicht sicher, wonach genau Sie suchen.

Sie können die Signale (Anrufe) im Zeitbereich (für Metriken wie Amplitude, Anstiegsgeschwindigkeit, Phase usw.) oder im Frequenzbereich (für Metriken wie Leistung, Frequenz, Gruppenlaufzeit usw.) analysieren. Sie benötigen einen Algorithmus zum Vergleichen dieser Metriken, der nicht notwendigerweise mit der Signalverarbeitung zu tun hat. Dies sind nur Zahlen einer Menge, die Sie versuchen, den Abstand zwischen ihnen zu finden.

Wenn Sie nach einer bestimmten Art von Anruf von einer bestimmten Tierart suchen, können Sie auch einen Korrelationsfilter verwenden, der das Signal als ähnlich erkennt. Dies ist eine ideale und schwierige Implementierung (aufgrund all der Einschränkungen und Messungen, die Sie vornehmen müssten).

Manuel V, B.Sc. Psychologie, Sanitäter
Beantwortet 1. April 2015

Sicher, entweder Wavelet-Analyse oder FFT sind praktikable Optionen für Ihre Aufgabe. Die Frage ist, sind sie überhaupt notwendig? Wenn FFT zum Beispiel verwendet wird, um elektrische Gehirnwellenmuster zu analysieren, ist das, was Sie zuvor an einer einzelnen EEG-Elektrode gemessen haben, nur ein einziger Spannungswert zu einem bestimmten Zeitpunkt. Dann haben Sie über einen gewissen Zeitraum genügend Messungen dieser Art. Das Ergebnis ist eine Kurve, die die Spannung über die Zeit darstellt. Sie verwenden dann FFT, um herauszufinden, aus welchen Frequenzen die resultierende Kurve zusammengesetzt ist. Da Sie auf einen Blick nur eine einzige fluktuierende Frequenz in dieser einzelnen Kurve pro Elektrode haben, ist FFT hier sinnvoll, um einen tieferen Einblick in die zugrunde liegenden Aktivitäten zu erhalten, die sich zu einer einzigen Kurve addieren.

Korrigiere mich, wenn ich hier falsch liege, aber soweit ich mich erinnere, bekommst du jede Frequenzkomponente eines Tons, wenn du sie mit einem Mikrofon aufnimmst. So sind akustische Visualisierer möglich, ohne dass eine höhere Rechenleistung benötigt wird FFT in Echtzeit auf den Song, den du gerade hörst. Daher sehe ich keine Notwendigkeit für eine FFT- oder Wavelet-Analyse bei Ihren aufgenommenen Tiergeräuschen. Sie können nur ihre Frequenz- / Zeitverteilungen mit einem Soundverarbeitungstool betrachten, und was Sie erhalten sollten, ist ein sich dynamisch änderndes Histogramm. Dann könntest du einen maschinellen Lernalgorithmus ausführen, um nach ähnlichen Mustern in diesen Klängen zu suchen, vorausgesetzt, du hast genug davon. Je mehr, desto besser für diesen Zweck.

Sie könnten Frequenzen und ihre Amplituden in diskrete Kategorien diskretisieren und dann Markov-Ketten erzeugen, um herauszufinden, welche Frequenzen oft von welchen anderen Frequenzen gefolgt werden und so weiter. Nachdem Sie damit fertig sind, können Sie einen einfachen Clustering-Algorithmus verwenden, oder Sie können euklidische Distanz verwenden, um zu berechnen, wie ähnlich verschiedene Tiergeräusche sind.

Hoffnung, die geholfen hat.

Mohsin Tiwana, PhD, Bionikentwickler, Unternehmer
Beantwortet den 6. April 2015

dFFT (diskrete Fourier-Transformation)

Wavelets, Ultraschall, digitale Signalverarbeitung, Audio, Signalverarbeitung, persönliche Frage