Cultural Broadcast Archive (CBA)

Übersicht

Im „Cultural Broadcast Archive“ (CBA) sind derzeit ca. 16.000 Stunden Radiosendungen gespeichert. Das Archiv wird einerseits als technische Plattform für den Sendeaustausch zwischen nichtkommerziellen Privatradios genutzt und steht andererseits als offenes Archiv für die interessierte allgemeine Öffentlichkeit zur Verfügung. Bei Bedarf soll vor dem Abspielen eines Beitrages die Musik in diesem Beitrag übersprungen und nur die Wortanteile ausgespielt werden. Eine manuelle Markierung der Musikanteile aller Radiosendungen würde zumindest Echtzeit benötigen, und ist daher nur mit großem Personalaufwand möglich.
Externe MitarbeiterInnen
Wieser Ewald
Finanzierung
FFG Innoscheck Plus
Laufzeit
01.06.2012 – 30.11.2012
Projektstatus
abgeschlossen

Temporale Trennung von Musik und Sprache in Radiosendungen

Ziel des Forschungsprojekts ist es, ein Verfahren für eine automatische oder semi-automatische temporale Trennung von Musik und Sprache zu entwickeln. In der Literatur sind potentiell zielführende Ansätze vorhanden. Das Projekt CBA schließt einen Teil der Lücke zwischen der Literatur und einem frei verfügbaren implementierten Stand-alone Detektor. Ziel ist ein prototypisch implementiertes Verfahren zu entwickeln, das auf Grund der zur Verfügung gestellten Arbeitsdaten evaluiert wurde. Die prototypische Implementierung hat externe Abhängigkeiten und kann nicht Stand-alone eingesetzt werden.

Bearbeitung vorhandener und zukünftiger Beiträge

Der Betreiber des CBA kann mit der Leistung aus dem Forschungsprojekt einerseits das vorhandene Archiv bearbeiten und dabei die Trennung von Sprache und Musik ohne großem Aufwand durchführen. Andererseits kann mit den Ergebnissen des Projektes eine serverseitige Implementierung des Verfahrens erstellt werden. Mit dieser serverseitigen Implementierung können die Musikanteile aller zukünftig in das Archiv eingespielten Beiträge unmittelbar nach dem Einspielen (semi-)automatisch markiert werden.

Music compared to speech

Binarization step of the Continuous Frequency Activation feature

Sum of the binarized signal. Music leads to spikier peaks

Computation steps of the CBA-Feature

Publikationen

Wieser, E., Husinsky, M., & Seidl, M. (2014). Speech/Music Discrimination In A Large Database Of Radio Broadcasts From The Wild. In Proceedings of the 2014 IEEE International Conference on Acoustic, Speech and Signal Processing (ICASSP). Florenz.