Im „Cultural Broadcast Archive“ (CBA) sind derzeit ca. 16.000 Stunden Radiosendungen gespeichert. Das Archiv wird einerseits als technische Plattform für den Sendeaustausch zwischen nichtkommerziellen Privatradios genutzt und steht andererseits als offenes Archiv für die interessierte allgemeine Öffentlichkeit zur Verfügung. Bei Bedarf soll vor dem Abspielen eines Beitrages die Musik in diesem Beitrag übersprungen und nur die Wortanteile ausgespielt werden. Eine manuelle Markierung der Musikanteile aller Radiosendungen würde zumindest Echtzeit benötigen, und ist daher nur mit großem Personalaufwand möglich.
Temporale Trennung von Musik und Sprache in Radiosendungen
Ziel des Forschungsprojekts ist es, ein Verfahren für eine automatische oder semi-automatische temporale Trennung von Musik und Sprache zu entwickeln. In der Literatur sind potentiell zielführende Ansätze vorhanden. Das Projekt CBA schließt einen Teil der Lücke zwischen der Literatur und einem frei verfügbaren implementierten Stand-alone Detektor. Ziel ist ein prototypisch implementiertes Verfahren zu entwickeln, das auf Grund der zur Verfügung gestellten Arbeitsdaten evaluiert wurde. Die prototypische Implementierung hat externe Abhängigkeiten und kann nicht Stand-alone eingesetzt werden.
Bearbeitung vorhandener und zukünftiger Beiträge
Der Betreiber des CBA kann mit der Leistung aus dem Forschungsprojekt einerseits das vorhandene Archiv bearbeiten und dabei die Trennung von Sprache und Musik ohne großem Aufwand durchführen. Andererseits kann mit den Ergebnissen des Projektes eine serverseitige Implementierung des Verfahrens erstellt werden. Mit dieser serverseitigen Implementierung können die Musikanteile aller zukünftig in das Archiv eingespielten Beiträge unmittelbar nach dem Einspielen (semi-)automatisch markiert werden.
Music compared to speech
Binarization step of the Continuous Frequency Activation feature
Sum of the binarized signal. Music leads to spikier peaks
Computation steps of the CBA-Feature