Figurerkennung

Musikalischen Ausdruck von Harmonie trennen

Aufgenommene oder importierte statische MIDI-Noten müssen in dynamische Phrasen übersetzt werden, damit sie für das Music Prototyping nützlich sind. Dazu wird der musikalische Ausdruck von der Harmonie getrennt und die resultierende Phrase mit Hinweisen versehen, damit eine spätere Umkehrung dieses Prozesses so genau wie möglich ist. Jeder Schritt in diesem Prozess ist mehrdeutig, weil die benötigten Informationen nirgends zu finden sind und aus dem Kontext erraten werden müssen.

Schätze Tonarten, Akkorde und Skalen, die einem MIDI-Take zugrunde liegen.
Schätze die genauen Positionen der Akkordwechsel.
Beseitige Ungenauigkeiten, ohne den Ausdruck zu beeinträchtigen.
Identifiziere einzelne Stimmen.
Schätze eine nützliche Gruppierung von Melodiefragmenten, Akkorden und Basslinien.
Füge Hinweise darauf hinzu, wo eine Phrase Schwierigkeiten haben könnte, wenn sie gegen eine andere Harmonie wiedergegeben wird.
Bereinige und optimiere das Ergebnis.

Für einen durchschnittlich aufgenommenen Take gibt es Millionen, manchmal sogar Milliarden möglicher Lösungen für die Figurenerkennung. Nur ein paar hundert sind musikalisch plausibel. Diese müssen bewertet und aussortiert werden. Dazu greift Synfire auf eine umfangreiche Wissensbasis zurück, die durch Algorithmen der künstlichen Intelligenz unterstützt wird.

Einschränkungen

Aufgrund der Mehrdeutigkeit und des Ratespiels, das damit verbunden ist, kann die Figurerkennung unmöglich genau umkehrbar sein. Das heißt, dass eine Figure, die gegen ihre eigene geschätzte Harmonie gerendert wird, höchstwahrscheinlich MIDI-Noten erzeugen wird, die sich leicht vom Original unterscheiden.

Das ist kein Fehler des Algorithmus, sondern eine generelle Einschränkung, wenn man sich der Musik mit Mathematik nähert. Musik ist keine exakte Wissenschaft, sondern ein Artefakt der menschlichen Kultur. Eine Software kann nur begrenzt alle Aspekte der Musik formal darstellen und verarbeiten.

Die Figure-Erkennung ist immer noch gut genug, um in mehr als 80 % der Fälle nützlich zu sein. Sie ist ein fantastisches Werkzeug, um wiederverwendbare Phrasen aus aufgezeichneten Darbietungen zu sammeln. Schließlich geht es beim Music Prototyping darum, neue originale Musik zu machen, nicht darum, bestehende Kompositionen originalgetreu nachzubauen.