Kurzfassung

Audiocodierungen werden vorgestellt, welche im `Gebirge' eines gehörangepaßten Spektrogramms `Gratlinien' verarbeiten. Je nachdem, ob sie aus lokalen Maxima in frequenz- oder zeitparallelen Schnitten hervorgegangen sind, heißen sie Frequenz- oder Zeitkonturen. Eine gehörangepaßte Rücktransformation weist Konturpunkten Sinustonimpulse zu und überlagert daraus das ursprüngliche Signal. Bei optimaler Phasenrekonstruktion gäbe es fast keine wahrnehmbaren Verfälschungen. Weniger prägnante Konturen lassen sich pauschal als sogenannte Textur erfassen, die als zeitvariant gefiltertes Rauschen überlagert wird. Dies realisiert eine Trennung der tonal, rauschhaft und impulshaft empfundenen Signalanteile. Das Teiltonzeitmuster-Verfahren von Heinbach, in dem zeitvarianten Sinusschwingungen Frequenzkonturen darstellen, konnte wesentlich verbessert werden. Konturen sind wahrnehmungsorientiert, sie entspringen einem schematischen Modell der auditiven Informationsaufnahme nach Terhardt. Zwar scheint bei niedrigen Datenraten noch keine hohe Qualität greifbar, Codierungen bei 30 und 4,4 kbit/s erzielen aber befriedigende beziehungsweise noch einigermaßen akzeptable Sprachqualität, sind robust und bieten sicher noch Spielraum für zukünftige Optimierungen.


$Id: kzf.html,v 1.1 1998/03/15 02:42:41 mummert Exp mummert $