Gutes SSB-Audio – Mythos und Fakten

Ich möchte mich mal einem schwierigen und stets heißem Thema widmen, mit dem man fast täglich im Amateurfunk auf den Bändern konfrontiert wird und dem man sich kaum entziehen kann, sofern man Fonie und speziell SSB als Modulationsverfahren verwendet.

Schlaue Tipps und Wortmeldungen – häufig leider auch ungefragt oder unaufgefordert – bekommt man ja als aktiver Funkamateur genug, auch wenn ich aus Erfahrung und auch der bereits meist vorhandenen Kenntnis meiner eigenen Aussendungen, so manchen Hinweis gleich wieder unter den Teppich kehren kann.
Wer meint, sein Deckellautsprecher im Transceiver lässt eine brauchbare Einschätzung eines Audio-Signals zu, sollte sich doch dann mal genauer mit seinen eigenen Rahmenbedingungen in Bezug auf die eigene Wiedergabequalität auseinandersetzen. Eine „Referenz“ ist und kann das mit Sicherheit nicht mal im Ansatz sein oder werden.
Lieber mal aufs Signal-Spektrum schauen, heutige moderne SDR-Transceiver können das problemlos abbilden und zeigen gleich, „wo die Säge klemmen könnte“. 🙂 Damit kann man verlässliche und fundierte Aussagen treffen und dem QSO-Partner auch weiterhelfen.

Aus diesem Grund werden wir uns diesem Thema also nun mal von der rein fachlichen Seite nähern.


Unsere Stimme sorgt mit dem gesprochenen Wort für Sprache, einem unserer wichtigen Kommunikationsmittel. Umso wichtiger ist es, auch verstanden werden zu können, also müssen wir immer für eine gute Sprachverständlichkeit sorgen, damit unser Gegenüber verstehen kann, was wir mit der Sprache eigentlich ausdrücken wollen und welche Informationen wir damit übermitteln oder transportieren wollen.

Bei einer normalen (analogen) Funkübertragung von Sprache (ATV & Co. plus digitale Spielwiesen mal ausgeklammert) fehlt uns das Gegenüber visuell.
Wir haben nur unsere Ohren und die Stimme unseres Kommunikationspartners, aus der wir den Inhalt der Kommunikation extrahieren müssen.

Etwas Theorie bei Sprachübermittlung und -übertragung

Für eine gute Sprachkommunikation ist das Frequenzspektrum zwischen 300 Hz bis etwa 3400 Hz entscheidend, wobei man es auch etwas weiter fassen könnte, etwa in dem Bereich 150 Hz – 4000 Hz. Männer- und Frauenstimmen unterscheiden sich dabei etwas im Frequenzspektrum, meist liegen Frauenstimmen etwa eine Okatve höher als die der Männer.

Die Lautstärke ist dabei im Frequenzspektrum nicht gleich verteilt, im Gegenteil, Sprache weist eine sehr hohe Dynamik auf. Dabei sind Vokale am stärksten und liegen meist im Bereich bis etwa 500 Hz, Konsonanten hingegen finden sich eher im mittleren Frequenzspektrum zwischen 1000 Hz und etwa 2500 Hz und sind deutlich schwächer – aber sie sind entscheidend für die Verständlichkeit und damit äußerst wichtig. Zischlaute bewegen sich bereits meist oberhalb 3000 Hz, sind aber bereits für die eigentliche Verständlichkeit nicht mehr so wichtig bzw. entscheidend. Fehlen letzere, so ist unser Gehirn in der Lage, diese aus dem „Rest“ der gesprochenen Worte quasi zu rekonstruieren.

Wer einen etwas umfangreicheren Einblick in diese Thematik haben möchte, dem empfehle ich folgenden Artikel zur Vertiefung und Verständnis dieser ganzen Materie:
https://www.dpamicrophones.com/de/mic-university/background-knowledge/facts-about-speech-intelligibility/

SSB-Modulation

Doch zurück zu unserem Thema Amateurfunk. Auf Kurzwelle verwenden wir für die Sprachübermittlung meistens die Betriebsart SSB („Single-Side-Band“), neben anderen Optionen wie AM oder FM. Aber SSB ist die am häufigsten genutzte Betriebsart für Sprachübertragung.

Technisch bedingt nutzt man bei SSB einen etwas eingeschränkten NF-Frequenzbereich, beginnend bei etwa 200-300 Hz und endent meist zwischen 2700 – 2900 Hz. Uns steht also für die Übertragung von Sprache ein etwas eingeschränkter Bereich zur Verfügung, als es sonst in der Realität für die Sprachkommunikation unter uns Menschen der Fall wäre.

Gehen wir mal von einem SSB-Kanal zwischen 300 Hz und 2800 Hz aus – bedingt durch eingesetzte Filter „unten“ und „oben“, stehen uns also etwa 2,5 kHz Bandbreite zur Verfügung, wo wir die Sprache unterbringen müssen. In dieser Bandbreite steht uns ebenfalls unsere gesamte Sendeleistung zur Verfügung. Bei einem CW-Signal ist das relativ einfach, das Signal ist konstant in seiner Amplitude und Frequenz, die gesamte Leistung wird auf eine einzige Frequenz als pure Sinuswelle reduziert und ist praktisch ein unmoduliertes Signal. Bei Sprache ist das aber aufgrund ihrer hohen Dynamik nicht so. Die „Sprachenergie“ wird auf das Frequenzband bzw. die Kanalbandbreite verteilt, wir erhalten also als Ergebnis einen Mix aus verschiedenen Frequenzen, der sog. Sprechleistung (engl. „Average“). Das ist also ein moduliertes Signal (im Gegensatz zu einem unmodulierten CW-Signal) und bei diesem ist die Leistung etwas schwieriger zu messen. Aber sie entscheidet maßgeblich mit, mit welcher Signalstärke ich bei meinem QSO-Partner ankomme.

Ziel muss also sein, eine möglichst hohe Sprechleistung bei SSB zu erzeugen mit dem Fokus auf den mittleren Frequenzbereich 1000 Hz – 2500 Hz. Das beginnt, wenn man den vorigen Abschnitt richtig verstanden hat, damit, den für die Verständlichkeit wichtigen Bereich zwischen 1000 Hz bis etwa 2500 Hz herauszuarbeiten. Der für die Verständlichkeit nicht ganz so wichtige Tiefenbereich < 500Hz, dessen Energie ja eh schon höher als der mittlere Bereich ist, sollte also etwas reduziert bzw. bedämpft werden. Diese Anpassungen lassen sich meist mittels einfacher Klangregelung (Tiefen und Höhen) umsetzen, besser ist aber ein Equalizer, mit dem man gezielter einzelne Frequenzbereiche anheben oder absenken kann, je nach Stimmlage des Sprechers. Auch der Einsatz eines Hochpassfilters im Mikrofonsignalweg kann die Tiefen bedämpfen, aber den mittleren und höheren Frequenzbereich unmodifiziert passieren lassen.

Streitthema Kompressor bzw. Sprachprozessor

Jedoch haben wir immer noch ein gewisses Problem mit der hohen Dynamik der Sprache, also dem Unterschied zwischen kleinstem und höchstem Audio-Pegel. Hier kommen dann die sog. Kompressoren oder die noch besser auf Sprache abgestimmten Sprachprozessoren zum Einsatz. Beide dienen letztlich dazu, die hohe Dynamik zu reduzieren, indem man die lauten Pegel absenkt und die leisen Pegel anhebt. Sie sorgen letztlich für eine weitgehend gleiche Pegelverteilung des gesamten übertragbaren Frequenzspektrums innerhalb des Übertragungskanals und kompensieren bzw. verringern damit die Dynamik. Als Ergebnis erhalten wir eine höhere Sprechleistung („Talk Power“), die bei einem Kompressionsgrad um 10db schon um die 6-9db ansteigen kann, was schon fast eine ganze S-Stufe bedeutet – und das, ohne die eigentliche Sendeleistung zu erhöhen.

Der andere Weg, die Sprechleistung zu erhöhen, ist natürlich der Einsatz einer Endstufe, sprich QRO-Betrieb. Hier erreiche ich eine höhere Amplitude und damit eine höhere Signalstärke schlicht mit der Erhöhung der Sendeleistung. Es löst aber nicht das Problem des hohen Dynamikumfangs der Sprache, auch wenn der bei QRO nicht ganz so ins Gewicht fällt wie bei geringeren Leistungen. Ein 100W-Signal muss dann aber schon auf wenigstens 400W oder mehr gehoben werden, um einen ähnlichen Effekt (also um die +6db ≙ 1 S-Stufe mehr Signalstärke) wie dem eines aktiven und richtig eingestellten Kompressors zu erreichen.

Abschließend muss man sagen, bei Leistungen bis 100W ist der Einsatz eines Kompressors/Sprachprozessors immer sinnvoll und empfehlenswert, da er die Sprechleistung des SSB-Signals bis zu einer S-Stufe erhöhen kann. Essentiell sehe ich die Notwendigkeit eines aktiven Kompressors bei QRP-Geräten bzw. LowPower-Geräten der Klasse bis 20W. Selbstverständlich kann der Einsatz eines Kompressors auch bei QRO sinnvoll sein, besonders im SSB-DX-Geschäft. Das kombiniert dann beide Vorteile – mehr Leistung plus eine höhere „Talk Power“.

Resultierende Maßnahmen für ein gutes Audio bei SSB

Wer alles richtig verstanden hat, weiß nun, was zu tun wäre:

  • den unteren Frequenzbereich < 500 Hz reduzieren / absenken, dabei im Bereich 300 Hz – 500 Hz moderat bis gering eingreifen, unter 300Hz kann es schon etwas mehr sein
  • den mittleren und höheren Frequenzbereich 1000 Hz bis 2500 Hz – der absolut entscheidend für die Verständlichkeit ist – herausarbeiten / verstärken (1000 Hz – 1700 Hz ca. 0..+3db, ab 2100 Hz etwa +6..+9db)
  • nach Möglichkeit einen Kompressor bzw. Sprachprozessor verwenden bzw. aktivieren bei moderatem Kompressionslevel, um die durchschnittliche Sprechleistung des SSB-Signals zu erhöhen und die hohe Dynamik der Sprache zu kompensieren

Hinweis: Die angegeben Werte sind Erfahrungswerte, die allerdings sehr wohl auf Messungen und Auswertungen des Sprachspektrums beruhen. Sie dienen in erster Linie als Ansatz, Orientierung und Starthilfe. Je nach Sprecher- bzw. Stimmentyp können diese Einstellungen natürlich auch etwas abweichen.

Alle Einstellungen richten sich natürlich nach der eigenen Stimmlage und dem sich daraus ergebenen Stimmenspektrum, aber Dämpfung oder Verstärkung sollte immer im moderaten Bereich erfolgen, es macht kaum Sinn, Tiefen mit -20db zu bedämpfen und Höhen +20db anzuheben – das ergibt ein unnatürliches Audio. Meist sind Korrekturen im Bereich zwischen 3db und 9db vorzunehmen (bei einer Schrittweite von 3db, also z.B. -9db, -6db, -3db, 0db, +3db, +6db und +9db), das ist völlig ausreichend und erzielt bereits mit bis zu 98% Wahrscheinlichkeit die gewünschte Wirkung bzw. eine entsprechend wahrnehmbare Frequenzgangkorrektur des Sprachspektrums.

Auch die Kompression sollte nicht übertrieben werden, meist reichen Werte im Bereich 6db-10db.
Voraussetzung ist natürlich – unser eingesetztes Mikrofon hat einen weitgehend linearen Frequenzgang und muss nicht auch noch in die Frequenzgang-Korrekturen zusätzlich einbezogen werden.
Leider geben die meisten Hersteller die Einstellungen des Kompressors/Sprachprozessors nicht in db an, sondern oft als einfache metrische Skala von z.B. 0-100. Das ist eigentlich ärgerlich, lässt es doch eine gezielte Einstellung mittels db-Skala meist nicht zu. Eine Tabelle Wert 0-100 entspricht XX db fehlt häufig ebenfalls. Hier hilft dann – leider – nur ausprobieren.

Auch wenn es viele nicht gerne hören wollen, eine basslastige, tiefenbetonte SSB-Modulation, die ich immer gerne als „Sofa-Modulation“ bezeichne und leider öfter höre als mir eigentlich lieb wäre, hat nicht den Anspruch einer guten, ausgewogenen Modulation. Das widerspricht schlicht der Theorie. Besonders unter schwierigen Empfangsbedingungen „versackt“ eine solche Einstellung und damit das Signal schneller unter das lesbare Signal-Rauschverhältnis als eine mitten- und höhenbetonte Einstellung.
Wir erinnern uns – das ist der Bereich, der essentiell für eine gute Verständlichkeit von Sprache zuständig ist.
Selbst ein QRO-Signal kann bedingt durch starke QSB-Phasen schneller absinken als man vermuteten mag.
Unser ausgesendetes Audio ist natürlich immer auch eine Art Aushängeschild für unsere QSO-Partner.

SSB hat und kann auch gar nicht den Anspruch einer „HiFi- oder Broadcast-Qualität“ haben, da uns nur ein eingeschränkter Frequenzbereich für die Übertragung der Sprache zur Verfügung steht. Auch spielt eine gewisse Subjektivität in Sachen Audiowahrnehmung auch immer eine Rolle. Trotzdem bleibt die Theorie hinter allem gültig und sollte berücksichtigt werden.
Ziel und Schwerpunkt muss eine gute Sprachverständlichkeit sein, die auch noch unter schwierigeren (Empfangs-)Bedingungen weitgehend sichergestellt sein sollte und eine Kommunikation noch möglich macht.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert