Inhaltsverzeichnis:
Definition - Was bedeutet Sprachsynthese?
Die Sprachsynthese ist eine künstliche Simulation der menschlichen Sprache mit einem Computer oder einem anderen Gerät. Das Gegenstück zur Spracherkennung, die Sprachsynthese, wird hauptsächlich zum Übersetzen von Textinformationen in Audioinformationen und in Anwendungen wie sprachgestützten Diensten und mobilen Anwendungen verwendet. Abgesehen davon wird es auch in unterstützenden Technologien verwendet, um sehbehinderten Personen beim Lesen von Textinhalten zu helfen.
Techopedia erklärt die Sprachsynthese
Homer Dudleys VODER, der auf dem Vocoder von Bell Laboratories basiert, gilt als der erste voll funktionsfähige Sprachsynthesizer. Der bei der Sprachsynthese verwendete Computer ist als Sprachsynthesizer oder Sprachcomputer bekannt. Die Qualität des Sprachcomputers wird häufig anhand seiner Ähnlichkeit mit der menschlichen Stimme beurteilt. Die meisten Computer-Betriebssysteme haben seit Anfang der neunziger Jahre Sprachsynthesizer eingebaut. Synthetisierte Sprache wird normalerweise mit Hilfe der Verkettung von aufgezeichneten Sprachstücken erzeugt, die in einer Datenbank enthalten sind.
Das erste Stadium der Sprachsynthese ist die Vorverarbeitung, die die Unklarheit über die Art und Weise beseitigt, in der das spezifische Wort gelesen werden muss, und die auch den Umgang mit Homographen einschließt. In der nächsten Stufe der Sprachsynthese verwendet der Computer die Hilfe von Phonemen, um den Text in eine Folge von Tönen umzuwandeln. Die letzte Stufe beinhaltet die Verwendung menschlicher Aufzeichnungen oder grundlegender Klangerzeugungstechniken, um den menschlichen Sprachmechanismus nachzuahmen und den gesamten Text vorzulesen. Einer der populären Zweige der Sprachsynthese ist die audiovisuelle Sprachsynthese oder die multimodale Sprachsynthese, bei der ein animiertes Gesicht verwendet wird, das eng synchronisiert ist, um die synthetisierte Sprache zu ergänzen. Die multimodale Sprachsynthese enthält auch zusätzliche Funktionen, z. B. nonverbale Hinweise auf die Sprache, um die Kommunikation der Wörter des Benutzers mit größerer Genauigkeit zu unterstützen. Bei vielen Sprachsynthesesystemen können Benutzer die Art der Stimme auswählen, beispielsweise Männer- oder Frauenstimme.
Die meisten Sprachsynthesesysteme sind in der Lage, Texte zu lesen und auf sehr intelligente Weise auszugeben, obwohl die Stimme manchmal langweilig sein kann. Die Sprachsynthese muss jedoch noch die Fähigkeit entwickeln, das breite Spektrum menschlicher Intonationen und Kadenzen vollständig nachzuahmen.