IPS und Linguatec Sprachausgabe

Nach längerer Überlegung habe ich mich nun doch dazu entschlossen mein kleines Tool für diesesn kleinen Benutzerkreis zu veröffentlichen.
Vorweg: Die Sprachausgabe setzt eine funktionierende, aktivierte und vorallem LEGALE Version vom Linguatec Voice Reader voraus.

Das, was von meinem Tool erledigt wird, wäre auch von einer niedriglohnarbeitskraft durchführbar und greift an keinem Punkt in die Software ein.

Was genau passiert?

Das Programm kopiert einen Text in die Zwischenablage und drückt auf den „Abspiel“ Knopf. Das ist -ALLES-.

Dieses Tool ist kein IPS Modul oder etwas ähnliches, sondern nur ein „Workaround“ um die Sache zum laufen zu bekommen. Es bietet auch keine „Multiroom“ Unterstützung (denn ich wüsste nich wie ich sowas anstellen sollte). Eine Kommerzielle Nutzung verbietet Linguatec für seine Software, ich schließe mich dem für das Tool an.

Anleitung:

  • Wie schon gesagt muss VR installiert sein, allerdings brauchen wir nicht das Hauptprogramm, sondern nur den Voice Reader Direct. Dieser muss gestartet sein. Falls es das nicht ist, wird vom Programm der Standardpfad aufgerufen:
    C:\Programme\linguatec\VoiceReader\VRDirect.exe
    Es ist nicht notwendig, dass das Programm im Vordergrund oder maximiert ist. Ein vorhandensein im Hintergrund (Tray) langt.

  • Man läd sich mein Tool herunter:
    http://rapidshare.com/files/46421114/doVoice.zip.html
    Dieses sollte man am besten nach C: D: oder E: oder was auch immer kopieren, ist aber prinzipiell egal.
    Danach sollte man es einfach mal starten und über die GUI ausprobieren. Wenn es funktioniert, ist das meiste „geschafft“.

  • Integration in IPS


function say($text)
{

   IPS_Execute("C:/doVoice.exe", $text,false,false);

}

Der Pfad ist natürlich anzupassen. Wenn das Programm in c: liegt, wie vorgeschlagen, kann man es so lassen wie es ist.

Sollte also diese Funktion in eurem Programmtext sichtbar sein, kann man nun einen beliebigen Text ausgeben lassen:


say("Hallo Welt");

Das wars auch schon.
Damit ist eine beliebige Synthese von Text zu Sprache in IPS möglich; ich lasse mir z.B. morgens das Wetter ansagen.

Das Tool ist eine „1 Server“ Lösung. Es setzt vorraus das IPS und VR auf dem selben PC ist (mehr oder weniger). Es gibt auch eine „n Server“ Lösung bei welcher Text über TCP/IP gesendet und auf der anderen Seite ausgegeben wird.
Ich halte jedoch dies hier für wahrscheinlicher daher habe ich damit mal angefangen. Falls es bedarf gibt, kann ich demnächst mal die mehrserver Lösung vorstellen.

Noch ein paar warme Worte:
alles was ich möchte, ist „Fanatikern“ wie mir ein wenig mehr Möglichkeiten zu offenbaren. Falls sich also irgendwer (egal wer) von diesem Tool ******* fühlt, möge er es mir einfach mitteilen, dann entferne ich es.

Ich hoffe das euch mein Programm zusagt, und hoffe auf viele Rückmeldungen :slight_smile:

Hallo TimW,

aus Deinen Ausführungen geht nicht hervor, welche Vorzüge Deine Lösung gegenüber der in IPS integrierten Funktion TTS_Speak(…) hat.
Ich kann im Augenblick keine erkennen. :confused:

TTS_Speak funktioniert gut, es tut genau das, was es soll, und man muss keine zusätzlichen „Tools“ herunterladen.

Vielleicht kannst Du das noch etwas klarer herausstellen.

Gruß
HJH

Der Vorteil ist, das es meiner Meinung nach die beste Sprachsynthese Software ist die man für wenig Geld erhalten kann.
Wenn du dir mal:

anschaust, wirst du schnell erkennen, das der Unterschied zu den jetzigen Lösungen enorm ist.

Es gibt auch irgendwo weiter oben im Board noch einen Thread dazu, wo das auch von anderen bestätigt wird.

Hallo

Kann man die Stimme von Linguatec - die wirklich sehr natürlich wirkt - nicht über TTS_Speak wiedergeben, wenn sie mal installiert ist?

Gruss, Andreas

http://www.ipsymcon.de/forum/showthread.php?t=2419&highlight=Linguatec

Hallo Ferengi

Danke für den Tip, aber leider sind diese online-Lösungen nichts für Leute, die auf dem platten Land wohnen und sich - „dank“ Tel*com :mad: - mit ISDN begnügen müssen.

Gibt’s da schon was neues (Anbindung linguatec/IPS), immerhin ist der Thread ja schon fast 1 Jahr alt?

Gruss, Andreas

Hast Du schon mal über Sky Dsl nachgedacht? Geht super, habe das auch ne ganze Weile genutzt bevor ich DSL Lite:( bekommen habe.

Aufgrund eines anderen Threads weiss ich, das Linguatec nicht direkt in IPS integriert werden kann, daher die Antwort: nein.

Diese onlinelösung is schön und gut aber

  1. sie kann von heute auf morgen abgeschaltet werden
  2. zeichenbegrenzung

@sleepy

Hatte den Link für die Onlinelösung bladerunner nur angegeben, weil paresy dort schon mal zum TTS_Speak Befehl etwas geschrieben hatte, natürlich sollte man die Soft kaufen, kostet 49€ soweit ich gesehen habe. Das geht ja noch für die Qualität gegenüber den kostenfreien Lösungen.

Was mich allerdings bei allen Sprachausgaben stört, ist, dass diese bekannte Abkürzungen nicht richtig aussprechen können, wie z.B. DAX etc.

Linguatec kann zwar Nintendo nicht sagen, aber SNES klappt. Während Steffi permanent „snees“ (als Wort gesprochen) dazu sagt. DAX ist auch ein Sonderfall. Im Krassen Gegenteil zu allen Anderen wird DAX eben nicht wie D-A-X gesprochen. Man sagt aber ja B-M-W, A-O-L und T-N-T. Woher soll so eine kleine Software das wissen, dass es nicht auch D-A-X heisst?

Was kommt den bei „dax“ (klein geschrieben)? Vielleicht erkennt sie das als Wort.

Toni

Hallo Toni,

naja das währe, denke ich eigentlich nicht ganz so schwer, die Software müsste nur über eine Datenbank verfügen wie diese Sonderfälle ausgesprochen werden sollen. Vieleicht verlange ich jetzt auch ein wenig viel für 49€. Aber das sollte bald zum Standard werden, wenn ich bedenke wie lange schon an Sprach Ein- und Ausgabe entwickelt wird… Der gute alte SAM…

Thomas

umgekehrt aber auch nicht…

Es sollte für einen mittelmäßig erfahrenen Programmierer auch kein Problem darstellen den auszugebenden Text vorher zu parsen und text phonetisch anzupassen… :wink:

Toni

…na dann viel Spaß bei vieleicht 500 Wörtern mit ständig wechseldem Inhalt und das jeden Tag…:wink:

Du hast den Sinn un Zweck eines Parsers noch nicht ganz verstanden, oder?!? Darum gehts ja. Ein Suchen und Ersetzen Automatismus. Der Sucht dir auch den großen Brockhaus durch wenn du willst… Täglich…

Toni

Mein guter Toni, das ist mir schon klar.
Du meinst Parser analysiert jeden Tag meine 500 Wörter und das automatisiert. Aber jeder Parser ist auch nur so gut wie der der Ihn programmiert hat oder? Und ich finde halt das sollte die Aufgabe von Linguatec sein und nicht meine.

Dann solltest du dir die wesendlich umfangreichere Studio-Version zulegen. Genau das gewünschte Feature steht dir nämlich dort zur Verfügung.

Tja… Es ist halt wie so häufig. Man bekommt was man bezahlt… :wink:

Gruß,

Toni

Wo Du recht hast, hast Du recht.:slight_smile:
Da werde ich wohl doch auf ein wenig Kompfort verzichten und mir die preiswerte Version zulegen.:wink:

@sleepy: Jetzt hätt ich da mal eine Frage bzw einen Wunsch: Könnte man dieses Tool so umbauen, daß es nicht auf den „Abspiel“ Knopf, sondern auf den „Speichern“ Knopf drückt… damit eine wav-Datei erzeugt wird? Leider setzt das allerdings auch voraus, daß es danach nochmal im „Speichern unter“-Fenster auf „Speichern“ drückt.

Hintergrund: Ich würde das gerne für mein ISDN-Interface verwenden und brauche dafür eine Datei. Die darf auch ruhig grundsätzlich „Neue Datei.wav“ heißen… wird halt jedesmal überschrieben.

Viele Grüße, douglas882

Hallo douglas882,

an so einer Lösung bastelt Toni gerade, dann kannst Du die Dateien mittels Befehl in IPS erzeugen und abspielen.

Hallo zusammen,
gibts das oben angekündigte Feature zum abspeichern der Voice von Toni schon? Wäre ich auch sehr dran interessiert :slight_smile: