spracherkennung

hallo

ist es möglich über Google now oder ähnliches eine Sprach to text umwandlung auszulösen direkt über die webfront egal ob pc oder App
beim app ist das mic ja in der nähe
bei einem Tablet oder all in one pc ja auch
und dann ggf mit Definition von keywords Aktionen auszulösen
da Google ja auch die sprache erkennen kann könnte man wenn nicht deutsch grad direkt in Google übersetzer schicken und dann den deutschen string auswerten
ggf kann man diese Dienste/ Antworten bei normalen web abfragen oder wiki wissen auch direkt einbinden text basiert oder text to speek
somit würden sich dann ggf auch per push akustische Meldungen möglich sein

gruss Roman

Ja, ist es. Die API von google ist meine ich noch nicht öffentlich. Also entweder gehst du den Weg über die Entwicklung eines Chrome-Plugins oder du versuchst dich mal mit Cortana von Microsoft. Einer der vielen „Siri-Proxi-Hack-Lösungen“ dürfte auch ans Ziel führen.

Egal für welche Lösung du dich entscheidest. Du musst viel, viel lesen. Einfacher ist es sicher dir eine fertige Raspi-Lösung zu installieren und damit etwas herum zu experimentieren.

Edit:

Abseits vom Webfront und der IPS-App hab ich Alicoid (Andoid App) auch schon IPS-Befehle beigebracht. Man kann dort lokal (also auf dem Android) Befehle zu Webseiten zuordnen. Lässt man die Aufrufe auf den IPS-Webserver zeigen kann man leicht Skripte triggern. Ist aber Frickelkram. Eine hausgemachte Windows-Lösung habe ich hier beschrieben: Die Siri-Alternative

Gruß,

Toni

ja mit Windows hab ichs auch schon hingekriegt
der dient mir als Main Touchscreen und ist an der Wand angeschraubt
und er kann auch in sleep gehen und dann dauert es etwas bis alles wieder rdy ist
das schöne am Handy ist halt das ichs immer dabei habe, und dann eben nicht extra vom Sofa aufstehen muss
auch sehe ich an der flexibiltät zB jetzt von Google denn bei Win ist es ja so dass die Spracherkennung auf den aktuellen Benutzer abgestimmt ist und bei Google kann ich sogar ohne Umstellung deutsch oder englisch sprechen und er verstehts
ich meine wenn ich nur schon das Gesprochene als Text in der SPS oder in IPS hätte, eine Auswertung vom text zur Aktion sollte eigentlich mit etwas Aufwand zu machen sein, die entsprechende Aktion zu programmieren ist dann das leichteste
oder umgekehrt ein Text schicken kann der dann ggf automatisch vorgelesen wird

ggf ist auch mit siri Home kit was ja mit IOS8 kommen soll etwas zu machen

PS was meinst du mit fertigen Raspi lösung ?
also meinst du eine externe Auswertung auf nem Rasperi pi?

gruss Roman

Du kannst Siri nicht direkt ansprechen, wenn ich mich recht erinnere. Darum musst du einen Siri-Proxiserver bei dir zuhause aufsetzen. Der sparsamste und billigste Server für kleine Aufgaben war ja lange Zeit der Raspberry Pi. Dafür gibt es so eine Lösung fix und fertig auf SD-Karte meine ich.

Mit Siri habe ich mich nie befasst.

Toni

ach so nun hab ichs verstanden
aber eben mit ios8 sollte siri direkt ansprechbar sein

wobei man aber abhängig von apple ist
darum die frage über das webfront sprache (über zb Google über das internet) in Text umzuwandeln und dann diesen auf der SPS oder in IPS auszuwerten und ggf Aktionen auslösen zu können

da eben immer häufiger ein mic in der nähe der ips Clients ist (sei es Smartphone oder tablet oder all in one PC)
wäre doch so euch eine recht flexible Sprach Steuerung zu realisieren

ich meine zb auf der googleseite wird ja auch nichts anderes gemacht
klicke ich auf das Microfonsymbol wird mein dann gesprochene in text umgewandelt und von da an ist es der selbe Ablauf wie wenn ich den text mittels Tastatur eingebe

gruss Roman

Das Webfront ist in erster Linie mal eine Webseite. Dieses Feature müsste also von deinem Browser unterstützt werden, der Zugriff auf die hardware deines Endgerätes hat (Mikrofon). Ein Browser, der auf einem iOS8 läuft könnte sicher direkt mit siri kommunizieren. Ich kann dir aber leider nichts über Siri und andere Apple-Produkte erzählen.

Aber die selbe Problematik besteht aber auch auf Android. Chrome für Android hat die Spracheingabe bereits integriert. In wie weit man da etwas personalisieren kann weiss ich aber nicht. Wenn da soetwas nicht schon vorgesehen ist, wovon ich erstmal nicht ausgehe, und man kein Chrome-Plugin schreiben kann oder möchte, gibts sicher einfacherer Wege eine IPS-Sprachsteuerung mit dem Handy zu realisieren als über einen Browser.

Toni

ja genau dahin geht ja mein Gedankengang

Eine Möglichkeit ist die interne Spracherkennung zu nutzen sei es siri oder android oder was auch immer
die dann die eingabe wandeln und entsprechende Aktionen auslösen

die andere, meiner meinung auch flexible Möglichkeit ist
die Spracheingabe in text umwandeln (egal ob siri oder eben über internet , zb Google)
und dann den zurückbekommenen text in ips oder die sps zu bringen und dann die Auswertung und ggf Aktionen dann von ips oder sps auslösen

zb der text kommt als string in dem fast alles drinstehen kann (irgendwo halt längenbegrenzt)
in der sps oder ips frage ich dann ab ob zb „Licht“ „Wohnzimmer“ „Deckenlampe“ „einschalten“ im string vorkommen und wenn ja schalte ich das licht ein

somit kann der Aufwand beim Client zur Aufgabe reduziert werden Sprache als text umzuwandeln, egal wie, als Ausgabe kommt ein string
ggf kann man dann eben auch noch die Info der Sprache (deutsch englisch, chinesisch oder was auch immer) ermitteln und entweder als weitere variable mitgeben oder wenn nicht zb Deutsch über einen web translater schicken
so das immer ein string in deutsch (oder englischer) sprache kommt

gerade wenn man nur auf key wörter schaut müsste dadurch eine recht einfache aber zugleich vielfälltige Spracheingabe zu realisieren sein

die Auswertung ist dann nicht mehr auf dem Client

gruss Roman

Servus

wenn du ein Android gerät hast dann such mal nach „AutoVoice“ und „Tasker“.
Mit dieser Kombination sollte das klappen.

gruß
bb

Oder Alicoid, oder Cortana von Microsoft oder ein Siri Proxi :rolleyes:

Danke
ich muss mal alles etwas durchlesen
Info habt ihr mir ja nun einige gegeben :slight_smile:

den Gedanken dies per web und somit Plattform unabhängig zu machen lässt mich aber noch nicht ganz los
wobei da wohl noch einige hürden kommen
mittels html5 geht’s ja zumindest wenn man mit Chrome surft, und das Plattformunabhängig

wäre denn so etwas das Webfront zu integrieren sehr komplex und dann das erhaltene in einen String als text zu schreiben?