LLM (Large Language Model) und das Smarthome - wäre das nicht schön?

DigiHouse · 26. September 2023 um 16:57

Hallo Ralf,

jein. Ich habe es nochmal nachgestellt. Für antworten bzw. bearbeiten trifft das für mich unter Chrome auch zu. Beim Thread erstellen habe ich aber nur Vorschläge zu ähnlichen Themen rechts:

VG André

Nachtrag: Sorry, hab´s gefunden - das kann man wegklicken. Gedanke: Vielleicht kann sich das Fenster automatisch beim Wechsel in die Texteingabe schließen.

Dennoch: wie sieht die Gemeinde ein KI-gesteuertes Smarthome ?

Hagbard235 · 26. September 2023 um 17:54

Was würdest du denn mit dem LLM erreichen wollen? Per API habe ich schon GPT4 angebunden, also ihr meinen Objektbaum „gegeben“ und dann Befehle auswerten lassen… also sowas wie „Ich möchte alle Lampen im Erdgeschoss ausschalten, gib mir die IDs der Geräte“ z.B., sowas kann er beantworten „out-of-the-box“ .

Ich habe vor Jahren schon mal eine App gebaut die per Spracherkennung und natürlicher Sprache IPS bedienen konnte, aber ohne selber ein Hotword integrieren zu können machte es als Assistent keinen Sinn, seit dem liegt es irgendwo auf der Platte

DigiHouse · 26. September 2023 um 18:32

Ja, im ersten Ansatz genau so etwas. Für mich schließe ich jedoch ein Anbinden an GPT4 aus. Es muss lokal sein. LLAMA 2 in Q4 bekommt man auf einem lokalen Rechner lauffähig (hier testweise ein LLAMA 2 70b), so dass alles im eigenen Netzwerk bleiben kann.

Anwendungen sehe ich auch in Reaktion auf bestimmte Situationen oder Erlernen von Vorlieben.

VG André

Hagbard235 · 26. September 2023 um 18:40

Die „Vorhersage“ habe ich schon vor 3 Jahren mal probiert, als ML aufkam, aber hab dann festgestellt, dass alles was vorhersagbar war eh in Scenen oder Scripten schon abgebildet ist. Den größten Vorteil sehe ich in „freier“ Text/aka Spracheingabe und die Übersetzung in Befehle, aber dafür müssten die Sprachassistenten also Google Alexa eine Einbindung ermöglichen, denn wenn man ehrlich ist haben sie die einzigen brauchbaren Spracherkennungen, lokal läuft alles Mist.

DigiHouse · 26. September 2023 um 19:14

Du hast Recht, dennoch schaue ich mir späterhin jedoch auch mal SpeechRecognition an. Whisper scheint leider auch eine API zu OpenAI zu sein. Gesehen habe ich auch mal eine Wandlung Audio zu Spektren also Bild und dann eine Auswertung über ein trainiertes CNN.

Wie hast Du GPT4 eingebunden ? Lokal finde ich es schwierig erst einmal die richtigen Templates zu erstellen, aber vielleicht kann man da Ideen generieren.

Es ist auf jeden Fall unglaublich interessant, wenn man im Debug-Modus die „Gedanken“ liest. Als Ansatz habe ich ein paar LangChain Tools erstellt. Wie man sieht sind hier primär Fragestellungen nach aktuellen Wissen enthalten und geplant dann auch die Sichtung eigener Dokumente. Das hat letztlich nichts mit Smarthome zu tun, aber letzteres wäre eben Nebenprodukt (SendPost).

tools = [
    Tool(
        name='Time',
        func=GetCurrentTime.run,
        #func=actual_time.run,
        description='useful for getting date and time'
    ),
    #Tool(
    #    name="SerperSearch",
    #    func=serper_search.run,
    #    description="useful for when you need to answer questions about everything you does not know"
    #),
    Tool(
        name="GoogleSearch",
        func=google_search.run,
        description="useful for when you need to answer general questions or current events. You should ask targeted questions"
    ),
    Tool(
        name="Wikipedia",
        func=wikipedia.run,
        description="useful when you need an answer about encyclopedic general knowledge"
    ),
    Tool(
        name='PubMed',
        func=pubmed.run,
        description='useful only for querying medical publications'
    ),
    #IFTTTWebhook(
    #    name="Spotify", 
    #    description="Play a song from spotify playlist", 
    #    url=url
    #),
    Tool(
        name='SendPost',
        func=send_post_to_server.run,
        description="useful only for switching devices. Input should be a json string with the keys: 'source':'AI', room, device, action."
    )
]

Gruß André

micf1 · 15. Juli 2024 um 08:35

Ich finde das Thema spannend und wundere mich, dass das hier schon ein Jahr alt ist.

Mit einem LLM könnte man endlich Star Trek Level erreichen
Das Problem bei einer lokalen Installation wird aber die GPU sein.
Die meisten werden Symcon ja auf einem pi oder ähnlich sparsamen System laufen haben.
Da ist man mit einer lokalen KI raus.

Hat man aber einen vernünftigen (Gaming) Rechner am Start, könnte man mittels Ollama doch einiges erreichen.
Llama3 ist nicht ganz so eloquent wie GPT4, aber für das vollkommen ausreichend.

Kann ich nicht die Spracheingabe von Alexa in Symcon abgreifen?

Hagbard235 · 15. Juli 2024 um 08:43

ich wiederhole mal meine Frage von oben:

Was möchtest du denn damit konkret bewirken? Also etwas konkretere Usecase-Beschreibungen würden helfen.

micf1 · 15. Juli 2024 um 14:56

Ich möchte mich mit Symcon unterhalten, wie mit dem Star Trek Computer.

Angefangen vom Licht einschalten ohne die Rückfrage, „ich habe mehrere Geräte mit Namen Licht …“ bis hin zu Wissensfragen. Ich will mich unterhalten können, als sei es ein Mensch.

MarekG · 19. Juli 2024 um 05:57

Auf so etwas hoffe ich auch noch immer.
Hier gab es mal so etwas in die Richtung.

Leider weiß ich nicht, wie es da weiter gegangen ist und der Kollege war das letzte mal hier 2021 online…
Klang auf alle Fälle vielversprechend.

BeLo · 12. November 2024 um 10:51

Hallo ich häng mich hier mal rein.

Ich beschäftige mich an mehreren Ecken mit KI Unterstützung und finde es Teilweise schon sehr ernüchternd aber auch beeindruckend, wenn es dann mal soweit ist, erhoffe ich mir schon eine Zeitersparnis.

speziell für Symcon, würde ich mir wünschen, dass eine KI direkt mit integriert wird und sich perfekt mit dem Programm auskennt und auch am eigenen System dazulernt.
was mir spontan einfällt:

selbstständige Erstellung von Scripten oder Abläufen, z.b.
„IPS“ - " schalte in der Werkstatt die Beleuchtung solange aus, bis ich mich wieder dazu melde." (simple Partyschaltung)
oder
„schalte die Außensteckdose für 3min an, wenn eine Bewegung im Eingang erkannt wird aber nur wenn ich nicht zuhause bin“
oder (höheres Level)
„schalte mir die Werkstattsteckdose, ab morgen für 3h am Tag an, wenn die Temperatur für länger als 24h unter 3grad ist, bis der Winter vorbei ist“
oder
„gib mir eine Zusammenfassung der Außentemperaturen und Gasverbrauch der letzten 2 Jahre und vergleiche diese-> Warum war der Verbrauch 2023 höher?“ (Als Antwort würde ich da z.B. erwarten: Es war 2023 kälter und die Solltemperaturen der Zimmer x/y waren höher als 2024, außerdem waren die Fenster bei niedrigen Temperaturen verhältnismäßig lange offen)

die Frage/Antworten bitte nicht auf die Goldwaage legen, war nur mal runtergeschrieben.
Aber so oder so ähnlich würde ich es mir vorstellen… ein Helferlein beim erstellen, steuern und auswerten.

alles sollte natürlich lokal ablaufen, wie z.b. die Kombination aus Ollama, Piper TTS, Whisperer

Das wäre so meine Vorstellung für die nächsten Jahre…

Falls es Absurd klingt, es aber trotzdem jemand so ähnlich am laufen hat, wäre ich für Infos der Umsetzung dankbar.

Boui · 14. November 2024 um 09:55

Das klingt gar nicht absurd.

Aktuell eher noch unrealistisch. Ich bin in einigen Feldern über KI unterwegs und es ist meist nicht vollständig eingebunden und funktioniert eher ernüchternd.
Oft macht es mich wütend.

Ich bin gespannt auf Apple Intelligence & Siri i.V.m dem im März angekündigten KI-Display.

Hoffen darf man ja.

LG

BeLo · 14. November 2024 um 11:11

Ja, das kenne ich, vor allem wenn Ergebnisse nicht stimmen und wenn man dann mehrfach nachfragt wird das Ergebnis immer verwirrender…
In einigen Fällen wäre man dann schneller es selbst zu tun und hätte dazu kein mulmiges Gefühl ob das Ergebnis korrekt ist.

ja, die Entwicklung wird die Jahre wohl Wahnsinns Fortschritte machen… beängstigend, wenn man die aktuellen DeepFake Videos anschaut. (gleichzeitig faszinierend )

Aber zurück zum Thema.
Wenn eine KI wenigstens komplett IPS versteht und einem an jeder Ecke hilfreich zur Seite steht, dann wäre das ja schon eine große Zeitersparnis.

bbernhard · 14. November 2024 um 12:02

Aber wäre doch ideal IPS komplett wegzulassen, weil das wäre dann ja die größte Zeitersparnis. Oder nicht ?

Persönlich geht mir der AI Hype schon ziemlich auf den Keks. Kannst ja fast nicht mal mehr ein Packerl Milch kaufen ohne das du AI seitig zwangsbeglückt wirst. In der Firma sinds sowieso komplett verrückt. Projekte kriegst nur genehmigt wenn AI oder Ml draufsteht. Für was AI dann steht und was damit passiert interessiert und kapiert keine Sau, hauptsache es ist drin.
Is so wie vor ein paar Jahren wo unbedingt alles alles per Blockchain gemacht werden mußte, oder noch früher wo jede Company ein .com im Namen haben mußte.

alter Grantler hat gesprochen
BB

BeLo · 15. November 2024 um 09:39

da ist auf jeden Fall was dran

Ich verstehe deine Argumente, größtenteils bin ich da deiner Meinung.

micf1 · 21. Mai 2025 um 21:52

Das sollte grundsätzlich ja schon in soweit gehen, dass man sich von der KI php skripte schreiben lassen kann.

Wenn man dann noch einen Dump aller ips Variablen dranhängt, kommt da sicherlich schon was vernünftiges bei raus.

Gemini 2.5 ist da schon weit vorn.
ChatGpt mal mehr mal wenjger.

Ich würde mir mehr mehr menschliche Kommunikation wünschen …
Hier ist aber dunkel … soll ich licht einschalten …

Aber die Alexa und Google Homes sind ja noch auf pseudo KI.

Boui · 22. Mai 2025 um 12:35

Also DeepSeek ist in Mathe und Programmerung echt genial.

micf1 · 22. Mai 2025 um 12:50

Ich fand es spannend, dass Gemini mir eine VBA Ahfgabe in Nullzeit gemacht hat, während er bei Symcon schlechter als ChatGPT abgeschnitten hat.

Deepseek hatte ich noch nichts programmieren lassen. Muss ich mal machen.

micf1 · 22. Mai 2025 um 12:54

Chatgpt am Anfang hat sich ziemlich schwer mit Zineszins getan.

Habe gerade deepseek nach einem beweis gefraft warum 0,9 periode exakt dasselbe wie 1 ist.

Beeindruckend.

Boui · 22. Mai 2025 um 13:45

Ok, ich begann mit mit DV-Kaufmann und danach Wirtschaftsinformatik, nun Leiter Controlling und DV.
Zinseszins sollte ich noch schaffen. Aber wer weiß, wie lange noch. Man wird ja älter.

micf1 · 22. Mai 2025 um 14:52

Haha same same.
DV Kaufmann und dann Informatik studiert