Text Parser

uwe · 12. September 2008 um 17:42

Hallo,
ich komme einfach nicht weiter mit den auslesen einer Website mit dem Text Parser. Habe hier eine Seite vom Örtlichen und will den Namen auslesen.
Bekomme aber immer nur ‚No valid Rules defined! Please check your Tags!‘
Hier mal der Quelltext.

<a id=„link_0“ href=„http://www1.dasoertliche.de/?id=103301019567281610219&la=de&form_name=detail&lastFormName=search_inv&ph=03960321243&ci=Burg+Stargard&recFrom=1&hitno=0&kgs=13055009&buab=39600030&backbuab=39600030&page=78&context=11&action=58&orderby=name&ttforderby=rel&buc=1033&verlNr=234&la=de&kw=“ onMouseOut=„HideHoverAd(‚grafik_0‘);“ title=„Details zu diesem Eintrag anzeigen“ class=„entry“ onmouseover="" >Meyer Uwe</a>
<span style=„position:relative;“>

Wie muss ich das mit den Text Parser auslesen - Meyer Uwe -

cu uwe

Tetrapack · 12. September 2008 um 18:25

Die Frage ist erst einmal ob du überhaupt Zugriff auf die Seite bekommst. Wie kommst du an den Inhalt der Seite, hast du mal die Variable überprüft … also was drin steht?

Wenn du erst einmal tatsächlich Zugriff auf die Seite hast, also diese auch ausgelesen bekommst, dann solltest du hier nach suchen:

‚vorname=‘
‚&nachname=‘
‚&strasse=‘
‚&hausnummer=‘
‚&plz=‘
‚&ort=‘
‚&telfestnetz=‘

Was jeweils danach kommt, gehört dann dazu …

Ansonsten ist hier http://www.ipsymcon.de/forum/f3/hilfe-textparser-3144/?highlight=textparser noch ein Beispiel von Paresy, wie man damit umgeht. Über die Suchfunktion gibts auch noch einige Themen, in denen es um die Bedienung des Textparser geht.

Allgemeine Voraussetzung ist natürlich, dass du eine Instanz angelegt und konfiguriert hast.

Gruß
Jens

RWN · 12. September 2008 um 18:45

Hallo Uwe,

Text between als Beispiel: onmouseover="" >********</a>

Wie muss ich das mit den Text Parser auslesen

Es müssen allerdings diese Vorgaben stimmen, sollte diese doppelt vorkommen geht es nicht.
Es muss eine bestimmte Charakteristik bestehen.

RWN · 12. September 2008 um 18:48

Hallo Jens,

das ist nicht auf die bezogene Frage zutreffend.

Tetrapack · 12. September 2008 um 19:03

Äh … sorry Rainer, aber ich habe lediglich nur weitergedacht … denn die Infos zum Problem sind sehr dürftig. Falls das nicht erwünscht ist, lasse ich das in Zukunft.

Laut Fehlermeldung hat er entweder keine oder falsche Einträge in der Textparserinstanz drin stehen. Dafür mein Link und den Hinweis auf die Suche.

Was jetzt folgt ist meine eigene Überlegung zu der Frage von Uwe und nicht direkt eine Antwort auf die Frage:

@Uwe: Ich gehe mal davon aus, das du nicht nur den Namen auslesen möchtest, sondern auch den Rest und die Frage erst mal nur gestellt hast, um das Prinzip zu verstehen bzw. um mit der Lösung dann auch den Rest auszulesen. Daher auch meine ausführliche Antwort.

Gruß
Jens

RWN · 12. September 2008 um 19:14

Hallo jens,

seh es wie Du willst. Welche Seite liest Du aus?, welche Seite will Uwe auslesen. Es gibt halt nun mal verschiedene Telefonbücher im Netz.

Uwe hat einen direkten Link auf die Seite gemacht.

Allerdings kann er die Seite so nicht direkt aus IPS auslesen. da sie die Seiten umgebaut haben.
Es sei denn, es gibt was neues

uwe · 12. September 2008 um 20:02

Hallo Rainer und Jens,
ich möchte nur den Namen auslesen, klappt aber nicht.
Hier meine Einstellungen im Text Parser

Get Text Between

Tag one- class=„entry“ onmouseover=""
Tag two- </a>

Was ist hier falsch

cu uwe

RWN · 12. September 2008 um 20:25

Hallo Uwe,

lesen hilft

Uwe hat einen direkten Link auf die Seite gemacht.

Allerdings kann er die Seite so nicht direkt aus IPS auslesen. da sie die Seiten umgebaut haben.
Es sei denn, es gibt was neues

Sag uns doch einfach was Du willst. Das Ö ist klar, die Antwort auch oder?

Ansonsten gibt es andere Lösungen. Nur Hellsehen kann hier keiner

Tetrapack · 12. September 2008 um 20:32

Also wenn ich mir den Quelltext so ansehe, dann muss Tag One so aussehen:

class=„entry“ onmouseover="" >

Und Rainer hat recht, die haben die Seiten umgebaut, daher meine Frage nach dem Inhalt der Variable (mein Vorschlag bezog sich natürlich auch auf das Ö, alles andere macht ja keinen Sinn) … wie liest du den Inhalt der Seite aus?
Die Suche nach Onmouseover ist für meinen Geschmack etwas zu allgemein, deswegen hatte ich dir oben geschrieben wo nach du suchen solltest um ganz sicher den Namen (oder was auch immer) zu erwischen.

Jens