HTML Tabelle aus dem Internet in Datensätze umwandeln..

Hallo,

ich habe einen Link unter dem ich eine Tabelle in HTML finde, deren Inhalt möchte ich mir gerne unter IPS zu Nutze machen, sprich ich brauch die Daten die in der Tabelle stehen.

Hänge mal den Quelltext der Tabelle an und ein Bild von ihr wie sie normal ausschaut. Die Daten die ich in der Normalansicht bekomme sind auch die welche ich benötige.

Leider stehen sie im Quelltext nicht immer an der selben Stelle da sich die Tabelle / Stundenplan ja wöchentlich ändert.

Die Tabelle wird Spaltenweise von linkt nach rechts und von oben nach unten befüllt…

<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1"><meta http-equiv="expires" content="0"><meta name="keywords" content="Stundenplan, timetable">
<meta name="GENERATOR" content="Untis 2011">
<title>Untis 2011  ***Titel***</title>
<link rel="stylesheet" href="../../untisinfo.css" type="text/css">
</head>
<body class=tt>
<CENTER><font size="3" face="Arial"  color="#000000">
<BR></font>
<font size="6" face="Arial" color="#0000FF">
M 2b
</font>
<BR><TABLE border="3" rules="all" cellpadding="1" cellspacing="1">
<TR>

<TD align="center"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 align="center" nowrap="1"><TABLE><TR><TD align="center" nowrap=1><font size="3" face="Arial"  color="#000000">
<B>Montag</B>
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 align="center" nowrap="1"><TABLE><TR><TD align="center" nowrap=1><font size="3" face="Arial">
<B>Dienstag</B>
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 align="center" nowrap="1"><TABLE><TR><TD align="center" nowrap=1><font size="3" face="Arial">
<B>Mittwoch</B>
</font> </TD>

</TR></TABLE></TD>
<TD colspan=6 align="center" nowrap="1"><TABLE><TR><TD align="center" nowrap=1><font size="3" face="Arial">
<B>Donnerstag</B>
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 align="center" nowrap="1"><TABLE><TR><TD align="center" nowrap=1><font size="3" face="Arial">
<B>Freitag</B>
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 align="center" nowrap="1"><TABLE><TR><TD align="center" nowrap=1><font size="3" face="Arial">
<B>Samstag</B>
</font> </TD>

</TR></TABLE></TD>
</TR><TR>
<TD rowspan=2 align="center" nowrap="1"><TABLE><TR><TD align="center" nowrap=1><font size="2" face="Arial">
8:00
</font> </TD>
</TR><TR><TD align="center" nowrap=1><font size="2" face="Arial">
9:30
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 rowspan=4 align="center" nowrap="1" bgcolor="#C0C0C0" ><TABLE><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
<B>TME</B>
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">

WALG
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#80FF80"  nowrap=1><font size="4" face="Arial" color="#000000">
<B>211</B>
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1" bgcolor="#C0C0C0" ><TABLE><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
<B>NWI </B>
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
BRAA
</font> </TD>

</TR><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="4" face="Arial" color="#400040">
<B>E02</B>
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1" bgcolor="#FF0000" ><TABLE><TR><TD width="100%" bgcolor="#FF0000"  nowrap=1><font size="3" face="Arial" color="#000000">
<B>MAT</B>
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#FF0000"  nowrap=1><font size="3" face="Arial" color="#000000">
ROHL
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#80FFFF"  nowrap=1><font size="4" face="Arial" color="#000000">
<B>Aula</B>

</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
</TR><TR>
</TR><TR>
<TD rowspan=2 align="center" nowrap="1"><TABLE><TR><TD align="center" nowrap=1><font size="2" face="Arial"  color="#000000">
9:45
</font> </TD>
</TR><TR><TD align="center" nowrap=1><font size="2" face="Arial">
11:15
</font> </TD>
</TR></TABLE></TD>

<TD colspan=6 rowspan=2 align="center" nowrap="1" bgcolor="#C0C0C0" ><TABLE><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
<B>MAT</B>
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
ROHL
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#FFFF80"  nowrap=1><font size="4" face="Arial" color="#000000">
<B>106</B>
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1" bgcolor="#C0C0C0" ><TABLE><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
<B>NWI </B>

</font> </TD>
</TR><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
BRAA
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#FFFF80"  nowrap=1><font size="4" face="Arial" color="#000000">
<B>112</B>
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1" bgcolor="#C0C0C0" ><TABLE><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
<B>WET</B>
</font> </TD>

</TR><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
LAMM
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#FFFF80"  nowrap=1><font size="4" face="Arial" color="#FF0000">
<B>104</B>
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
</TR><TR>
</TR><TR>
<TD rowspan=2 align="center" nowrap="1"><TABLE><TR><TD align="center" nowrap=1><font size="2" face="Arial"  color="#000000">
11:45
</font> </TD>

</TR><TR><TD align="center" nowrap=1><font size="2" face="Arial">
13:15
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1" bgcolor="#C0C0C0" ><TABLE><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
<B>TKO </B>
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
MUEL
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#FFFF80"  nowrap=1><font size="4" face="Arial" color="#FF0000">
<B>104</B>

</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1" bgcolor="#C0C0C0" ><TABLE><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
<B>WPO</B>
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
SAEM
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#FFFF80"  nowrap=1><font size="4" face="Arial" color="#000000">
<B>106</B>
</font> </TD>

</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1" bgcolor="#C0C0C0" ><TABLE><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
<B>ENG</B>
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
HEHA
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="4" face="Arial" color="#400040">
<B>E01</B>
</font> </TD>
</TR></TABLE></TD>

<TD colspan=6 rowspan=2 align="center" nowrap="1" bgcolor="#C0C0C0" ><TABLE><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
<B>KON</B>
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
KUCH
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#FFFF80"  nowrap=1><font size="4" face="Arial" color="#400040">
<B>103</B>
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
</TR><TR>

</TR><TR>
<TD rowspan=2 align="center" nowrap="1"><TABLE><TR><TD align="center" nowrap=1><font size="2" face="Arial"  color="#000000">
13:30
</font> </TD>
</TR><TR><TD align="center" nowrap=1><font size="2" face="Arial">
15:00
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1" bgcolor="#C0C0C0" ><TABLE><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
<B>AUT </B>
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
LENS

</font> </TD>
</TR><TR><TD width="100%" bgcolor="#FFFF80"  nowrap=1><font size="4" face="Arial" color="#FF0000">
<B>109</B>
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1" bgcolor="#C0C0C0" ><TABLE><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
<B>CAD </B>
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
MUEL

</font> </TD>
</TR><TR><TD width="100%" bgcolor="#FFFF80"  nowrap=1><font size="4" face="Arial" color="#FF0000">
<B>104</B>
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1" bgcolor="#C0C0C0" ><TABLE><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
<B>WET</B>
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#C0C0C0"  nowrap=1><font size="3" face="Arial" color="#000000">
LAMM
</font> </TD>

</TR><TR><TD width="100%" bgcolor="#FFFF80"  nowrap=1><font size="4" face="Arial" color="#400040">
<B>103</B>
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
</TR><TR>
</TR><TR>
<TD rowspan=2 align="center" nowrap="1"><TABLE><TR><TD align="center" nowrap=1><font size="2" face="Arial"  color="#000000">
15:15
</font> </TD>
</TR><TR><TD align="center" nowrap=1><font size="2" face="Arial">
16:45
</font> </TD>

</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1" bgcolor="#0080FF" ><TABLE><TR><TD width="100%" bgcolor="#0080FF"  nowrap=1><font size="3" face="Arial" color="#000000">
<B>TKO </B>
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#0080FF"  nowrap=1><font size="3" face="Arial" color="#000000">
NOEL
</font> </TD>
</TR><TR><TD width="100%" bgcolor="#0080FF"  nowrap=1><font size="4" face="Arial" color="#000000">
<B>AH1</B>
</font> </TD>
</TR></TABLE></TD>

<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
</TR><TR>
</TR><TR>
<TD rowspan=2 align="center" nowrap="1"><TABLE><TR><TD align="center" nowrap=1><font size="2" face="Arial"  color="#000000">
17:00
</font> </TD>
</TR><TR><TD align="center" nowrap=1><font size="2" face="Arial">
18:00
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>

<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
</TR><TR>
</TR><TR>
<TD rowspan=2 align="center" nowrap="1"><TABLE><TR><TD align="center" nowrap=1><font size="2" face="Arial">
18:00
</font> </TD>
</TR><TR><TD align="center" nowrap=1><font size="2" face="Arial">
19:30
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>

<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
</TR><TR>
</TR><TR>
<TD rowspan=2 align="center" nowrap="1"><TABLE><TR><TD align="center" nowrap=1><font size="2" face="Arial">
19:45
</font> </TD>
</TR><TR><TD align="center" nowrap=1><font size="2" face="Arial">
21:15
</font> </TD>
</TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>

<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
<TD colspan=6 rowspan=2 align="center" nowrap="1"><TABLE><TR><TD></TD></TR></TABLE></TD>
</TR><TR>
</TR></TABLE><TABLE cellspacing="1" cellpadding="1"><TR><TD valign=bottom> <font  size="4" face="Arial" color="#0000FF"></TR></TABLE><font size="3" face="Arial">
 (23)   Fachschule für Technik Kiel
</font></CENTER>
</body>
</html>


Ich muss also irgendwie auslesen können wann und wo welche Fächer stattfinden…

Das wollte ich dann in Arrays ablegen… Im Maximalfall sind das dann 90 Werte verteilt auf 6 Arrays also 15 für jeden Wochentag.

Eine Visuelle Darstellung ist nicht notwendig, denn ich benötige die Daten nur zum Vergleich ob sich was geändert hat und wann die erste Stunde anfängt um meinen Wecker entsprechend zu stellen :wink:

Hallo Franky,

ich hatte ein ähnliches Problem mit Abfallkalender und leider nichts brauchbares im Internet gefunden (Stichwort HTML to Array).

Ich löse das jetzt über die 2 folgenden Skripte:

Skript 1: Webseite abfragen und Tabelle entschlacken (ein mal täglich)

<?

$monat = date("m", time() + 60*60*9);
$jahr = date("Y", time());

$id = 35262 /*[AWB WWW Reader]*/;
$page = "https://www.awbkoeln.de/alles-ueber-abfall/online-abfuhrkalender.html?sensis_url=https%3A%2F%2F194.8.206.222%2Fawbweb%2Fawbweb.kommunal3.kalender%3Fsensis_gem_nr_tr%3D313%26sensis_strasse%3DIn+der+Gracht%26sensis_ortsteil_nr%3D1%26sensis_obkz%3D7%26sensis_strassen_nr%3D1608%26sensis_haus_nr%3D16%26sensis_haus_nr_suche%3D16%26sensis_haus_nr_zusatz%3D%26sensis_haus_nr_zusatz_suche%3D%26sensis_k%3D2%26sensis_f%3D1%26sensis_b%3D1%26sensis_lk%3D2%26sensis_lf%3D1%26sensis_lb%3D1%26sensis_d%3DCG%26sensis_erst%3D1%26sensis_monat%3D".$monat."%26sensis_jahr%3D".$jahr."%26sensis_druck_mon_von%3D05%26sensis_druck_jahr_von%3D2011%26sensis_druck_mon_bis%3D06%26sensis_druck_jahr_bis%3D2011";

//Eigenschaft verändern
WWWReader_SetPage($id,$page);

//Änderung abspeichern
IPS_ApplyChanges($id);

// Neue URL abrufen
WWWReader_UpdatePage($id);

// echo WWWReader_RetrievePage($id, $page);

$strHTML = GetValue(14860 /*[Außen\Abfallkalender\Abfallkalender]*/);

$strHTML = str_replace(' class="sensis_normalertag"',"",$strHTML);
$strHTML = str_replace(' class="sensis_wochenende"',"",$strHTML);
$strHTML = str_replace('<div class="sensis_nummernzeile_kein_feiertag">',"",$strHTML);
$strHTML = str_replace('<div class="sensis_nummernzeile_feiertag">',"",$strHTML);
$strHTML = str_replace('</div>',"",$strHTML);
$strHTML = str_replace(' class="sensis_wochentagstabheader"',"",$strHTML);
$strHTML = str_replace(' border="1" cellspacing="0" cellpadding="0" class="sensis_kaltab"',"",$strHTML);
$strHTML = str_replace(' class="sensis_heutigertag"',"",$strHTML);
$strHTML = str_replace(' class="sensis_heutigertag"',"",$strHTML);

SetValue(14860 /*[Außen\Abfallkalender\Abfallkalender]*/, $strHTML);

?>

Skript 2: Meldung Tonne rausstellen. Hier wird die Tabelle in Array gewandelt.

<?php

include("Meldung");

If (date("G", time()) >= 18)
	{
		$Abfuhrtag = date("j", time()  + 60 * 60 * 24);
		// $Abfuhrtag = 19;
		$Meldung = "Morgen wird ";
	}
	Else
	{
		$Abfuhrtag = date("j", time());
		// $Abfuhrtag = 18;
		$Meldung = "Heute wird ";
	};

$strHTML = GetValue(14860 /*[Außen\Abfallkalender\Abfallkalender]*/);

$strHTML = str_replace('<img src="https://www.awbkoeln.de/sensis/tonne_grau_trans.png" />',":Restmüll",$strHTML);
$strHTML = str_replace('<img src="https://www.awbkoeln.de/sensis/tonne_braun_trans.png" />',":Biotonne",$strHTML);
$strHTML = str_replace('<img src="https://www.awbkoeln.de/sensis/tonne_gelb_trans.png" />',":Gelbe Tonne",$strHTML);
$strHTML = str_replace('<img src="https://www.awbkoeln.de/sensis/tonne_blau_trans.png" />',":Blaue Tonne",$strHTML);
$strHTML = str_replace('*',":Nix",$strHTML);
$strHTML = str_replace('<br>',"",$strHTML);
$strHTML = str_replace('</td>',"",$strHTML);
$strHTML = str_replace('<tr>',"",$strHTML);
$strHTML = str_replace('</tr>',"",$strHTML);

// echo $strHTML;

$werte = explode("<td>", $strHTML);

// echo $werte;
// print_r ($werte);

foreach($werte as $wert)
{
	$wert = trim($wert);
	$tabTag = substr($wert,0,2);

  If (substr($wert,0,2) == $Abfuhrtag)
	{
		$tonne = trim(substr($wert,3));
		If (strlen($tonne) > 0)
			{
			   $Meldung = $Meldung.$tonne." abgeholt";
			   echo $Meldung;
			  	Meldung ($Meldung, $Meldung);
			}
	}
}

Wie wär’s denn mit einem simplen Stringvergleich? Bei Abweichung irgend eine Meldung?

Anyway, hoffe du kannst damit was anfangen.

Grüsse,
Axel

Per PHP und „simple_xml“ könnte das klappen. :slight_smile:

Schreib mich heute Abend mal an. Wenn ich nen bissl Zeit hab kann ich dir daevtl was zusammenstricken

Hi,

ich habe das noch nicht gemacht, aber eventuell kann man das auch gut über JavaScript und DOM machen, wenn man die richtigen Elemente anspricht. Dürfte etwas einfacher sein, als den HTML Code selbst auseinander zu nehmen …

Hab grad mal geschaut. Der HTML-Code ist ziemlich kaputt (Tags nicht geschlossen etc). Mit nem XML-Parser wird da schwer. schade.

So, ich glaube ich bin fast fertig…

Hier noch mal meinen Dank an JPaeper der mir die entscheidenen Zeilen geschrieben hat.

  1. Die Seite wird ausgelesen und in eine Variable geschrieben
  2. Aus der Variablen werden dann HTML Bestandteile mittels der Funktion „get_mark“ entfernt.

Übrig bleiben dann noch die Rohdaten die Brauche… jetzt muss ich meine PHP Kenntnisse noch ein wenig ausbauen und mich ausreichend mit Arrays beschäftigen um das für meine Zwecke auszubauen… :wink:

<?
$UrlKw = GetValueString(18376 /*[- Angelegte Datenbank von My Home -\.Main Skripte\Projekt Stundenplan v2\URL Stundenplan KW]*/);

// Der Variablen $Antwort wir der Inhalt der unter $UrlKw hinterlegten Internetseite, hier der gesamte HTML Quelcode, zugewiesen.
$Antwort = file_get_contents($UrlKw);


SetValueString(30744 /*[- Angelegte Datenbank von My Home -\.Main Skripte\Projekt Stundenplan v2\Rohdaten Stundenplan aktuelle KW]*/, $Antwort);

        // Die Funktion "get_mark" filtert alle objekte die nicht gebraucht werden raus.
        // auszufilternde Objekte sind: "</head>*</TR></TABLE><TABLE"
        
        $StundenplanArray = get_mark($Antwort, "</head>*</TR></TABLE><TABLE");
        $Stundenplan = $StundenplanArray[0];



SetValueString(19320 /*[- Angelegte Datenbank von My Home -\.Main Skripte\Projekt Stundenplan v2\Rohdaten ohne HTML Stundenplan aktuelle KW]*/, $Stundenplan);


// Diese Funktion trennt die relevanten Bereiche aus dem Ausschnitt heraus $string ist dabei der zu durchsuchende Gesamtstring,
// in $Mark sind durch "*" getrennt der Beginn des zu suchenden Strings und das Ende des zu suchende Abschnittes. Beispiel für den Text "<div>*</div></li>"

function get_mark($string,$mark)
{
    $ausgabe = array();
    $template = explode("*",$mark);
    $mark = $template[0];
    $end = $template[1];
    $string = strstr($string,$mark);

    $temp = explode($mark,$string);
    $a = 1;
        foreach ($temp as $tempx)
                    {
                    $tempx = explode($end,$tempx);
                    $tempx = $tempx[0];
                    if ($tempx)
                            {
                            array_push ($ausgabe,$tempx);
                            }
                    }

    return $ausgabe;
}
//SetValueString(19320 /*[- Angelegte Datenbank von My Home -\.Main Skripte\Projekt Stundenplan v2\Rohdaten ohne HTML Stundenplan aktuelle KW]*/,  $ausgabe);

?>