Heinz-Jürgen Schymura

Such_Erst_Html


Das Programm Such_Erst_Html wird nicht sehr häufig gebraucht werden, setzt es doch voraus, das Sie auf Ihrer Webseite eine eigene Suche einbauen wollen oder eingebaut haben.
Nach dem ersten Start von Such_Erst_Html zeigt sich das Programm in etwa so.

Nach erstem Programstart

Außer den Angaben hier in der Eingabemaske benötigt das Programm auch noch eine Datei mit dem Namen Such_Erst_Html_Config.php (ein anderer Name ist nicht zulässig, siehe dazu den Menüpunkt Hilfe Such_In_Html.php), in der die Konstanten und Arrays definiert sind, mit denen dann beide Programme (Such_Erst_Html und Such_In_Html.php) arbeiten. Dort ist dann auch der Name der Suchindex Datei mit SuchIndex.TXT von mir (Sie können sie benennen, wie Sie wollen) festgelegt.
Die Datei Such_Erst_Html_Config.php muss sich in dem Verzeichnis befinden, das unter Speicherverzeichnis festgelegt werden muss. Sie wird teilweise, soweit sie von Such_Erst_Html genutzt wird kurz vor dem Ende der Seite erklärt.

Verzeichnis festlegen Bild 1

Also legen wir doch zuerst die Verzeichnisse fest, wenn die so wichtig sind. Dazu in der Verzeichnisauswahl (links oben) das betreffende Verzeichnis auswählen, hier also auf dem Laufwerk D:. Dann im Bereich Start- und Speicherverzeichnisse den entsprechenden Schalter betätigen.

Verzeichnis festlegen Bild 2

So, nun können wir uns mal ein bisschen um die Verzeichnisse kümmern, die das Programm nicht beachten soll bei der Erstellung der Datei SuchIndex.TXT. Etwa das Verzeichnis mit seinen Unterverzeichnisse, in dem sich alle Bilder befinden oder das, in dem die CSS-Datei ist, und so weiter.

Ausgeschlossene Verzeichnisse 1

Also, wie schon gewohnt, das gewünschte Verzeichnis markieren, dann den Schalter Hinzufügen im Bereich Ausgeschlossene Verzeichnisse betätigen.

Ausgeschlossene Verzeichnisse 2
Einfach weiter so verfahren, bis Sie alle Verzeichnisse in der Anzeigeliste stehen haben, die Sie nicht bearbeitet haben wollen.

Ausgeschlossene Verzeichnisse 3

Wenn Sie, wie ich hier bei Impressum, im Eifer des Gefechts, ein Verzeichnis zu viel in der Liste der Ausgeschlossenen Verzeichnisse hinzugefügt habe, dann können Sie (oder auch ich) dieses Verzeichnis auch wieder entfernen.

Ausgeschlossene Verzeichnisse 4

Dazu das Element in der Liste auswählen (markieren) das Sie entfernen möchten und dann den Schalter Entfernen betätigen.

Ausgeschlossene Verzeichnisse 5

Nun kann es aber auch manchmal vorkommen, dass man bestimmte Dateien nicht in den Suchindex übernehmen möchte, etwa wie bei mir, wo es sinnlos wäre alle Dateien, die für die Anzeige der Bilder ohne Menü (bezieht sich auf  meine andere Webseite mit Wandern und Bildern) gebraucht werden, aber ansonsten die gleichen Informationen beinhalten wie diejenigen mit der Menüanzeige, in den Suchindex aufzunehmen. Dazu kann man Dateien von dem Übernehmen in den Suchindex ausschließen, die in ihrem Dateinamen bestimmte, festzulegende Zeichenfolgen haben.
In meinem Fall also alle Html-Dateien, die Bilder ohne eine Menüanzeige anzeigen, sei es nun die Übersichtsanzeige,oder auch die Einzelbilder. Diese Dateien befinden sich in den gleichen Verzeichnissen, wie die Dateien, die das gleiche mit der Menünazeige anzeigen. Sie unterscheiden sich nur durch die Zeichenfolgen O_M_ oder _O_M im Dateinamen, die sonst nie vorkommen.

Ausgeschlossene Dateinamen 1
 
Dazu also im Bereich Ausschlusszeichenfolgen in Dateinamen in der Eingabezeile die betreffende Zeichenfolge eingeben und dann den Schalter Hinzufügen betätigen.
Ausgeschlossene Dateinamen 2

Fügen Sie alle Zeichenfolgen einfach weiter in die Liste ein.

Ausgeschlossene Dateinamen 3
 
Sollten Sie ein Element aus der Liste löschen wollen, so markieren Sie ihn (wie schon zuvor bei Ausgeschlossene Verzeichnisse gezeigt) und betätigen den Schalter Entfernen.
Nun weiter mit dem Bereich HTML-Dateien und Sequenzen für Titel (<title>...</title> im Kopf der HTML-Dateien. Da es sein kann, dass Sie als Dateiendung .html statt .htm haben möchten, müssen Sie dem Programm mitteilen, welche Dateiendung Sie haben möchten. Sie muss immer mit einem Punkt beginnen, sonst meckert  Such_Erst_Html. Da es bei der Suche in der eigenen Webseite möglich sein soll, auch Zeichenfolgen innerhalb der Titelzeile (die im Browser in der obersten Zeile angezeigt wird) zu suchen, die verschiedenen HTML-Editoren diese jedoch unterschiedlich in der Groß- und Kleinschreibung erstellen, müssen Sie hier die korrekte Schreibweise bei Ihrer Webseite eingeben. Das Programm beseht  auf den korrekten öffnenden und schließenden spitzen Klammern.
Im Bereich Zu entfernende Html Sequenzen können Sie diejenigen Sequenzen angeben, wie Links etc. die Sie nicht in die Indexdatei übernehmen möchten, denn was soll zum Beispiel ein Link im Suchindex? Dazu geben Sie in der Eingabezeile hinter Sequenzzeichenfolge die entsprechende Zeichenfolge ein und fügen die Eingabe über den Schalter Hinzufügen in die entsprechenden Liste ein (Start, Ende).

Entferne Sequenzen 1

Dies geschieht, wie schon vorher ausgiebig besprochen.

Entferne Sequenzen 2

Vergessen Sie bitte nicht auch gleich das Ende der betreffenden Sequenz einzugeben.

Entferne Sequenzen 3

Bei mir sehen dann die beiden Listen der Zu entfernenden Sequenzen so aus.

Entferne Sequenzen 4

Bitte achten Sie darauf immer zur richtigen Startsequenz auch die richtige Endesequenz anzugeben. Auch hier prüft das Programm ob zumindest die  öffnende oder die schließende spitze Klammer eingeben ist.
Soweit wäre ja jetzt alles geregelt, nur leider würde Such_Erst_Html nun etwa auch die Worte meine andere Webseite im oben gezeigten Link nicht übernehmen. Um dies zu umgehen können Sie (und ich) im Bereich Start- und Endesequenz bei Link nutzen bestimmte Sequenzen angeben, die innerhalb der eigentlich Zu entfernenden Sequenzen stehen, jedoch in die Indexdatei übernommen werden sollen. So mache ich es beim Schreiben einer Webseite mittlerweile so, dass ich, ehe ich einen Link im Html Editor setze, die betreffenden Worte unterstreichen lasse und erst dann den Link setze. Dies deshalb, weil die Standardeinstellung fast aller Browser so ist, dass sie Links im Text unterstreichen und auch in anderer Farbe darstellen.

Entferne Sequenzen 5

Eigentlich doch doppelt gemoppelt, wenn ich die Worte vorher extra unterstreiche. Stimmt schon, aber so kann ich die Sequenz zum Unterstreichen nutzen, um die entsprechenden Worte denn doch in die Suchindexdatei zu übernehmen.
Bitte beachten Sie, hierbei kann Ihnen das Programm nicht helfen die Sequenzen richtig (vollständig) anzugeben, da es Ihnen ja freisteht jede nur mögliche Zeichensequenz zu nutzen. Es nimmt Ihre Eingaben so, wie Sie sie gemacht haben, egal, was dabei herauskommt.
Wenn Sie soweit gekommen sind mit Ihren Eingaben oder Festlegungen, so sollten Sie tatsächlich jetzt schon mal den Schalter Arbeiten betätigen, ohne zuvor die Bereiche An den Suchindex anzuhängende Datei und Aus Suchindex Teiledateien erzeugen weiter zu beachten. Diese werden später noch behandelt.

Arbeit Bild 1

Sie sehen, alle Schalter und Eingabeobjekte sind deaktiviert. Sie können das Programm nur noch über den Windows Systemschalter ganz oben rechts beenden, ehe es seine Arbeit beendet hat. Such_Erst_Html informiert Sie ständig über jede einzelne Aktivität.

Arbeit Bild 2

Nachdem das Programm alle Html-Dateien ab dem Startverzeichnis abgearbeitet hat gibt es Ihnen noch eine globale Zusammenfassung seiner Arbeit.
Nun können Sie sich auch die Datei SuchIndex.TXT in einem einfachen Texteditor anschauen. Das war es auch, weshalb Sie schon mal den Schalter Arbeiten betätigen sollten. Sie sehen den Aufbau der Indexdatei.
Zuerst kommt immer der gesamte umgewandelte (z.B. Sonderzeichen Umlaute) Text in einer Zeile, dann die Titelerkennungszeichenfolge mit anschließendem Titel in der folgenden Zeile  und als dritte Zeile die Linkerkennungszeichenfolge mit anschließendem vollständigen (relativen) Link.
Mit diesen Kenntnissen können Sie nun eine Datei erstellen, die Such_Erst_Html an den gerade zuvor erstellten Suchindex anhängen kann, wenn Sie wollen. Ich zum Beispiel benötige das, um auf meiner andere Webseite unter dem Menüpunkt Verschiedenes Über Sie, die ja Angaben über den Besucher mit einem PHP Programm ermittelt und ausgibt. Zusätzlich gibt das Programm noch einen zusätzlich beruhigenden (feststehenden) Text aus. Und diesen Text möchte ich halt auch im Suchindex haben.

Arbeit Bild 3

Deshalb kann ich nun (und Sie natürlich auch) in der Dateiauswahl (ganz links) die entsprechende Datei markieren und dann im Bereich An den Suchindex anzuhängende Datei den Schalter Festlegen betätigen. Nun muss ich noch das Häkchen vor Anhängen setzen und schon wäre bei eine erneuten Betätigen des Schalters Arbeiten der zusätzliche Text mitsamt Titel und Link im Suchindex auch vorhanden.
Da manche Webspace-Anbieter (öfter die kostenlosen) Dateigrößenbeschränkungen haben, so dass Sie (ich) eventuelle keine Datei mit über 1 MB auf den Server hochladen können, können Sie die gerade erzeugte Datei in Teiledateien aufteilen. Dazu brauchen Sie nur im Bereich Aus Suchindex Teiledateien erzeugen die gewünschte Größe auswählen (die kleinste Größe ist voreingestellt) und vor Erzeugen das Häkchen setzen.

Arbeit Bild 4

So in etwa sehen dann die Programmeldungen aus, wenn Sie (ich) den Schalter Arbeiten nun mit diesen Einstellungen betätige. Nun brachten Sie nur noch alle Teiledateien (Sie erkennen Sie daran, dass sie noch an den festgelegten Namen der Suchindexdatei eine laufenden dreistellige Nummer angehängt haben) auf den Server kopieren.
Mit dem PHP Programm Verbinden.php (siehe hierzu auch die Menüpunkte Beschreibungen Verbinden.php und Hilfe Verbinden.php) können Sie dann auf dem Server Ihrer Webseite die Teiledateien wieder zusammenfügen zur Suchindexdatei.
Wenn Ihnen der Name des Programms nicht gefällt, so können Sie es getrost umbenennen. Sollten Sie das Programm vorher bereits genutzt haben, so sollten Sie die Konfigurationsdatei Such_Erst_Html.INI ebenfalls umbenennen, da dort die Programmeinstellungen des letzten Programmlaufes gespeichert sind. Falls Sie dies nicht tun, so würde das umbenannte Programm mit den internen Programmeinstellungen starten. Sie finden die Konfigurationsdatei in dem Verzeichnis, in dem sich das Programm selbst befindet. Dort braucht es auch Schreibrechte um die Konfigurationsdatei zu erstellen und anzupassen.
So und nun zu den Festlegungen der Datei Such_Erst_Html_Config.php soweit sie das Programm Such_Erst_Html betreffen.
Zeichenfolgen sind in doppelte Hochkommas eingeschlossen. Das ist wichtig, zwar könnte PHP auch mit einem Hochkomma arbeiten, mein Programm Such_Erst_Html jedoch nicht!
Sie sehen hier die Angaben, die ich in der betreffenden Datei in meiner andere Webseite für die Suche gemacht habe.
Diese 3 Festlegungen werden sowohl von Such_In_Html.php als auch von Such_Erst_Html genutzt.
define("SUCH_INDEXDATEINAME","SuchIndex.TXT");
define("SUCH_ZEICHENLINK","<AUFRUF---------->");
define("SUCH_ZEICHENTITEL","<TITEL---------->");
In der Zeichenfolge hinter SUCH_INDEXDATEINAME legen Sie fest, wie der Name der Indexdatei ist.
Bei SUCH_ZEICHENLINK und bei SUCH_ZEICHENTITEL sollten Sie auf jeden Fall Zeichenfolgen nutzen, die ansonsten nie in der Datei SuchIndex.TXT vorkommen können.
Nur von  Such_Erst_Html werden die beiden folgenden Arrays benötigt, in denen die Identifizierer aus der zentralen CSS-Datei anzugeben sind, den eigentlichen Start und das Ende des beschreibenden Textes der Webseite angibt.
Zur Erläuterung: Bei PHP beginnt die Zählung der Elemente von Arrays immer mit 0. Diese nullte Element nutze ich immer, um die Bedeutung des Arrays zu beschreiben und hat somit weiter keinen tieferen Sinn. Ein Element wird einfach hinzugefügt, indem man an das Array einen neuen Eintrag mit dem gleichen Namen anhängt, etwa $Startausgabe[]. Wenn Sie ein Element löschen wollen, so löschen Sie einfach die Zeile.
In dem Array $Startausgabe geben Sie bitte alle Bereiche aus der zentralen CSS-Datei an, in der Sie Ihre Ausgaben machen lassen. Da ich 2 verschiedene Bereiche mit unterschiedlicher Breite verwende benötige ich also hier 2 gültige Einträge.
$Startausgabe=array ("Hier beginnt dann die eigentliche Ausgabe");
$Startausgabe[]="<div id=\"wander_ausgabe\">";
$Startausgabe[]="<div id=\"ausgabe\">";
Da der Ausgabebereich im Quelltext einer Webseite bei mir immer dort endet (wenn die Seite mit PHP2HTM umgewandelt wurde), wo der Beginn des Kopfbereiches mit Kopfbild und Kopfmenüzeile beginnt brauche ich nur ein gültiges Element  im folgenden Array. $Endeausgabe=array ("Hier spätestens endet dann die eigentliche Ausgabe");
$Endeausgabe[]="<div id=\"kopf_container\">";
Beachten Sie, dass alle Zeilen mit dem Programm Escapen (können Sie auch hier herunterladen) behandelt wurden, damit PHP die gewünschten doppelten Hochkommas auch wirklich in der Zeile stehen lässt und nicht versucht, sie als Zeichenfolgenbeginn oder -ende zu interpretieren. Dies wurde auch hier bei den beiden Arrays so gehalten, damit es keinen Bruch in einer Konfigurationsdatei gibt.