Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

Xpaths

Der Xpaths Tab zeigt alle Xpaths der aktuellen Seite an. Xpaths geben an, wie das HTML DOM navigiert werden muss, um die Daten wirklich zu extrahieren.

Ein Klick auf Generate Xpaths sendet die aktuell annotierte Seite an den Server und aktuallisiert die Liste nach dem Abschluss mit den neuen Werten.

Bei Bedarf können auch Parameter der XPath Generierung angepasst werden. Diese Einstellungen sind:

  • K: Die Menge an Xpaths, die Generiert werden. Dies beeinflusst ebenfalls die Qualität der Xpaths
  • Complex XPaths: Erzeugt Xpaths, die rekursiv andere Xpaths enthalten. Ein Beispiel wäre: descendant::div[descendant::h1]

Beise Einstellungen beeinflussen nicht nur die Qualität, sondern auch die Dauer der Generierung.

Xpaths auswählen

In manchen Fällen kann es dazu kommen, dass der am besten bewertete XPath zu spezifisch ist, also z.B. den gesuchten Titel eines Films enthällt:

descendant::h1::[text()='Mission Impossible'] // Das Element mit genau diesem Text

oder sich zu sehr auf die absolute Position des Elements bezieht:

descendant::li[8] // Das 8. Listen element auf der Seite

Um sich manuell den besten XPath auszuwählen, kann man in der Liste der generierten XPaths mit dem Set Knopf einen Xpath auswählen, der besser funktioniert. Dieser wird daraufhin an die erste Stelle gesetzt.