Latent Semantic Indexing

Latent Semantic Indexing ist eine Suchmaschinentechnologie. Sie stellt die Relevanz einzelner Begriffe in einen Gesamtkontext und ermöglicht somit eine höhere Qualität der Suchergebnisse.

Was heißt LSI wörtlich?

Semantik kommt aus dem Altgriechischen σημαίνειν. Der Begriff steht im weitesten Sinne für die Tätigkeit des Bezeichnens und Beschreibens. Semantik im Kontext von LSI meint die Bedeutung von Sätzen, Satzteilen, Wortteilen und Wörtern. Warum „Latent“? 

Latente semantische Indexierung heißt das Verfahren deshalb, weil es latent, also andauernd und unmerklich im Hintergrund arbeitet. Der Nutzer bekommt lediglich das Ergebnis zu sehen: überraschend präzise Suchergebnisse.

LSI – Unterschiede zu herkömmlicher Keywordsuche

Die herkömmliche Keywordsuche beschränkte sich noch auf eine sehr eng gefasste, aufs Abzählen von Wörtern (Keyworddichte) beschränkte Definition und Untersuchung von Relevanz. Latent Semantic Indexing öffnet die Tür zum holistischen Inhalt. Das heißt:

Der Nachteil linearer Suchsystematik

Die klassische Keywordsuche unterscheidet linear bzw. rein digital in „Keyword vorhanden“ bzw. „Keyword nicht vorhanden“. Entsprechend einseitig sind die Ergebnisse.

  • Früher lautete die Devise: entweder enthält ein Dokument einen bestimmten Begriff – oder eben nicht. Period.
  • In einer Ergebnismenge fand die Suche nach den Begriffen statt. Dokumente, die den Begriff nicht enthielten, sind durchs Raster gefallen. Und das, obwohl sie relevant waren. Ein Beispiel:

Stellen wir uns einen Text über verschiedene Apfelsorten vor. In diesem erdachten Beispieltext kommen nur Begriffe wie Jonagold, Boskop und Breadburn vor. Zusätzlich ist die Rede vom Veredeln von Obstbäumen und von heimischem Obst. Das Wort Apfel kommt kein einziges Mal vor.

Bei linearer Keywordsuche kann so ein Text u.U. kaum Rankings für das Keyword Apfel erhalten. Aus diesem Phänomen heraus haben sich seinerseits die inzwischen längst verpönten Techniken wie das Keyword Stuffing und Keyword Spamming entwickelt: weil linear bzw. digital nach Ja/Nein bewertet wurde. Mit Latent Semantic Indexing sieht die Sache bzw. die Suche anders aus.

Die liebe Verwandtschaft im Sinn – Google mit LSI schaut auf alles

Latent Semantic Indexing (latent semantische Indexierung) berücksichtigt und bewertet auch die semantisch verwandten Begriffe, und diese fließen in die Suchergebnisse ein:

  • Im Apfelbeispiel von weiter oben heißt dies: Der Artikel, in dem kein einziges Mal „Apfel“ vorkommt, steht dennoch ganz oben für diesen Suchbegriff.
  • Weil Google erkennt, dass der Text wegen der im Kontext zu dieser Obstsorte stehenden Begriffe eine hohe Relevanz für den Hauptbegriff hat.
  • Es ist zwar nur von den Sorten die Rede, und dennoch wird auf die Frucht selbst hochgerechnet, die im Artikel – implizit – die Rede ist.
  • Die Relevanz semantisch sinnvoll aufgeladener Texte ist heute aus Suchmaschinensicht in vielen Fällen schon deutlich höher als die Relevanz solcher Texte, die lediglich ein Keyword bzw. eine gesuchte Phrase in bestimmter Häufigkeit – Keyword-Dichte (Keyword Density) enthalten.

Wie funktioniert LSI?

Mit algorithmisch gesteuerter Semantikanaylse verbinden die Suchmaschinen einzelne Wörter zu Begriffsreihungen. In der Folge entsteht ein Sinnkontext. LSI berücksichtigt nicht nur Phrasen (darunter auch Long Tails) und Wörter, sondern auch die verwandte Begriffe (Synonyme) und gegenteilige Wörter (Antonyme).

Antonyme bzw. Oppositionswörter unterscheiden sich in Konverse Relation, Reverse Relation, Komplementarität, Inkompatiblität sowie graduelle bzw. konträre Antonymie:

  • Reverse Relation: Baumpflanzung und Ernte haben beide mit dem Oberbegriff A. zu tun, aber der eine beschreibt den Input, der andere den Output.
  • Konverse Relation: Den Baum schütteln oder die Früchte pflücken – beides beschreibt den Vorgang des Erntens, aber in unterschiedlicher Herangehensweise.
  • Komplementarität: leere Apfelkiste hat mit dem Thema A. zu tun, es beschriebt jedoch auch, dass kein A. vorhanden ist.
  • Inkompatiblität: würde im A-Beispiel die Benennung weiterer in Europa heimischer Obstarten bedeuten: Birnen, Stachelbeeren, Heidelbeeren und Quitten zählen zur selben Hauptkategorie „europäisches Obst“, bezeichnen aber alle nicht das Obst A.
  • Beim Schreiben dieses Artikels zum Thema LSI fiel nach einer Weile auf, dass es das Gegenteil von Apfel im eigentlichen Sinne nicht gibt.
  • Daher lassen sich zu Gradueller Antonymie hier schwerlich Beispiele finden (etwa wie „hoch“ und „tief“).
  • Um die Komplexität des Latenten semantischen Indexierens noch etwas zu verdeutlichen: ein Auszug des englischen Sprichworts „… a day, keeps the doctor away“ könnte zusätzlich dazu beitragen, um der Suchmaschine einen weiteren Sinnzusammenhang zum Thema A. zu liefern. Warum diese Abkürzung? Weil ich nicht will, dass dieser Text eine Relevanz für das gesunde Obst entwickelt, sondern für LSI.

Latent Semantic Indexing speckt die Texte ab

LSI klammert Begriffe, die in allen Texten vorkommen, bei der Indexierung aus. Google und Co sehen also nur noch auf die Content Words, also den Kern eines Artikels. Die Suchmaschine bewertet die Essenz des Textes und setzt sie in einen Zusammenhang zum Web.

Hier streifen wir auch die Welt von WDF*IDF. Die Formel WDF*IDF untersucht nd der Suchmaschinenoptimierung, in welcher Relation – obiges Beispiel – die Apfelsorten im Verhältnis zu allen anderen Texten im Web zu diesem Thema vorkommen.

LSI imitiert menschliches Interpretieren

Latent Semantic Optimization bewertet Dokumente, in denen viele Wörter einen Sinnzusammenhang ergeben, als relevant. Solche Dokumente hingegen, in denen es wenig semantischen Bezug, also wenig Gesamtkontext gibt, werden weniger gut bewertet. Die Suchmaschinen können die Art, in der Menschen einen Text erfassen, inzwischen erstaunlich gut abbilden – wenngleich eine Suchmaschine weder den Text versteht noch jemals einen Apfelkuchen backen wird. Es geht um die Muster, nach denen bewertet und klassifiziert wird.

Was bringt Latent Semantic Optimization für die Suchmaschinenoptimierung?

Latent Semantic Optimization ist ein intelligenter und wirkungsvoller Ansatz, um Onpage-Suchmaschinenoptimierung auf der Textseite zu bereichern. Keyword Stuffing führt zu weniger guten Rankings. Wer dies berücksichtigt, weiß die Qualität hochwertiger, sprachlich wertvoller und sinnvoller Texte zu schätzen.

LSI hilft in der seriös betriebenen Suchmaschinenoptimierung dabei, die einfachen Keywordsuchen zu überholen und abseits aller Keyword Density mit thematisch reichen und damit aufschlussreichen Texten auf den ersten Plätzen zu landen … und dank positiver Nutzersignale auch dort zu bleiben.

Latent Semantic Indexing - die liebe Verwandtschaft

Latent Semantic Indexing – die liebe Verwandtschaft