Enterprise-Suche mit Elasticsearch

Suche | Entwicklung | Features

Das Netz besteht aus Unmengen an Informationen. Es existieren Millionen von Seiten mit Texten, Bildern, Videos oder anderen Medien. Da verliert man schnell den Überblick. Zum Glück gibt es Suchmaschinen, mit der sich die gewünschten Informationen aus dem Wust an Daten herausfiltern lassen.

Was im großen Netz gilt, gewinnt auch im Kleinen immer mehr an Bedeutung. Jedes Portal, jede Website, jedes Intranet bietet seinen Besuchern Informationen, die sich selbst mit einem gut durchdachten Navigationskonzept nicht immer finden lassen. Eine integrierte Suche kann dabei der richtige Weg sein, die Besucher dennoch zum gewünschten Ziel zu geleiten. Eine leistungsstarke Suche zu betreiben, ist allerdings kein leichtes Unterfangen, denn die meisten Datenbanksysteme kommen bei Volltextsuchen schnell an ihre Grenzen.

Die Trafo2 Enterprise-Suche basiert auf der professionellen Suchlösung Elasticsearch und bietet alles, was von einer modernen Suche erwartet wird. Neben der einfachen Integration in das TYPO3 CMS ist die Suche zudem vielseitig konfigurierbar.

Indizierung der Inhalte

Damit Inhalte wie HTML-Seiten, PDF-Dokumente oder Excel-Tabellen überhaupt durchsucht werden können, ist zunächst eine Indizierung notwendig. Dabei kommt ein intelligenter Crawler zum Einsatz, der die Seiten wie ein normaler Besucher durchklickt und den relevanten Inhalt extrahiert. Zu beachten ist, dass eine Website in der Regel nicht nur aus statischen Inhalten besteht, sondern auch aus einem dynamischen, sich stetig verändernden Teil. Der Crawler besucht die Seiten daher regelmäßig, damit der Index stets auf dem aktuellen Stand bleibt.

Strukturierte Daten

Jede Website ist anders aufgebaut und hat somit andere Daten, die für die Besucher interessant sein könnten. Der Crawler kann diese Daten auslesen und sorgt dafür, dass sie in der Suche gefiltert oder gesondert ausgegeben werden können.

Vorschlagssuche

Nicht immer wissen Besucher, wonach sie genau suchen müssen, um zum gewünschten Ergebnis zu gelangen. Mit der Vorschlagssuche lässt sich bereits während der Eingabe erahnen, was gemeint sein könnte. Das spart wertvolle Zeit.

Suchranking

Die Sortierung von Suchergebnissen ist fast schon eine eigene Wissenschaft. Verschiedene Algorithmen sollen dafür sorgen, dass die Ergebnisse oben stehen, die auch tatsächlich relevant sind. Die Faktoren hierzu lassen sich individuell einstellen.

Autokorrektur

Kleine Tipper sind normal und können jedem unterlaufen. Umso besser, wenn die Suche den Fehler erkennt und auch gleich einen Verbesserungsvorschlag liefert.

Multidomain

Große Content-Management-Systeme verwalten häufig mehr als eine Domain. Dennoch ist es manchmal sinnvoll, wenn die Suche über mehrere Domains hinweg Inhalte findet.

Angetrieben von Elasticsearch

Elasticsearch ist ein Datenspeicher, der speziell für Volltextsuchen entwickelt wurde. Darüber hinaus lässt sich Elasticsearch auch zur Analyse von großen Datenmengen (Big Data) verwenden. Die Plattform existiert seit 2010 und wird stetig weiterentwickelt.

Trafo2 betreibt für die Enterprise-Suche einen eigenen Cluster aus mehreren Elasticsearch-Instanzen. Dies sorgt für eine hochverfügbare und schnelle Suche sowie eine zuverlässige Indizierung.

Ihre Ansprechpartner

Foto Michael Schiller
Michael Schiller

Geschäftsführender Gesellschafter

0201 - 878 499 11 E-Mail senden
Foto Daniel Jarusch
Daniel Jarusch

Geschäftsführender Gesellschafter

0201 - 878 499 12 E-Mail senden