RANK BRAIN

Selbstlernender Google Algorithmus

In 2015 hat Google RankBrain in seinen Suchalgorithmus integriert, eine künstliche Intelligenz, welche die ausgespielten Suchergebnisse noch verbessern und auch für bisher unbekannte Suchanfragen eigenständig passende Ergebnisse anzeigen soll. Was RankBrain tatsächlich ist und wie Googles künstliche Intelligenz arbeitet, erklärt euch Alona Demchyk im folgenden Gastartikel.

Dass sich die Technologie einer Künstlichen Intelligenz (KI) auf immer mehr Lebensbereiche ausdehnt, wird immer deutlicher. Eine treibende Kraft hinter dieser Entwicklung ist der Google-Mutterkonzern Alphabet, welcher Künstliche Intelligenz immer tiefer in die DNA seiner alle Lebensbereiche abdeckenden Tochterfirmen einschreibt. Das Produktportfolio des Unternehmens umfasst unter anderem Medizintechnik (Kontaktlinsen für Diabetiker), Mobilität (Drohnen-Lieferung, selbstfahrende Autos), erneuerbare Energien (Windturbinen, sogenannte „Energy Kites“) und Smart Home Technik (NEST) (Quelle: All of Google’s—er, Alphabet’s—companies and products from A to Z).

Im Alltag der meisten Menschen ist jedoch noch immer die Google Suchmaschine der wichtigste Berührungspunkt mit dem Unternehmen aus Mountain View, Kalifornien. Sei es auf dem Desktop, dem Mobiltelefon oder dem Smart-TV, Künstliche Intelligenz und Machine Learning haben inzwischen einen bedeutenden Anteil an der Auswahl der richtigen Ergebnisse auf Milliarden von Suchanfragen täglich. Besonders deutlich wird dies an einem Teil des Google Algorithmus, welcher offiziell den etwas sonderbaren Namen „RankBrain“ trägt.

Erste offizielle Verlautbarungen zum Einsatz von Künstlicher Intelligenz unter dem Namen RankBrain gab es von Google Anfang 2015. Das System, so hieß es, trage dazu bei, die Suchergebnisse auf unbekannte, neue Suchanfragen und komplexere Eingaben aus der natürlich gesprochenen Sprachsuche richtig zu interpretieren und passende Suchergebnisse auszuliefern. Damals waren laut Google rund 15% aller Google Suchanfragen betroffen. Mittlerweile ist es bei allen rund drei Billionen Suchanfragen pro Jahr im Hintergrund aktiv.

Machine Learning‘ und künstliche Intelligenz

Machine Learning, in seiner reinsten Form auch „Deep Learning“ genannt, ist ein automatisierter Lernprozess in dem ein System durch Mustererkennung, Vergleiche und Beispiele die Lerndaten verallgemeinern und auf neue, unbekannte Situationen anwenden kann. Auch hinter RankBrain verbirgt sich ein künstliches neuronales Netzwerk, das ohne menschliche Anleitung lernt, aus  vorhandenen Daten und Informationen Zuordnungen und Zusammenhänge zu erkennen und zu nutzen. So ein System kann aber nur dann als Künstliche Intelligenz bezeichnet werden, wenn es in der Lage ist, ähnlich einem Menschen Wissen selbstständig zu erwerben und zwischen den erlernten Erkenntnissen und vorhandenen Informationen neue Verbindungen aufzubauen.

RankBrain und Google Suche

Zusammen mit den Verweisen zwischen den Websites im Internet (Backlinks) und semantischen Signalen, wie Nutzerverhalten, ist es der drittwichtigste Ranking Faktor.

RankBrain ist ein Teil der Google Suche, welche wiederum auf einem Algorithmus namens „Hummingbird“ basiert. Dieser zieht bis zu 200 unterschiedliche Faktoren, sogenannte Signale, in Betracht, um zu entscheiden, welche Informationen geeignet sind, die Suchintention des Nutzers zu befriedigen und in den Suchergebnissen angezeigt zu werden. Diese Informationen können alle Formen haben, seien es Websites, Apps, Videos und Dokumente.

Vor der Implementierung von RankBrain wurden Suchergebnisse anhand statistischer, von Menschen vorgegebener Bewertungsmaßstäbe, berechnet. Im Falle nicht zufriedenstellender Suchergebnisse, wurden diese Werte überprüft und angepasst, zuweilen sogar ganz gelöscht. Diese Bewertungsmaßstäbe kann man sich als Filter vorstellen, die sich auf ausgewählte Aspekte des Google Algorithmus beziehen. Manche dieser Filter sind bekannt und haben aus der Tierwelt entlehnte Namen bekommen. Zum Beispiel „Panda“, dieser betrachtet inhaltliche Aspekte und Relevanz von Websites, „Penguin“, dieser analysiert die Qualität von Backlinks von Websites oder „Pidgeon“ mit Auswirkungen auf die lokale Suche. (Mehr dazu erfahrt ihr im Artikel „Google Updates“) Da Websitebetreiber versuchen, diese Filter mit speziell ausgerichteten Inhalten oder falschen Backlinks zu manipulieren, müssen sie häufig aktualisiert werden. Dafür wird jedoch nur der Filter und nicht der gesamte Google Algorithmus aktualisiert. Auf diese Art und Weise kann eine hohe Qualität der Suchergebnisse geleistet werden, ohne dass der zentrale Google Algorithmus berührt wird.

Funktionsweise von RankBrain

RankBrain dagegen basiert nicht rein auf statistischen Werten, sondern abstrahiert diese selbst auf Basis von Machine Learning. Es nutzt Machine Learning, um Informationen in mathematische Entitäten (Vektoren) umzuwandeln. Auf diese Weise wird es möglich, Informationen zu vergleichen, Muster zu erkennen und neue Verbindungen zu schaffen. So können bekannte und unbekannte Suchanfragen interpretiert und das am besten passendste Suchergebnis ausgeliefert werden.

Darüber hinaus kann RankBrain den Prozess des Vektoring mit kontextuellen Daten anreichern. Über sein Betriebssystem Android oder den Chrome Browser verfügt Google inzwischen über den Zugang zu vielen kontextuellen Informationen wie Standort, Gerät eines Nutzers, Sprache die er spricht usw. Die Masse dieser Informationen, auch als Big Data bezeichnet, wird von Google in einen ständigen Prozess gesammelt und aktualisiert. Dank der in immer größeren Umfang zur Verfügung stehenden Datengrundlage kann der Lernprozess von RankBrain kontinuierlich verbessert werden. Das System wird intelligenter dabei, Nutzerverhalten zu registrieren, Zusammenhänge zu erkennen und zu interpretieren. (Quelle: Luna Park Alona Demchyk.)

Fakten und Anwendung

Das RankBrain System wurde 2015 zum ersten Mal ausgerollt. Google gesteht indes ein, dass die Firma nicht genau erklären könne, wie sich die RankBrain-Technologie letztendlich auswirkt. „We have no idea“ sagte Gary Illyes, Webmaster Trends Analyst bei Google auf dem SMX Advanced Konferenz in 2016 (Quelle: Search Engine Land)

Folgende Informationen sind aber über RankBrain bekannt:

  • es ist ein Teil des Google Algorithmus
  • es entwickelt sich dynamisch und befindet sich in einem ständigen Lernprozess
  • es wird bereits bei allen Suchanfragen angewendet
  • RankBrain wirkt sich nicht zwangsläufig auf die Suchergebnisse aus
  • sein Lernprozess basiert unter anderem auf Nutzer-Verhaltensmustern in Kombination mit kontextuellen Informationen
  • es versucht nicht einzelne Wörter, sondern die Phrasen und die Nutzerintention zu verstehen

Für folgende Arten von Suchanfragen ist RankBrain relevant:

  • Sprachsuche
  • Unbekannte Suchanfragen
  • Long-tail Suchanfragen
  • Suchanfragen mit mehrdeutigen Wörtern

Welche Websites werden von RankBrain profitieren?

Die Verwendung von RankBrain und der Umstieg von rein statistischen auf semantisch-bezogene Ranking Faktoren im Google Algorithmus führt zu folgenden Schlussfolgerungen:

  • Websites mit einzigartigen Inhalten, die die Nutzerintention befriedigen können (sogar auf Artikelebene)
  • Websites mit übersichtlicher und klarer Informationsarchitektur
  • Websites mit der Fähigkeit konversationale Suchanfragen befriedigen zu können
    1. Entitäten (Suchanfragen rund um Persönlichkeiten, Orte und Sachverhalte) und deren semantische Zusammenhänge
    2. Strukturierte Daten (Structured Data Markup)
    3. Nutzerorientierte Inhalte
    4. Diversität von Inhalten, die im Zusammenhang alle Aspekte einer Entität

Das können Bilder, Videos, Grafiken usw. sein, die gesonderte Darstellung in den Google Suchergebnissen verdienen (Knowledge Graph, Universal Search, Featured Snippets)

RankBrain ist noch weit davon entfernt zu einem selbständigen KI System zu werden, da es noch nicht selbständig lernt, sondern von den Google Ingenieuren „trainiert“ wird. Nichtsdestotrotz soll es durch die Implementierung von Machine Learning bei komplexen Suchanfragen besser werden, um ohne menschliche Hilfe bislang unbekannte Suchanfragen beantworten zu können.