Ein Podcast über KI
Johannes und Gesina, zwei Freunde aus der Forschung, unterhalten sich über Themen rund um künstliche Intelligenz.

Wie funktioniert der YouTube Algorithmus?

avatar
Gesina Schwalbe
avatar
Johannes Rabold

Es geht um den Algorithmus, mit dem YouTube die Videos auf der Startseite bzw. die Watch Next Empfehlungen bestimmt. Wir betrachten sowohl die technischen Aspekte als auch die sozialen Implikationen.

Inhalt

Funktionsweise: Grundlegende Zielsetzung und Einflussfaktoren

  • Was sind Recommender Systeme (Empfehlungsdienste): Zeige einem Nutzer aus einer Auswahl die Objekte, die am relevantesten sind. Nutzt Methoden des maschinellen Lernens und des Information Retrieval.
  • Allgemeines Ziel: Glückliche User, die viel Zeit auf der Platform verbringen (z.B. um viel Werbung einblenden zu können)
  • Historie von YouTube Recommendations:
    • YouTube Gründung 2005, seit 2006 Tochtergesellschaft von Google
    • Bis 2012: Ranking nach Anzahl der Clicks (View-Count) => provoziert viel Click-Bait (reißerische Titel statt gutem Inhalt)
    • Ab 2012: Ranking nach Watch-Time => langatmige Videos, deren wichtigster Inhalt erst am Schluss kommt
    • Ab 2016 (teilweise Offenlegung in einem Whitepaper): Verwendung von Deep Neural Networks => Verwendung vieler weiterer Features
    • Bis heute: Weitere Anpassungen, um anstößige Inhalte zu reduzieren und gut kuratierte Inhalte zu fördern; s. z.B. hier und hier

Technik dahinter

  • Im Speziellen: Wie funktioniert der Youtube Algorithmus (das Whitepaper)
  • Datengetriebene Black-box (tiefe neuronale Netze) mit vielen Features
  • Welche Features sind u.a. wichtig:
    • Metadaten des Videos: Tags, Titel, Beschreibung etc.
    • Video-Performanz
    • Ähnliche User
    • Watch-Time
    • Demographie der User
  • Zweigeteilter Prozess:
    • Kandidatengenerierung: Erst Eingrenzung auf mehrere hundert Videos
      • Ziel: Vorhersage, welches Video als nächstes geschaut wird
      • Embedding von User mit Suchanfrage und Embeddings von Videos werden gematcht
    • Personalisierte Auswahl: Ranking und Fitting auf den User mit wenigen dutzend Videos
      • Weitere User- und Video-spezifische Features (Videos vom selben Channel gesehen, wann das letzte Mal etwas gesehen etc.)
      • Ranking erneut durch Matching der Embeddings
      • Hier wichtigstes Ziel: Watch-Time erhöhen

Soziale Implikationen

Was kann es für einzelne und die Gesellschaft für Probleme geben?

  • Das System ist proprietär => Keiner, insbesondere auch keine unabhängigen Stellen, kann nachschauen, ob hier alles im Lot ist!
  • Ein Recommender-System wählt Vorschläge, die „relevant“, tatsächlich aber einfach bequem für den User sind.
  • Probleme mit Bequemlichkeit:
    • Man wird in seiner eigenen Meinung bestärkt. Egal, ob ein weiterer Blick besser wäre oder nicht.
    • Einem wird möglicherweise eine „heile Welt“ vorgegaukelt.
    • Man wird nicht ermutigt, weitere Meinungen einzuholen oder sich mit weiteren Themen zu befassen.
  • Zementieren von gesellschaftlichem Bias: Es werden sehr sensible Merkmale für die Empfehlungen verwendet, z.B. Geschlecht!
  • Anstößiger, verwerflicher Inhalt, Desinformation: Wer sollte fürs Kuratieren in sozialen Netzwerken zuständig sein? Was sollte der Betreiber bestimmen und ab wann sollte eine unabhängige Stelle oder der Staat das erledigen? Wie verhindert man dabei dann staatliche Kontrolle von unabhängigen Medien?
  • Unsicherheit für Youtuber (=Personen, die über YouTube-Beiträge ihr Haupteinkommen beziehen): Guidelines zum Ranking ändern sich teilw. willkürlich; sie sollten einen klaren Einblick in Verbesserungsmöglichkeiten bekommen!

Sonstige Quellen