Essay

Das Zeitalter der künstlichen Intelligenz

Trotz ihrer kurzen Historie haben Computer und künstliche Intelligenz unseren Alltag bereits grundlegend verändert. Und kaum etwas ist für die Zukunft der Welt und unser eigenes Leben so bedeutsam wie die Frage, wie diese Geschichte weitergeht. Ein Essay von Max Roser.

Bild: Pixabay

Max Roser

Um eine Idee davon zu bekommen, wie die Zukunft aussehen könnte, ist es oft hilfreich, einen Blick in die Vergangenheit zu werfen. Genau das werde ich in diesem Artikel tun: Ich verfolge die kurze Geschichte von Computern und künstlicher Intelligenz zurück, um zu sehen, was uns in der Zukunft erwarten könnte.

Was bisher geschah

Wie schnell sich die Welt verändert hat, wird daran deutlich, dass uns selbst relativ neue Computertechnologie heute uralt vorkommt. In den 90er Jahren waren Mobiltelefone große Ziegelsteine mit winzigen grünen Displays. Zwei Jahrzehnte zuvor waren die wichtigsten Speichermedien für Computer noch Lochkarten.

Binnen kurzer Zeit haben sich Computer so schnell weiterentwickelt und sind zu einem so festen Bestandteil unseres täglichen Lebens geworden, dass man leicht vergisst, wie jung diese Technologie ist. Die ersten digitalen Rechenmaschinen wurden erst vor etwa acht Jahrzehnten erfunden, wie die folgende Zeitleiste zeigt:

Seit den ersten Tagen dieser Geschichte versuchten verschiedene Informatiker, Maschinen so intelligent wie Menschen zu machen. Die folgende Zeitleiste zeigt einige der bemerkenswertesten Systeme der künstlichen Intelligenz (KI) und erläutert, wozu sie fähig waren.

Das erste der aufgelisteten Systeme ist der „Theseus“. Es wurde 1950 von Claude Shannon gebaut und war eine ferngesteuerte Maus, die in der Lage war, den Weg aus einem Labyrinth zu finden und ihn sich zu merken. Binnen der nächsten sieben Jahrzehnte sollten sich die Fähigkeiten der künstlichen Intelligenz sehr stark verbessern:

Auch die Sprach- und Bilderkennungsfähigkeiten von KI-Systemen haben sich rapide entwickelt. Die weiter unten folgende Grafik zeigt dies für die letzten zwei Jahrzehnte der KI-Entwicklung auf. Die dargestellten Daten stammen aus einer Testserie, in der die Performance von Menschen und KI in fünf verschiedenen Bereichen bewertet wurde, von der Handschrifterkennung bis zum Sprachverständnis. In jedem der fünf Bereiche wird die anfängliche Leistung des KI-Systems auf -100 gesetzt, während die menschliche Leistung als Basiswert verwendet und auf 0 gesetzt wird. Das heißt: Wenn die Performance des KI-Systems die Nulllinie überschreitet, hat es in dem jeweiligen Test mehr Punkte erzielt als der Mensch.*

Noch vor zehn Jahren konnte keine Maschine zuverlässig Sprach- oder Bilderkennung auf menschlichem Niveau leisten. Wie die Grafik zeigt, sind KI-Systeme jedoch immer leistungsfähiger geworden – und übertreffen heute den Menschen in all diesen Bereichen:

Allerdings ist die Performance dieser KI-Systeme durchwachsen. In einigen realen Fällen schneiden sie immer noch viel schlechter ab als Menschen. Andererseits sind einige Implementierungen solcher KI-Systeme bereits so billig, dass sie auf dem Telefon in Ihrer Tasche verfügbar sind: Bilderkennung kategorisiert Ihre Fotos und Spracherkennung transkribiert, was Sie diktieren.

Von der Bilderkennung zur Bilderzeugung

Die vorige Abbildung zeigt die rasanten Fortschritte bei den Wahrnehmungsfähigkeiten der künstlichen Intelligenz. Auch bei der Bilderzeugung sind die KI-Systeme wesentlich leistungsfähiger geworden. Die folgende Serie von neun Bildern zeigt die Fortschritte der letzten neun Jahre. Keiner der Menschen auf diesen Bildern existiert, sie wurden alle von einem KI-System erzeugt.

Die Serie beginnt mit einem Bild aus dem Jahr 2014 oben links, einem primitiven Bild eines verpixelten Gesichts in schwarz-weiß. Wie das erste Bild in der zweiten Reihe zeigt, waren KI-Systeme nur drei Jahre später bereits in der Lage, Bilder zu generieren, die sich kaum von einem echten Foto unterscheiden lassen.

In den letzten Jahren sind die Fähigkeiten von KI-Systemen noch viel beeindruckender geworden. Während sich die frühen Systeme auf die Generierung von Bildern von Gesichtern fokussierten, wurden diese neueren Modelle um die Text-zu-Bild-Generierung auf Basis fast beliebiger Aufforderungen erweitert. Das Bild unten rechts zeigt, dass selbst die schwierigsten Eingabeaufforderungen – wie „Ein Zwergspitz sitzt auf dem Thron des Königs und trägt eine Krone. Zwei Tigersoldaten stehen neben dem Thron“ – innerhalb von Sekunden in fotorealistische Bilder umgewandelt werden.*

Spracherkennungen und -produktionen entwickeln sich rasant

Ebenso beeindruckend wie die Fortschritte der Bilder generierenden KI ist die rasante Entwicklung von Systemen, die die menschliche Sprache analysieren und darauf reagieren. Auf dem nächsten Bild sind Beispiele eines von Google entwickelten KI-Systems namens PaLM zu sehen. In diesen sechs Beispielen wurde das System aufgefordert, sechs verschiedene Witze zu erklären. Besonders bemerkenswert finde ich die Erläuterung unten rechts: Die KI erklärt einen Anti-Witz, der den Zuhörer gezielt verwirren soll.

KIs, die Sprache produzieren, haben in den letzten Jahren auf vielfältige Weise Einzug in unsere Welt gehalten. E-Mails werden automatisch vervollständigt, riesige Mengen an Online-Texten übersetzt, Videos automatisch transkribiert, Schulkinder verwenden Sprachmodelle, um ihre Hausaufgaben zu machen, Berichte werden automatisch erstellt, und Medien veröffentlichen KI-generierten Journalismus.

KI-Systeme sind noch nicht in der Lage, lange, zusammenhängende Texte zu produzieren. In Zukunft wird sich zeigen, ob sich die jüngsten Entwicklungen verlangsamen oder sogar enden – oder wir eines Tages einen von einer KI verfassten Bestseller-Roman lesen werden.

Wo wir heute stehen: Science-Fiction wird Realität

Diese rasanten Fortschritte haben den Einsatz von Maschinen in einer Vielzahl neuer Bereiche ermöglicht: Wenn Sie einen Flug buchen, entscheidet oft eine künstliche Intelligenz und nicht mehr ein Mensch, was Sie dafür bezahlen. Wenn Sie zum Flughafen kommen, überwacht ein KI-System, was Sie dort tun. Und wenn Sie dann im Flugzeug sitzen, unterstützt ein KI-System den Piloten dabei, Sie an Ihr Ziel zu fliegen.

KI-Systeme entscheiden auch zunehmend darüber, ob Sie einen Kredit erhalten, Anspruch auf Sozialhilfe haben oder einen bestimmten Job bekommen. Mehr und mehr helfen sie auch bei der Entscheidung, ob jemand aus dem Gefängnis entlassen wird. Verschiedene Regierungen kaufen autonome Waffensysteme für die Kriegsführung, und einige setzen KI-Systeme zur Überwachung und Unterdrückung ein.

KI-Systeme helfen bei der Programmierung der von Ihnen verwendeten Software und übersetzen die von Ihnen gelesenen Texte. Durch Spracherkennung gesteuerte virtuelle Assistenten haben in den letzten zehn Jahren in vielen Haushalten Einzug gehalten. Und selbstfahrende Autos werden Realität.

In den letzten Jahren haben KI-Systeme dazu beigetragen, Fortschritte bei einigen der schwierigsten Probleme der Wissenschaft zu erzielen. Große KI-Systeme, sogenannte „Empfehlungssysteme“, bestimmen, was Sie in den sozialen Medien sehen, welche Produkte Ihnen in Online-Shops angezeigt werden und was Ihnen auf YouTube empfohlen wird. In zunehmendem Maße empfehlen sie nicht nur die von uns konsumierten Medien, sondern erstellen sie dank ihrer Fähigkeit, Bilder und Texte zu erzeugen, sogar selbst.

Künstliche Intelligenz ist nicht länger eine Zukunftstechnologie – sie ist schon da, und vieles, was heute Realität ist, hätte noch vor kurzem wie Science-Fiction ausgesehen. Es handelt sich um eine Technologie, die sich bereits auf uns alle auswirkt, und die obige Liste enthält nur einige ihrer zahlreichen Anwendungen.

Das breite Spektrum der aufgelisteten Anwendungen macht deutlich, dass es sich um eine sehr allgemeine Technologie handelt, die von Menschen für einige sehr gute Ziele eingesetzt werden kann – und auch für einige außerordentlich schlechte. Bei solchen „Dual-Use-Technologien“ ist es wichtig, dass wir alle ein Verständnis dafür entwickeln, was passiert und wie wir die Technologie nutzen wollen.

Noch vor zwei Jahrzehnten sah die Welt ganz anders aus. Wozu könnte die KI-Technologie in der Zukunft in der Lage sein?

Was kommt als Nächstes?

Die gerade betrachteten KI-Systeme sind das Ergebnis jahrzehntelanger, stetiger Fortschritte. Das folgende große Diagramm verdeutlicht diese Entwicklung für die letzten 80 Jahre. Es basiert auf einem von Jaime Sevilla und Kollegen erstellten Datensatz.

Jeder kleine Kreis in diesem Diagramm steht für ein KI-System. Die Position des Kreises auf der horizontalen Achse gibt an, wann es entwickelt wurde. Seine Position auf der vertikalen Achse zeigt den Rechenaufwand, der für das Training des Systems verwendet wurde. Dieser Rechenaufwand für das Training wird in sogenannten Gleitkommaoperationen (Floating Point Operations, kurz FLOP) gemessen. Ein FLOP entspricht einer Addition, Subtraktion, Multiplikation oder Division von zwei Dezimalzahlen.

Alle KI-Systeme, die auf maschinellem Lernen basieren, müssen trainiert werden, und bei diesen Systemen ist die Trainingsberechnung einer der drei grundlegenden Faktoren, die die Fähigkeiten des Systems bestimmen. Die beiden anderen Faktoren sind die Algorithmen und die für das Training verwendeten Eingabedaten. Die Visualisierung zeigt, dass KI-Systeme mit zunehmender Trainingsberechnung immer leistungsfähiger geworden sind.

Die Zeitleiste geht zurück bis in die 1940er Jahre, den Anfängen der elektronischen Computer. Das erste gezeigte KI-System ist „Theseus“, die eingangs erwähnte Robotermaus von Claude Shannon aus dem Jahr 1950. Am anderen Ende der Zeitachse finden sich KI-Systeme wie DALL-E und PaLM, deren Fähigkeiten zur Erzeugung fotorealistischer Bilder und zur Interpretation und Generierung von Sprache genutzt werden (s. oben). Sie gehören zu den KI-Systemen, die bisher den größten Anteil an Trainingsberechnungen benötigten.

Die Trainingsberechnungen sind auf einer logarithmischen Skala aufgetragen, so dass sie von einer Gitterlinie zur nächsten um das 100-fache ansteigen. Diese langfristige Perspektive zeigt einen kontinuierlichen Zuwachs: In den ersten sechs Jahrzehnten wuchs der Rechenaufwand für die Ausbildung entsprechend dem Mooreschen Gesetz und verdoppelte sich etwa alle 20 Monate. Ungefähr seit 2010 hat sich dieses exponentielle Wachstum weiter beschleunigt, und zwar auf eine Verdopplungszeit von nur etwa sechs Monaten. Das ist eine erstaunlich hohe Wachstumsrate.*

Die schnellen Verdopplungszeiten haben zu großen Steigerungen geführt. Die Trainingsberechnung von PaLM betrug 2,5 Milliarden petaFLOP, das ist mehr als 5 Millionen Mal so viel wie die von AlexNet, jener KI, die vor zehn Jahren noch die höchste Trainingsberechnung hatte.*

Die Skalierung war bereits exponentiell und hat sich in den letzten zehn Jahren noch erheblich beschleunigt. Was können wir aus dieser historischen Entwicklung für die Zukunft der KI lernen?

Was uns die Untersuchung von Trends über die Zukunft der KI sagt

KI-Forscher untersuchen diese langfristigen Trends, um zu sehen, was in Zukunft möglich ist. Die vielleicht meistdiskutierte Studie dieser Art wurde von der KI-Forscherin Ajeya Cotra veröffentlicht. Sie untersuchte das Wachstum der Trainingsberechnung, um die Frage zu klären, wann der Rechenaufwand für das Training eines KI-Systems dem des menschlichen Gehirns entsprechen könnte. Die Idee ist, dass das KI-System an diesem Punkt die Fähigkeiten eines menschlichen Gehirns erreichen würde. In ihrer letzten Aktualisierung schätzt Cotra die Wahrscheinlichkeit, dass eine solche „transformative KI“ bis zum Jahr 2040, also in weniger als zwei Jahrzehnten, entwickelt sein wird, auf 50%.

In einem weiteren Artikel erörtere ich, was transformative KI für die Welt bedeuten würde. Kurz gesagt geht es darum, dass ein solches KI-System leistungsfähig genug wäre, um die Welt in eine „qualitativ andere Zukunft“ zu führen: Es könnte zu einem Wandel in der Größenordnung der beiden früheren großen Umwälzungen der Menschheitsgeschichte – der landwirtschaftlichen und der industriellen Revolution – führen. Dies wäre mit Sicherheit der wichtigste globale Wandel zu unseren Lebzeiten.

Cotras Arbeit ist in diesem Kontext besonders relevant, da sie ihre Vorhersage auf jenen historischen Langzeittrend der Trainingsberechnung stützt, den wir gerade analysiert haben. Es ist zudem erwähnenswert, dass weitere Prognostiker, die sich auf andere Annahmen stützen, zu weitgehend ähnlichen Schlussfolgerungen kommen. Wie ich in meinem Artikel über KI-Timelines zeige, glauben viele KI-Experten, dass eine reelle Chance besteht, innerhalb der nächsten Jahrzehnte eine künstliche Intelligenz auf menschlichem Niveau zu entwickeln, und einige glauben sogar, dass dies schon viel früher gelingt.

Aufbau einer öffentlichen Ressource, um die notwendige öffentliche Diskussion zu ermöglichen

Computer und künstliche Intelligenz haben unsere Welt immens verändert, aber wir stehen noch am Anfang dieser Geschichte. Da uns diese Technologie so vertraut vorkommt, vergisst man leicht, dass alle diese Technologien, mit denen wir interagieren, noch sehr junge Innovationen sind und die tiefgreifendsten Veränderungen noch bevorstehen.

Es gibt keine Anzeichen dafür, dass diese Trends in absehbarer Zeit an ihre Grenzen stoßen werden. Im Gegenteil, vor allem in den letzten zehn Jahren haben sich die grundlegenden Trends noch weiter beschleunigt: Die Investitionen in KI-Technologie sind rapide gestiegen, und die Verdopplungszeit von Trainingsberechnungen hat sich auf nur sechs Monate verkürzt.

Alle großen technologischen Innovationen haben eine Reihe positiver und negativer Folgen. Dies trifft bereits auf die künstliche Intelligenz zu. Da diese Technologie immer leistungsfähiger wird, ist davon auszugehen, dass ihre Auswirkungen noch zunehmen werden. Und angesichts ihrer Bedeutung sollten wir alle in der Lage sein, uns eine Meinung darüber zu bilden, wohin sich diese Technologie entwickelt, und zu verstehen, wie diese Entwicklung unsere Welt verändert. Zu diesem Zweck bauen wir auf unserer Webseite Our World in Data eine Sammlung von KI-bezogenen Metriken auf, die Sie hier finden können.

Wir befinden uns noch an den Anfängen dieser Geschichte, und vieles ist noch Zukunftsmusik. Eine so mächtige technologische Entwicklung wie diese sollte im Mittelpunkt unserer Aufmerksamkeit stehen. Kaum etwas anderes könnte für die Zukunft unserer Welt – und die unseres Lebens – so bedeutsam sein.

Zum Autor:

Max Roser ist Ökonom an der University of Oxford und bloggt regelmäßig auf dem von ihm gegründeten Portal Our World in Data, wo dieser Beitrag zuerst in einer früheren Form auf Englisch erschienen ist.