Aus Linux-Magazin 10/2024

Eine Analyse der Worthäufigkeiten auf Linux-Magazin Titelseiten der letzten Jahrzehnte

© Computec Media GmbH

Runde Geburtstage sind ein Anlass zur Rückschau. Auch die Linux-Magazin-Redaktion gönnte sich ein paar besinnliche Minuten, um zu reflektieren, worüber wir wann geschrieben haben und wie sich Themen und Perspektiven im Lauf der Zeit veränderten.

Wollten wir den Wandel der Themen aus der Sicht nur eines Redakteurs darstellen, ergäben sich zwei Schwierigkeiten: Erstens gibt es niemanden, der die vollen 30 Jahre beim Linux-Magazin mitgearbeitet hat – ich selbst bin mit immerhin über 20 Jahren schon der längst gediente Mitarbeiter der Redaktion. Zweitens wären die Beobachtungen zwangsläufig subjektiv. Wie aber könnte man sie objektivieren? Vielleicht indem man alle je erschienenen Artikel unter die Lupe nähme, sie thematischen Kategorien zuordnete und deren Häufigkeit bestimmte? Da türmt sich bereits die erste Hürde dadurch auf, dass man die Texte zuerst in ein geeignetes und computergerechtes Format überführen müsste. Die Artikel aus den Anfangsjahren und weit darüber hinaus liegen aber nur im HTML-Format vor, aus dem man vor einer inhaltlichen Analyse alle HTML- und CSS-Tags, alle Listingkästen, alle Tabellen, alle früher oft ausufernden Linklisten, alle Autorenkästen, vielleicht auch die Bildunterschriften und dergleichen entfernen müsste. Danach wäre das Klassifizieren eine Aufgabe für eine eigene KI. Das ist zu aufwendig.

Die Methode

Wie wäre es aber, sich auf die Titelseiten zu beschränken, die ja bereits eine Vorauswahl der Themen bieten, die der Redaktion als besonders wichtig erschienen sind? Die Titel der letzten Jahre gibt es als PDF-Datei, aus der sich die Texte per Cut&Paste extrahieren lassen, die Titel der Anfangsjahre müsste man notfalls abtippen, so viel Text enthalten sie ja nicht. Im Alleingang und halbtageweise zog sich die Sammlung aller Texte von 57 Titeln aus den letzten 30 Jahren dennoch über Wochen hin.

Diese Texte haben wir dann auch nicht klassifiziert, sondern einfach die Worthäufigkeiten ausgezählt. Das erledigte ein kleines Python-Skript, das zuvor alle weniger Bedeutung tragenden Wortarten wie Artikel, Präpositionen oder Pronomen und dergleichen entfernte. Die so pro Periode entstehenden Wortlisten haben wir nach Häufigkeit absteigend sortiert und die jeweils ersten 40 Einträge für unsere Wortwolken verwendet.

In den Wortwolken, die nebenbei die Web-Applikation http://www.wortwolken.com [1] berechnet hat, steht die Schriftgröße für die relative Häufigkeit des jeweiligen Worts. Die Farbe orientiert sich grob an inhaltlichen Kriterien: Rot für Linux selbst und verwandte Themen (Kernel oder Distributionen zum Beispiel), zweierlei Blau für Systemadministration respektive Softwareentwicklung, Türkis für Security Themen, Braun für Applikationen und hellblau für neutrale Begriffe wie etwa “Workshop” oder “Praxis”. Die Schriftarten haben wir nach ästhetischen Gesichtspunkten gewählt, den einzelnen Begriffen aber zufällig zugeordnet.

Selbstredend ist auch das nur ein Kompromiss. Das beginnt bereits bei der willkürlichen Festsetzung des Beobachtungszeitraums für eine Wortwolke: Wie man diese Perioden auch wählt, sie gehen nie mit den technischen Entwicklungen synchron, sodass ein Trend, der in einem Zeitabschnitt beginnt und in einem anderen endet, in beiden nur mit anteiligem Gewicht zu Buche schlägt. Da die allerersten Ausgaben gar keine richtigen Titelseiten aufwiesen und die Titel folgender Jahrgänge nur noch als Low-Res-Jpeg vorliegen, bei dem sich die Augen verdirbt, wer versucht, klein geschriebene Texte zu lesen, entschlossen wir uns, mit unserer Analyse nach der letzten Jahrtausendwende einzusteigen und danach Fünfjahreszeiträume zu bilden, wobei der letzte nur gut dreieinhalb Jahre bis heute umfasst.

Ein zweites Problem sind Synonyme wie Harddisk und Festplatte, die mit unserer Methode als zwei Worte gezählt werden, obwohl sie auf dieselbe Sache verweisen. Ähnliche Schwierigkeiten verursachen Lang- und Kurzformen (“Raspi” und “Raspberry PI”), Abkürzungen oder mit der Zeit veränderte Schreibweisen. Darüber hinaus sind Mehrwort-Begriffe oder Eigennamen aus mehreren Wörtern problematisch (“Künstliche Intelligenz”, “Red Hat”) – zerteilt in einzelne Worte ergeben sie einen anderen Sinn als der zusammengesetzte Begriff. Hier haben wir uns bereits beim Erfassen dafür entschieden, einige Fälle durch Camel-Case-Schreibweise zusammenzuziehen (“OpenStack”, “RedHat”). Alles in allem spiegeln die Wortwolken trotz aller Stolperfallen aber recht gut wider, was im jeweiligen Zeitraum wichtig war.

2001-2005

In dieser Zeit führen ein Dutzend Länder den Euro ein, die USA beginnen den Irak-Krieg, der Hurrikan Katrina verwüstet New Orleans, ein Deutscher wird Papst. In der IT-Welt festigt Linux seine Position als Server-Betriebssystem. Sofern es dabei um Datenbanken geht, läuft auf den Servern häufig MySQL. Admins, die ihre Arbeit automatisieren wollen, greifen vor allem zu Shell-Skripten oder verwenden das beliebte Perl, wo eine GUI erforderlich ist auch Tcl/Tk. Erste Ansätze für spezialisierte Tools gab es mit Cfengine zwar auch schon, auf den Titel schaffte es diese Software aber nicht häufig genug. Wo es um die Zusammenarbeit mit Windows-Rechnern geht, ist Samba das A und O. Der Linux-Desktop (mit KDE und Gnome oder auch dem GUI-Framework Qt) spielt verglichen mit Themen aus dem Bereich Systemadministration für Server eine eher untergeordnete Rolle. Auch das Web ist noch kein großes Thema, obwohl zum Ende der Periode sowohl Facebook als auch Youtube starten.

2006-2010

Das Sommermärchen der Fußball-WM in Deutschland fällt in die Zeit, Barack Obama wird US-Präsident, eine weltweite Finanzkrise belastet die Wirtschaft, die Explosion der Bohrinsel Deepwater Horizon führt zur schlimmsten Ölkatastrophe in der Geschichte der USA. An unserer Wortwolke lässt sich noch keine dramatische Veränderung ablesen. Unter den Distributionen findet nicht mehr Suse, sondern Debian am häufigsten Erwähnung und Ubuntu ist hinzugekommen. Die nach wie vor dominierenden Linux-Server sind für das Magazin dankbare Testobjekte und so schaffen es sowohl der “Test” als auch der “Vergleichstest” unter die häufigsten 40 Worte auf den Titeln. “Perl” ist immer noch viel häufiger als “Python” und selbst “Java”. Auch “Windows” schafft es öfter auf den Titel – sei es wegen einer alternativen Linux-Lösung, sei es als Sicherheitsrisiko oder als System, mit dem Linuxer irgendwie zusammenarbeiten müssen.

2011-2015

Ein Tsunami löst die Nuklearkatastrophe von Fukushima aus, der Mars-Rover Curiosity landet auf dem Roten Planeten, Russland annektiert die Krim, Millionen Flüchtlinge suchen in Europa Schutz. In unserer Wortwolke deuten sich die ersten Anzeichen einer großen Veränderung an: Erstmals taucht “Cloud” auf dem Titel auf und – noch häufiger – die konkrete Ausprägung “OpenStack”. “Ubuntu” überholt bei den Distributionen sowohl Suse als auch Red Hat. Perl kommt nun viel seltener vor und ist auf Augenhöhe mit Python, beide jetzt geschlagen von Java. Zum ersten Mal gelangt der Raspberry Pi auf die Bühne der Titelseiten. Das Web hat an deutlich Bedeutung gewonnen, mit ihm die Themen “Apache” und “HTML”.

2016-2020

Die Briten stimmen für den Brexit, Trump wird US-Präsident, das Pariser Klimaschutzabkommen tritt in Kraft, die Covid-19-Pandemie beginnt in China. Auf den Linux-Magazin-Titelseiten ist es nun unübersehbar: “Cloud” ist in der Wortwolke nun so groß wie der Allzeit-Dauerbrenner “Linux”, auch OpenStack ist kräftig gewachsen. Hinzugekommen sind “Kubernetes” und “Docker” sowie “Ceph” und “Ansible”. Begriffe wie “Software” oder “Server”, die in den zurückliegenden 15 Jahren immer das Bild der Wolke mitbestimmt hatten, sind dagegen stark geschrumpft. Bei den Programmiersprachen geben nun Go und C++ den Ton an, Java und Python liegen nun deutlich vor Perl.

2021-heute

Die Covid-Pandemie setzt sich fort, die USA ziehen aus Afghanistan ab, Angela Merkel beendet ihre Regierungszeit, Russland beginnt seinen Angriffskrieg gegen die Ukraine, Queen Elizabeth II stirbt, Terrorkommandos der islamistischen Hamas überfallen Israel. Unter den 40 häufigsten Begriffen auf Linux-Magazin-Titelseiten erscheint nun in prominenter Größe “Container” neu neben “Cloud” und “Kubernetes”. Neu hinzugekommen ist “KI”. “Perl” verschwindet gänzlich, “Go” rangiert mit Abstand vor “C++”, “Python” und “Java”, neu dabei ist “Rust”. Marginalisiert ist “Test”, was ein deutlich angewachsener “Vergleich” vielleicht teilweise kompensiert, weiter verkleinert hat sich der in der Frühzeit dominante “Server”.

Fazit

Sehr gut an den Top-40-Listen der Begriffe von Linux-Magazin-Titelseiten ablesen lässt sich der Siegeszug der Virtualisierung mit Cloud Computing und Containerisierung als grundlegender Paradigmenwechsel in der IT. Im Gegenzug ist der klassische Server als einzelne physische Maschine verschwunden – vielleicht noch nicht endgültig aus der Realität, aber aus dem Fokus der Titelseiten. Und mit ihm untergegangen ist ein ganzes Ökosystem aus HA-Clustern und selbstgeschriebenen Automatisierungsskripten, aus Monitoringsoftware der alten Schule, Sicherheit durch Firewalls und hergebrachtem Networking. An deren Stelle getreten sind As-a-Service Dienste, Automatisierer wie Ansible oder Puppet, Softwaredefined Networking und Monitoring mit Metrik-Sammlern a la Prometheus. Das alles bedingt eine wesentlich höhere Komplexität, was für die Redaktion unter anderem bedeutet hat, dass sich ein solches Setup nicht eben mal schnell aufsetzen und testen lässt wie früher etwa ein Datenbankserver. Entsprechend ist “Test”, früher oft ein Wort der zweitgrößten Kategorie, im letzten Fünfjahreszeitraums eines der kleinsten Kategorie. Spiegelbildlich dazu ist keines der im Zeitraum “2021-heute” dominierenden Worte wie “Cloud”, “Container”, “Kubernetes” oder “KI” auf den Titeln der ersten Jahre auch nur vorhanden, geschweige denn in den Top-40.

Infos

  1. Wortwolken-Generator: https://wortwolken.com
DIESEN ARTIKEL ALS PDF KAUFEN
EXPRESS-KAUF ALS PDFUmfang: 4 HeftseitenPreis €0,99
(inkl. 19% MwSt.)
LINUX-MAGAZIN KAUFEN
EINZELNE AUSGABE Print-Ausgaben Digitale Ausgaben
ABONNEMENTS Print-Abos Digitales Abo
TABLET & SMARTPHONE APPS Readly Logo
E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Inline Feedbacks
Alle Kommentare anzeigen
Nach oben