Eine kurze Vorstellung von R

Hadley Wickham and others at RStudio (https://commons.wikimedia.org/wiki/File:R_logo.svg), https://creativecommons.org/licenses/by-sa/4.0/legalcode, keine Änderungen

Hadley Wickham and others at RStudio (https://commons.wikimedia.org/wiki/File:R_logo.svg), https://creativecommons.org/licenses/by-sa/4.0/legalcode, keine Änderungen

Kennen Sie R? Sie ist eine der bekanntesten Programmiersprachen1 und trotzdem sind nur wenige damit vertraut. R ist der Name der Programmiersprache – und auch der der Software. Sie wurde Anfang der 1990er entwickelt und wird für statistische Berechnungen und Grafiken eingesetzt. Unter den Bedingungen der GNU General Public License (GPL) kann sie kostenfrei eingesetzt werden. Da die Benutzeroberfläche von R eingeschränkt ist, bietet es sich an, eine externe Benutzeroberfläche zu installieren. Dafür gibt es mehrere Möglichkeiten. Meine Empfehlung ist RStudio2, es ist ebenfalls kostenlos verfügbar und leicht bedienbar.

Die Syntax von R ist relativ einfach. Den Variablen muss kein Datentyp, wie int oder char, zugewiesen werden, R bestimmt den Typ selbst. Hingegen bezeichnen a und A verschiedenartige Symbole und beziehen sich somit auf unterschiedliche Variablen. Solch eine Variable kann aus einem oder auch aus mehreren Buchstaben bestehen. Einige Wörter („Keywords“) dürfen jedoch nicht als Variablennamen genutzt werden z.B. function, for, if, else, while und TRUE.

Das Programm kann als Taschenrechner verwendet werden. Möchte man das errechnete Ergebnis künftig weiterverwenden, muss man diesen Wert einer Variable zuweisen.

To understand computations in R, two slogans are helpful: Everything that exists is an object. Everything that happens is a function call. John M. Chambers3

John M. Chambers, ein Mitentwickler von R, erklärt in seinem Paper3, „Um Berechnungen in R zu verstehen sind zwei Sätze hilfreich: Alles, was existiert, ist ein Objekt. Alles, was passiert, ist ein Funktionsaufruf.“ Das heißt, Berechnungen, die komplexer als eine Konstante oder ein Name sind, werden als Funktionsaufruf durch R verarbeitet.

R enthält Basispakete, die die Standardfunktionen, grundlegende Statistik- und Grafikfunktionen, sowie auch Beispieldatensätze zum Ausprobieren beinhalten. Der Funktionsumfang des Programms kann erweitert werden, um etwa Zugriff zu speziellen Daten oder außergewöhnlicheren statistischen Methoden zu erhalten. Zudem existieren packages, die Schnittstellen zu Datenbanken (RMySQL), anderen Programmiersprachen (rPython) oder Webservices (RSelenium) liefern. Diese müssen manuell installiert werden.

Eines dieser Pakete stelle ich folgend näher vor, und zwar testthat. Es funktioniert wie ein Unittest, d.h. es erleichtert das Testen eines Codes, wenn man unter anderem Änderungen an ihm vornimmt. Genauer gesagt, wird es verwendet, um zu überprüfen, ob der geschriebene Code auch das richtige Resultat liefert.

Dieser Test besteht aus einem Testnamen und den zu testenden Code zuzüglich seines erwarteten Ergebnisses. Ein Vorteil dieses packages ist, dass, wenn der Test fehlschlägt, man am Output die Ursache erkennen kann, wie auch am Beispiel zu erkennen ist. Die 2. Zeile liefert keinen Output, da sie korrekt ist, das Ergebnis entspricht dem erwarteten Wert.

Hilfe zu Paketen, Funktionen oder Operatoren erhält man direkt in R durch Eintippen eines Kommandos. Mittels help.start() öffnet sich die HTML Version von R’s Onlinedokumentation. Benötigt man Hilfe bzgl. eines speziellen Befehls, beispielsweise wie man einen Vektor erzeugt, erhält man diese anhand der Eingabe von help(vector) oder ?vector.

Zusammengefasst ist R als Open-Source-Software, sowie auch als Programmiersprache, sehr vielseitig. Zugleich werden keine tiefergreifenden Programmierkenntnisse benötigt und bei Schwierigkeiten erhält man viele Lösungsansätze im Internet. Für jeden, der sich für Berechnungen und Datenanalyse interessiert, ist R klar zu empfehlen.

Quellen und weiterführende Informationen:

Literatur:

1 https://pypl.github.io/PYPL.html

2 https://rstudio.com/

3 John M. Chambers (2014); Object-Oriented Programming, Functional Programming and R. Statistical Science 2014, Vol. 29, No. 2, pp. 167–180.

 

Weiterführende Literatur:

Hadley Wickham (2011); testthat: Get Started with Testing. The R Journal, vol. 3, no. 1, pp. 5––10.

Daniel Wollschläger (2017); Grundlagen der Datenanalyse mit R. Berlin: Springer, 4. Auflage.

Autor
SEQIS Autor Claudia Amon
Newsletter

Um neue Beiträge per E-Mail zu erhalten, hier die E-Mail-Adresse eingeben.

Unsere Autoren

Informieren Sie sich über unsere Autoren und erfahren Sie mehr über unsere Spezialisten und ihre Fachbereiche:

Zu den Autoren

Sie haben eine Frage?

Zurück

Zum Seitenanfang navigieren