Ubuntu

Aan de slag met Rstudio op Ubuntu Linux

Aan de slag met Rstudio op Ubuntu Linux
Deze tutorial illustreert hoe je Rstudio op Ubuntu 20 . installeert.04.

Rstudio biedt een geïntegreerde ontwikkelomgeving om vrije programmeertaal "R"-dingen te verwerken, die beschikbaar is onder de licentie van GNU. Rstudio is een ideale computeromgeving voor het genereren van gedetailleerde statistische visualisaties en wordt als zodanig door statistici over de hele wereld gebruikt.

RStudio is toevallig ook beschikbaar als softwareprogramma en als servertoepassing, gebruikt door verschillende Linux-distributies en voor Windows en macOS.

Download de programmeertaal R (Vereisten)

Rstudio desktop-applicatie heeft de R-programmeertaal nodig om op Linux-distributies te werken. Het is noodzakelijk om een ​​R-versie te downloaden die compatibel is met uw Linux-besturingssysteem. U kunt het downloaden met behulp van een softwarerepository.

1- R downloaden met de webbrowser

Als u R niet van het softwarecentrum kunt krijgen, betekent dit dat de repository eerst moet worden bijgewerkt. Je kunt dat allemaal overslaan en het van internet downloaden door deze link in te typen:

https://cran.studio.com

In het zoekvak van uw webbrowser. Hun startpagina zou moeten lijken op de onderstaande schermafbeelding:

2- R downloaden van Linux-terminal

Start de CLI-terminal, typ de onderstaande opdracht en druk op enter:

Voer vervolgens een update uit met de onderstaande opdrachten:

$ sudo apt-get update

Deze opdracht haalt de updates van R op en haalt alle relevante bestanden op uit de belangrijkste Ubuntu-repository.

Geef vervolgens de volgende opdracht om R te installeren:

Het bovenstaande commando doorloopt de pakketlijst, onthult hoeveel schijfruimte het zal vullen en vraagt ​​vervolgens om bevestiging. Druk op de 'Y'-toets op je toetsenbord om door te gaan met de installatie.

De uitvoer zal hoogstwaarschijnlijk de installatie bevestigen.

U kunt het opzoeken in het zoekvak, zoals hieronder geïllustreerd:

Rstudio installeren op Ubuntu 20.04 met opdrachtterminal

Met de host-programmeertaal geïnstalleerd, kunnen we nu doorgaan met het installeren van Rstudio. Om de installatie te demonstreren, gebruiken we de opdrachtregelterminal.

Start de terminal op en geef het volgende uit:

$ sudo apt-get install gdebi-core

U wordt gevraagd om het root-wachtwoord in te voeren. Nadat u het wachtwoord hebt ingevoerd, begint de installatie van het pakket

$ wget https://download1.rstudio.org/desktop/bionic/amd64/rstudio-1.3.1093-amd64.deb

Het Rstudio online pakket is nu aangesloten en wordt overgezet naar je harde schijf.

Je wordt gevraagd om het root-wachtwoord opnieuw in te voeren. Voer het wachtwoord in om de pakketlijst te laten lezen en laden.

De geïnstalleerde zal toestemming vragen om door te gaan, druk op de y-toets op je toetsenbord.

De uitvoer zal de installatie verifiëren, zoals hieronder getoond:.

Aan de slag met RStudio:

Om RStudio te starten, ga je naar het zoekvak en zoek je Rstudio op. Je ziet het in een van de lijsten zoals hieronder weergegeven:

Klik op het Rstudio-pictogram om het te starten.

Gegevenssets onderzoeken met RStudio

Met Rstudio kunt u alle gegevens visualiseren in de vorm van grafieken, tabellen en grafieken.

Laten we, om te begrijpen hoe gegevens visueel worden weergegeven in Rstudio, de steekproefpopulatie van 2010 voor elke postcode als voorbeeld nemen.

Het proces van data-analyse kan vaag worden teruggebracht tot de volgende vier stappen:

1-Import onbewerkte gegevens

U kunt de onbewerkte gegevens rechtstreeks van internet in Rstudio importeren door dit systematisch in het consolevenster te doen met de onderstaande opdracht:

$ cpd <- read.csv(url("https://data.lacity.org/api/views/nxs9-385f/rows.csv?accessType=DOWNLOAD")

Als de opdracht wordt uitgevoerd, haalt Rstudio de gegevens op als een csv-bestand van internet en wordt de inhoud toegewezen aan de cpd-variabele.

Een andere manier om gegevens naar Rstudio te importeren, is door de gegevensset handmatig naar uw harde schijf te downloaden en vervolgens de inhoud te openen met de functie voor het importeren van gegevens van Rstudio.

Ga naar de optie dataset importeren op het tabblad Omgeving en selecteer het datasetbestand om te uploaden. Klik op OK en u krijgt het dialoogvenster over de dataset te zien. Hier specificeert u de parameters, evenals de namen en decimalen. Als je klaar bent, klik je gewoon op importeren, en de dataset wordt toegevoegd aan de Rstudio en er wordt een variabele aan de naam toegewezen.

Om te zien welke datasets in gebruik zijn, geeft u de onderstaande opdracht op met de variabele die aan een dataset is toegewezen:

$Bekijken(cpd)

2 -De gegevens manipuleren

Nu je de dataset hebt geïmporteerd, kun je veel doen om deze data te transformeren. De gegevens worden gemanipuleerd via transformatiefuncties transformation. Stel dat u wilt touren naar een bepaalde array binnen de dataset. Als we naar de kolom met de totale bevolking in onze dataset zouden gaan, zouden we de onderstaande opdracht invoeren:

$ cpd$Totale bevolking

De gegevens zijn ook opvraagbaar in de vorm van een vector:

$ cpd[1,3]

Met de subset-functie in Rstudio kunnen we de dataset opvragen. Laten we zeggen dat we de rijen moeten markeren waar de man-vrouwverhouding positief is. Om die rijen te selecteren, geeft u de volgende opdracht:

$ a <- subset(cpd , Total Males > Totaal vrouwen)

In de bovenstaande opdracht moest de eerste parameter die we hadden toegewezen de variabele zijn die werd toegeschreven aan de dataset waarop we de functie hebben toegepast. Booleaanse voorwaarde wordt beschouwd als de tweede parameter. Ook moet de booleaanse conditie voor elke rij worden beoordeeld. Het dient als de beslissende factor of een rij al dan niet deel uitmaakt van de output.

3 -De gemiddelde functies op de dataset gebruiken

Rstudio heeft specifieke functies om gemiddelden op de dataset te berekenen:

$ mean(cpd$Total Males) - berekent eenvoudig gemiddelde
$ mediaan(cpd$Total Females) - geeft de mediaan voor een kolom
$ kwantiel(cpd$Totale populatie) -geeft het kwantiel voor een kolom
$ var(cpd$Total males) -berekent de variantie voor een kolom
$ sd(cpd$Total Females) -geeft standaarddeviatie

Om het samengevatte rapport over de dataset te krijgen, kunt u een van deze functies ook op de hele dataset uitvoeren.

$ samenvatting (cpd)

4 -Een grafiek maken voor de dataset

Als je vaak met Rstudio gaat werken, zul je merken dat de visualisatietool erg vindingrijk is. U kunt een grafiek maken van elke geïmporteerde dataset met de plot en andere visualisatiefuncties in Rstudio.

Om een ​​scatterplot voor de dataset te genereren, geeft u de volgende opdracht op:

$ plot(x = s$Totaal mannen, y = s$Totaal vrouwen, type = 'p')

Laten we het nu hebben over de parameters die hierbij betrokken zijn. In elke parameter verwijst s naar de subset van de originele dataset, en door "p" toe te voegen, geeft u aan dat u de uitvoer wilt plotten.

U kunt uw dataset ook weergeven in de vorm van een histogram:

$ hist(cpd$Totaal huishoudens)

Op dezelfde manier, om een ​​staafdiagram van de geïmporteerde dataset te verkrijgen:

$ telt <- table(cpd$Total Population)
$ barplot(counts, main="Totale bevolkingsverdeling",
$ xlab="Aantal totale bevolking")

Gegevens beheren in ongelijk verdeelde tijdreeksen

Om gegevens met ongelijk verdeelde tijdreeksen te beheren, moet u het dierentuinpakket integreren met Rstudio. Om het dierentuinpakket te krijgen, gaat u naar de rechterbenedenhoek van het scherm in Rstudio en naar de component van het pakket. Het dierentuinpakket zet de onregelmatige tijdreeksgegevens om in dierentuinobjecten. De argumenten die worden ingevoegd om dierentuinobjecten te maken, zijn de gegevens, die eerst komen, gevolgd door de waarde waarop moet worden gesorteerd.

Zoo-objecten bieden ondersteuning voor gebruiksgemak. Het enige dat u hoeft te doen, is "plot" typen en u krijgt alle plotmethoden te zien die u met dat dierentuinpakket kunt gebruiken.

Als je merkt dat je in de war bent over wat een bepaalde Rstudio-functie te bieden heeft, voer dan de naam van die functie in en volg deze met "?" om de prompt in het helpmenu te zien. Als u op ctrl+spatie drukt na een functienaam, wordt ook het venster voor automatisch aanvullen weergegeven.

Afsluiten

Deze tutorial heeft geïllustreerd hoe je Rstudio kunt instellen op Ubuntu 20.04 en behandelde de basisprincipes van statistische representatie en manipulatie met Rstudio. Als je Rstudio beter wilt gebruiken, zou het een goede eerste stap moeten zijn om vertrouwd te raken met de basisprincipes van R Programming. Rstudio is een krachtig hulpmiddel en heeft toepassingen in vele industrieën over de hele wereld: kunstmatige intelligentie en datamining, om er maar een paar te noemen.

De kern van het R-programmeren leren kennen is een beetje een leercurve, maar het is de moeite waard.

Cursor springt of beweegt willekeurig tijdens het typen in Windows 10
Als u merkt dat uw muiscursor vanzelf springt of beweegt, automatisch, willekeurig tijdens het typen op een Windows-laptop of -computer, dan kunnen en...
De scrollrichting van de muis en touchpads omkeren in Windows 10
Muis en Touchpads maken computergebruik niet alleen eenvoudig, maar ook efficiënter en minder tijdrovend. We kunnen ons een leven zonder deze apparate...
Hoe de muisaanwijzer en cursorgrootte, kleur en schema op Windows 10 te veranderen
De muisaanwijzer en cursor in Windows 10 zijn zeer belangrijke aspecten van het besturingssysteem. Dit geldt ook voor andere besturingssystemen, dus i...