I dataanalyse kan du sortere dine data efter en bestemt variabel i datasættet. I R kan vi bruge hjælp fra funktionsrækkefølgen (). I R kan vi let sortere en vektor med kontinuerlig variabel eller faktorvariabel. Arrangering af data kan være i stigende eller faldende rækkefølge.
Syntaks:
sort(x, decreasing = FALSE, na.last = TRUE):
Argument:
- x : En vektor, der indeholder kontinuerlig eller faktorvariabel
- faldende : Kontrol efter rækkefølgen af sorteringsmetoden. Som standard er faldende indstillet til 'FALSK'.
- sidste : Indikerer om 'NA'-værdien skal placeres sidst eller ej
Eksempel 1
For eksempel kan vi oprette en tibble-dataramme og sortere en eller flere variabler. En tibble dataramme er en ny tilgang til datarammen. Det forbedrer syntaksen for datarammen og undgår frustrerende datatypeformatering, især for tegn til faktor. Det er også en bekvem måde at oprette en dataramme i hånden, hvilket er vores formål her. For at lære mere om pladder, henvises til vignetten: https://cran.r-project.org/web/packages/tibble/vignettes/tibble.html
library(dplyr)set.seed(1234)data_frame <- tibble(c1 = rnorm(50, 5, 1.5),c2 = rnorm(50, 5, 1.5),c3 = rnorm(50, 5, 1.5),c4 = rnorm(50, 5, 1.5),c5 = rnorm(50, 5, 1.5))# Sort by c1df <-data_frame[order(data_frame$c1),]head(df)
Produktion:
# A tibble: 6 x 5## c1 c2 c3 c4 c5#### 1 1.481453 3.477557 4.246283 3.686611 6.0511003## 2 1.729941 5.824996 4.525823 6.753663 0.1502718## 3 2.556360 6.275348 2.524849 6.368483 5.4787404## 4 2.827693 4.769902 5.120089 3.743626 4.0103449## 5 2.988510 4.395902 2.077631 4.236894 4.6176880## 6 3.122021 6.317305 5.413840 3.551145 5.6067027
Eksempel 2
# Sort by c3 and c4df <-data_frame[order(data_frame$c3, data_frame$c4),]head(df)
Produktion:
# A tibble: 6 x 5## c1 c2 c3 c4 c5#### 1 2.988510 4.395902 2.077631 4.236894 4.617688## 2 2.556360 6.275348 2.524849 6.368483 5.478740## 3 3.464516 3.914627 2.730068 9.565649 6.016123## 4 4.233486 3.292088 3.133568 7.517309 4.772395## 5 3.935840 2.941547 3.242078 6.464048 3.599745## 6 3.835619 4.947859 3.335349 4.378370 7.240240
Eksempel 3
# Sort by c3(descending) and c4(acending)df <-data_frame[order(-data_frame$c3, data_frame$c4),]head(df)
Produktion:
# A tibble: 6 x 5## c1 c2 c3 c4 c5#### 1 4.339178 4.450214 8.087243 4.5010140 8.410225## 2 3.959420 8.105406 7.736312 7.1168936 5.431565## 3 3.339023 3.298088 7.494285 5.9303153 7.035912## 4 3.397036 5.382794 7.092722 0.7163620 5.620098## 5 6.653446 4.733315 6.520536 0.9016707 4.513410## 6 4.558559 4.712609 6.380086 6.0562703 5.044277