R dataramme: Sådan oprettes, tilføjes, vælges & Delmængde

Indholdsfortegnelse:

Anonim

Hvad er en dataramme?

En dataramme er en liste over vektorer, der har samme længde. En matrix indeholder kun én datatype, mens en dataramme accepterer forskellige datatyper (numerisk, tegn, faktor osv.).

I denne vejledning lærer du-

  • Hvad er en dataramme?
  • Sådan oprettes en dataramme
  • Føj en kolonne til datarammen
  • Vælg en kolonne i en dataramme
  • Delsæt en dataramme

Sådan oprettes en dataramme

Vi kan oprette en dataramme i R ved at overføre variablen a, b, c, d til data.frame () -funktionen. Vi kan R oprette dataramme og navngive kolonnerne med navn () og blot angive navnet på variablerne.

data.frame(df, stringsAsFactors = TRUE)

Argumenter :

  • df : Det kan være en matrix, der skal konverteres som en dataramme eller en samling af variabler, der skal tilsluttes
  • stringsAsFactors : Konverter streng til faktor som standard

Vi kan oprette en dataramme i R til vores første datasæt ved at kombinere fire variabler af samme længde.

# Create a, b, c, d variablesa <- c(10,20,30,40)b <- c('book', 'pen', 'textbook', 'pencil_case')c <- c(TRUE,FALSE,TRUE,FALSE)d <- c(2.5, 8, 10, 7)# Join the variables to create a data framedf <- data.frame(a,b,c,d)df

Produktion:

## a b c d## 1 1 book TRUE 2.5## 2 2 pen TRUE 8.0## 3 3 textbook TRUE 10.0## 4 4 pencil_case FALSE 7.0

Vi kan se kolonneoverskrifterne har samme navn som variablerne. Vi kan ændre kolonnenavn i R med funktionsnavne (). Tjek eksemplet R Opret dataframe nedenfor:

# Name the data framenames(df) <- c('ID', 'items', 'store', 'price')df

Produktion:

## ID items store price## 1 10 book TRUE 2.5## 2 20 pen FALSE 8.0## 3 30 textbook TRUE 10.0## 4 40 pencil_case FALSE 7.0
# Print the structurestr(df)

Produktion:

## 'data.frame': 4 obs. of 4 variables:## $ ID : num 10 20 30 40## $ items: Factor w/ 4 levels "book","pen","pencil_case",… : 1 2 4 3## $ store: logi TRUE FALSE TRUE FALSE## $ price: num 2.5 8 10 7

Dataramme returnerer som standard strengvariabler som en faktor.

Skær dataramme

Det er muligt at udskære værdier for en dataramme. Vi vælger de rækker og kolonner, der skal returneres i parentes foran navnet på datarammen.

En dataramme består af rækker og kolonner, df [A, B]. A repræsenterer rækkerne og B kolonnerne. Vi kan skære enten ved at specificere rækkerne og / eller kolonnerne.

Fra billede 1 repræsenterer den venstre del rækkerne, og den højre del er søjlerne . Bemærk, at symbolet: betyder at . For eksempel har 1: 3 til hensigt at vælge værdier fra 1 til 3.

I nedenstående diagram viser vi, hvordan du får adgang til forskellige valg af datarammen:

  • Den gule pil vælger række 1 i kolonne 2
  • Den grønne pil vælger række 1 til 2
  • Den røde pil vælger kolonne 1
  • Den blå pil vælger række 1 til 3 og kolonne 3 til 4

Bemærk, at hvis vi lader den venstre del være tom, vælger R alle rækkerne . Ved analogi, hvis vi lader den rigtige del være tom, vælger R alle kolonnerne .

Vi kan køre koden i konsollen:

## Select row 1 in column 2df[1,2]

Produktion:

## [1] book## Levels: book pen pencil_case textbook
## Select Rows 1 to 2df[1:2,]

Produktion:

## ID items store price## 1 10 book TRUE 2.5## 2 20 pen FALSE 8.0
## Select Columns 1df[,1]

Produktion:

## [1] 10 20 30 40
## Select Rows 1 to 3 and columns 3 to 4df[1:3, 3:4]

Produktion:

## store price## 1 TRUE 2.5## 2 FALSE 8.0## 3 TRUE 10.0

Det er også muligt at vælge kolonnerne med deres navne. For eksempel udtrækker koden nedenfor to kolonner: ID og butik.

# Slice with columns namedf[, c('ID', 'store')]

Produktion:

## ID store## 1 10 TRUE## 2 20 FALSE## 3 30 TRUE## 4 40 FALSE

Føj en kolonne til datarammen

Du kan også føje en kolonne til en dataramme. Du skal bruge symbolet $ for at tilføje dataframe R-variablen og tilføje en kolonne til en dataframe i R.

# Create a new vectorquantity <- c(10, 35, 40, 5)# Add `quantity` to the `df` data framedf$quantity <- quantitydf

Produktion:

## ID items store price quantity## 1 10 book TRUE 2.5 10## 2 20 pen FALSE 8.0 35## 3 30 textbook TRUE 10.0 40## 4 40 pencil_case FALSE 7.0 5

Bemærk: Antallet af elementer i vektoren skal være lig med antallet af elementer i datarammen. Udførelse af følgende erklæring for at tilføje kolonne til dataramme R

quantity <- c(10, 35, 40)# Add `quantity` to the `df` data framedf$quantity <- quantity

Giver fejl:

Error in `$<-.data.frame`(`*tmp*`, quantity, value = c(10, 35, 40))replacement has 3 rows, data has 4 

Vælg en kolonne i en dataramme

Nogle gange er vi nødt til at gemme en kolonne i en dataramme til fremtidig brug eller udføre operation på en kolonne. Vi kan bruge $ -tegnet til at vælge kolonnen fra en dataramme.

# Select the column IDdf$ID

Produktion:

## [1] 1 2 3 4

Delsæt en dataramme

I det forrige afsnit valgte vi en hel kolonne uden betingelse. Det er muligt at delmængde baseret på, om en bestemt tilstand var sand eller ej.

Vi bruger subset () -funktionen.

subset(x, condition)arguments:- x: data frame used to perform the subset- condition: define the conditional statement

Vi vil kun returnere varerne med en pris over 10, vi kan gøre:

# Select price above 5subset(df, subset = price > 5)

Produktion:

ID items store price2 20 pen FALSE 83 30 textbook TRUE 104 40 pencil_case FALSE 7