read.csv() funkce v jazyce R se používá ke čtení souborů s hodnotami oddělenými čárkami. Importuje data ve tvaru a datový rámec.
Syntax: read.csv(soubor, hlavička, sep, dec) Parametry: soubor: cesta k souboru obsahujícímu data, která mají být importována do R. záhlaví: logická hodnota. Pokud je PRAVDA, read.csv() předpokládá, že váš soubor má řádek záhlaví, takže řádek 1 je název každého sloupce. Pokud tomu tak není, můžete přidat hlavičku argumentu = FALSE. září: znak oddělovače polí pro: znak použitý v souboru pro desetinné čárky.
Proměnná data bude obsahovat obsah souboru CSV, jakmile použijeme funkci read.csv(), i když můžete použít jinou proměnnou.
Funkce read.csv() také přijímá řadu volitelných argumentů, které můžeme použít k úpravě procedury importu. můžeme se rozhodnout považovat první řádek za názvy sloupců, vybrat znak oddělovače a další. Další informace o těchto možnostech naleznete v dokumentaci read.csv().
Zajistěte, aby byl soubor ve správném formátu CSV se správnými oddělovači a znaky uvozovek, zadáním metody read.csv() správné cesty k souboru nebo adresy URL.
Příklad 1: Čtení souboru ze stejné složky
R
# R program to read a csv file> # Get content into a data frame> data <->read.csv>(>'CSVFileExample.csv'>,> >header =>FALSE>, sep =>' '>)> > # Printing content of Text File> print>(data)> |
>
>
Výstup:
V1 V2 V3 1 100 AB ab 2 200 CD cd 3 300 EF ef 4 400 GH gh 5 500 IJ ij>
Příklad 2: Čtení souborů z různých adresářů
R
# Simple R program to read csv file> x <->read.csv>(>' D://Datas//myfile.csv '>)> > # print x> print>(x)> |
>
>
Výstup:
X V1 V2 V3 1 1 100 a1 b1 2 2 200 a2 b2 3 3 300 a3 b3>
Příklad 3: Čtení souboru CSV s jiným oddělovačem
R
data <->read.csv>(>'path/to/your/file.csv'>, sep =>';'>)> |
>
>
Možnost sep je nastavena na ; v tomto příkladu to znamená, že soubor CSV používá jako oddělovač středník (;), nikoli standardní čárku (,).
Příklad 4: Nakládání s prvním řádkem jako s názvy sloupců
R
data <->read.csv>(>'path/to/your/file.csv'>, header =>TRUE>)> |
>
>
První řádek souboru CSV je ve výchozím nastavení zpracován jako názvy sloupců, protože argument záhlaví je nastaven na hodnotu TRUE. Pokud první řádek našeho CSV souboru neobsahuje názvy sloupců, můžeme data importovat bez nich nastavením záhlaví = FALSE.
Příklad 4: Určení tříd sloupců
R
data <->read.csv>(>'path/to/your/file.csv'>,> >colClasses =>c>(>'character'>,>'numeric'>,>'integer'>))> |
azurové předplatné
>
>
Třídy pro každý sloupec v souboru CSV můžeme definovat pomocí volby colClasses. Pro účely této ilustrace bude první sloupec interpretován jako znak, druhý jako číslo a třetí jako celé číslo. Když chceme spravovat datové typy jednotlivých sloupců.
Příklad 5: Přeskakování řádků a zadání chybějících hodnot
R
data <->read.csv>(>'path/to/your/file.csv'>, skip = 3, na.strings =>c>(>''>,>'NA'>))> |
>
>
Pomocí argumentu skip můžeme přeskočit určitý počet řádků na začátku souboru CSV. První tři řádky na tomto obrázku budou vynechány. Hodnoty, které by měly být považovány za chybějící hodnoty (NA), jsou specifikovány v an. argument řetězce. Řetězec NA a prázdné řetězce jsou v této situaci rozpoznány jako chybějící hodnoty.