在R中提取数据以进行智能分析
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-09-09
在R中处理数据的不同方法R可以读取以下数据:
1、电子表格
2、Excel表格
3、资料库
4、图片
5、文字档
6、许多其他特殊格式
将数据存入R
无论数据是本地数据还是Web上的可用数据,使用R编程,您都可以成功导入不同格式的数据。
从文件读取数据
理想情况下,数据在系统内存储的文件上可用。读取或写入此数据所需要做的只是标识存储文件的当前目录。
设置目录需要做的重要的事情之一就是建立工作目录
要标识目录(文件夹),请使用命令getwd()在linux pc上,要设置保存数据文件的目录,请使用命令setwd(“ path”),其中path的目录带有数据文件所在的子目录。例如,如果数据在文件temp.txt中,并且文件在文件夹/ home / test / example /中。
读取文字档文本文件中包含的数据可以使用scan命令在R会话中读取
切记在扫描命令中使用选项what =””,这表示输入将是字符数据类型。对于此会话,我创建了textsample.txt文件,该文件可以在R会话中读取。
从文件读取数据的命令
众所周知,某些常用的数据文件是csv和.xls格式的文件,其中csv是带有逗号分隔值的文件,而xls是excel文件的文件扩展名。
直接从Web提取数据
可以直接从Web读取数据。Web链接或URL中可用的数据将直接通过内存中的R获取。