R语言-数据抽取(二)
1、3)记录抽取记录抽取函数: subset (x, condition)x:需要处理的数据condition:过滤条件返回值: data.frame案例:items <- read.table('sales.csv', sep="|", header=TRUE, fileEncoding='utf-8', stringsAsFactors=FALSE)sub_items <- subset(items, comments>10000) ---提取 comments大于10000的记录
2、4)随机抽皱诣愚继样随机抽样函数: sample (length, size, replace = FASLE)length:样本长度size:抽样行数replace:是否可回收样本,瘫问钾酗默认为不放回,即FALSE返回值:行数的位置值数组案例:items <- read.csv ('sales.csv') ---导入数据rows <- nrow (items) ---数据记录行,即抽样行数lengthindexes <- sample (rows, 3, replace =TRUE) ---使用 sample函数,在 rows(10行)抽取3个数据(抽取的是数据行位置行号)data1 <- items [indexes, ] ---提取出 items表中的随机抽取出的indexes行号对应数据
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:42
阅读量:72
阅读量:74
阅读量:34
阅读量:93