use apenas:

GBS = read.csv('tpg12-06-0006-dataset-s2', header=TRUE, stringsAsFactors=FALSE)

a razao deixo como exercicio p vc...

b


Em 20 de novembro de 2013 11:37, Giselle Davi <giselle_davi@yahoo.com.br> escreveu:
Prezados,

estou tendo problemas em rodar a análise conforme manual do R: Genomic prediction with rrBLUP 4
Jeffrey Endelman,June 15, 2013 . Ao rodar a análise igual ao solicitado no manual a dim (X) resulta em NULL . Vcs poderiam me ajudar a encontrar a dimensão correta desta matriz ??

Aqui está o local indicado, conforme manual, de onde está a planilha de dados: https://www.crops.org/publications/tpg/supplements/5/tpg12-06-0006-dataset-s2.gz

OBS.: O nome do arquivo está diferente, pois na hora de baixar do mesmo site, o arquivo passa a ter o nome conforme indicado na rotina abaixo, porém é o mesmo arquivo com os mesmos dados.

Abaixo segue a rotina:
GBS <- read.csv("C:/GS_tutorial/DatasetS2_29SAWSN_gbs.csv", sep=";", dec=",",header=TRUE)
parse.GBS <- function(x) {
   unique.x <- unique(x)
   alleles <- setdiff(unique.x,union("H","N"))
   y <- rep(0,length(x))
   y[which(x==alleles[1])] <- -1
   y[which(x==alleles[2])] <- 1
   y[which(x=="N")] <- NA
   return(y)
}
X <- apply(GBS[,-c(1:3)],1,parse.GBS)
dim(X)
frac.missing <- apply(X,2,function(z){length(which(is.na(z)))/length(z)})
length(which(frac.missing<0.5))
hist(frac.missing)


Desde já agradeço. Att,

Giselle




_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.