Não reconhecimento do data.frame como numérico

Caríssimos(as) utilizadores(as) do R, Estou em outro nível de problema. Quero converter FPKM em log2CPM. Para tanto, fiz o seguinte: dados<-read.csv("/home/Genes interesse NePCa.csv") head(dados) class(dados) *[1] "data.frame"* geneLength <- rowMeans(dados) *Error in rowMeans(dados) : 'x' must be numeric* dadoslog2cpm <- convertCounts(dados, unit = "cpm", log = TRUE, normalize = "tmm") *Error: countsMatrix must be a numeric matrix or dataframe of N genes x M Samples. All columns must be numeric.* Não entendo o que possa estar errado. A tabela de dados está em anexo. Vocês podem me ajudar, por favor? Obrigada, Michele -- ------------------------------------------------------------------------ *Dra. Michele Claire Breton* Researcher in Bioinformatics PhD in Cellular and Molecular Biology CICS - Health Sciences Research Center Faculty of Health Sciences University of Beira Interior Covilhã - Castelo Branco - Portugal

O objeto do tipo matrix em R somente aceita variáveis do mesmo tipo. Como você está lendo o CSV que contém caracteres (nomes dos genes) e valores numéricos (expressão), o R converte tudo para caracter. Você precisa colocar a coluna do nome dos genes no rownames, excluir a coluna de nome de genes e converter tudo em uma matriz numérica. Assim você poderá trabalhar com ela daniel Em qui., 4 de ago. de 2022 às 10:52, Michele Claire Breton por (R-br) < r-br@listas.c3sl.ufpr.br> escreveu:
Caríssimos(as) utilizadores(as) do R,
Estou em outro nível de problema. Quero converter FPKM em log2CPM. Para tanto, fiz o seguinte:
dados<-read.csv("/home/Genes interesse NePCa.csv") head(dados) class(dados)
*[1] "data.frame"*
geneLength <- rowMeans(dados) *Error in rowMeans(dados) : 'x' must be numeric*
dadoslog2cpm <- convertCounts(dados, unit = "cpm", log = TRUE, normalize = "tmm") *Error: countsMatrix must be a numeric matrix or dataframe of N genes x M Samples. All columns must be numeric.*
Não entendo o que possa estar errado. A tabela de dados está em anexo. Vocês podem me ajudar, por favor?
Obrigada,
Michele -- ------------------------------------------------------------------------ *Dra. Michele Claire Breton* Researcher in Bioinformatics PhD in Cellular and Molecular Biology CICS - Health Sciences Research Center Faculty of Health Sciences University of Beira Interior Covilhã - Castelo Branco - Portugal _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Daniel Tiezzi, MD, PhD Associate Professor Breast Disease and Gynecologic Oncology Division Department of Gynecology and Obstetrics University of São Paulo Brazil

Algumas sugestões dadas aqui são interessantes, *mas* a importação dos seus dados indica que tens as linhas 10 e 162 com mesmo nome de gene "AR". Isso perturba a importação da 1ª coluna como nome de linhas (*rownames*), tanto se fosse usada o parâmetro row.names=1 na chamada a read.csv() ou se a vírgula inicial da primeira linha do arq CSV fosse retirada... HTH On Thu, Aug 4, 2022 at 10:52 AM Michele Claire Breton por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Caríssimos(as) utilizadores(as) do R,
Estou em outro nível de problema. Quero converter FPKM em log2CPM. Para tanto, fiz o seguinte:
dados<-read.csv("/home/Genes interesse NePCa.csv") head(dados) class(dados)
*[1] "data.frame"*
geneLength <- rowMeans(dados) *Error in rowMeans(dados) : 'x' must be numeric*
dadoslog2cpm <- convertCounts(dados, unit = "cpm", log = TRUE, normalize = "tmm") *Error: countsMatrix must be a numeric matrix or dataframe of N genes x M Samples. All columns must be numeric.*
Não entendo o que possa estar errado. A tabela de dados está em anexo. Vocês podem me ajudar, por favor?
Obrigada,
Michele -- ------------------------------------------------------------------------ *Dra. Michele Claire Breton* Researcher in Bioinformatics PhD in Cellular and Molecular Biology CICS - Health Sciences Research Center Faculty of Health Sciences University of Beira Interior Covilhã - Castelo Branco - Portugal _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Se existirem mais de uma linha referente ao mesmo gene é preciso agregar os valores de alguma forma. Usar a média ou o valor máximo. Precisa ver o que foi utilizado para a contagem. Geralmente os algoritmos de contagem utilizam a nomenclatura do Ensembl que vem dos arguis GTF. Neste caos, foi feito a conversão para o HUGO symbol. Isso acontece mesmo. Daniel
On 4 Aug 2022, at 21:55, Cesar Rabak por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:
Algumas sugestões dadas aqui são interessantes, mas a importação dos seus dados indica que tens as linhas 10 e 162 com mesmo nome de gene "AR".
Isso perturba a importação da 1ª coluna como nome de linhas (rownames), tanto se fosse usada o parâmetro row.names=1 na chamada a read.csv() ou se a vírgula inicial da primeira linha do arq CSV fosse retirada...
HTH
On Thu, Aug 4, 2022 at 10:52 AM Michele Claire Breton por (R-br) <r-br@listas.c3sl.ufpr.br <mailto:r-br@listas.c3sl.ufpr.br>> wrote: Caríssimos(as) utilizadores(as) do R,
Estou em outro nível de problema. Quero converter FPKM em log2CPM. Para tanto, fiz o seguinte:
dados<-read.csv("/home/Genes interesse NePCa.csv") head(dados) class(dados)
[1] "data.frame"
geneLength <- rowMeans(dados) Error in rowMeans(dados) : 'x' must be numeric
dadoslog2cpm <- convertCounts(dados, unit = "cpm", log = TRUE, normalize = "tmm") Error: countsMatrix must be a numeric matrix or dataframe of N genes x M Samples. All columns must be numeric.
Não entendo o que possa estar errado. A tabela de dados está em anexo. Vocês podem me ajudar, por favor?
Obrigada,
Michele -- ------------------------------------------------------------------------ Dra. Michele Claire Breton Researcher in Bioinformatics PhD in Cellular and Molecular Biology CICS - Health Sciences Research Center Faculty of Health Sciences University of Beira Interior Covilhã - Castelo Branco - Portugal _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br <mailto:R-br@listas.c3sl.ufpr.br> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br <https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia <http://www.leg.ufpr.br/r-br-guia>) e forneça código mínimo reproduzível. _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Arquivos GTF, eu quis dizer Daniel
On 4 Aug 2022, at 21:55, Cesar Rabak por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:
Algumas sugestões dadas aqui são interessantes, mas a importação dos seus dados indica que tens as linhas 10 e 162 com mesmo nome de gene "AR".
Isso perturba a importação da 1ª coluna como nome de linhas (rownames), tanto se fosse usada o parâmetro row.names=1 na chamada a read.csv() ou se a vírgula inicial da primeira linha do arq CSV fosse retirada...
HTH
On Thu, Aug 4, 2022 at 10:52 AM Michele Claire Breton por (R-br) <r-br@listas.c3sl.ufpr.br <mailto:r-br@listas.c3sl.ufpr.br>> wrote: Caríssimos(as) utilizadores(as) do R,
Estou em outro nível de problema. Quero converter FPKM em log2CPM. Para tanto, fiz o seguinte:
dados<-read.csv("/home/Genes interesse NePCa.csv") head(dados) class(dados)
[1] "data.frame"
geneLength <- rowMeans(dados) Error in rowMeans(dados) : 'x' must be numeric
dadoslog2cpm <- convertCounts(dados, unit = "cpm", log = TRUE, normalize = "tmm") Error: countsMatrix must be a numeric matrix or dataframe of N genes x M Samples. All columns must be numeric.
Não entendo o que possa estar errado. A tabela de dados está em anexo. Vocês podem me ajudar, por favor?
Obrigada,
Michele -- ------------------------------------------------------------------------ Dra. Michele Claire Breton Researcher in Bioinformatics PhD in Cellular and Molecular Biology CICS - Health Sciences Research Center Faculty of Health Sciences University of Beira Interior Covilhã - Castelo Branco - Portugal _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br <mailto:R-br@listas.c3sl.ufpr.br> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br <https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia <http://www.leg.ufpr.br/r-br-guia>) e forneça código mínimo reproduzível. _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

genes <- read.csv('~/Downloads/NePCa.csv') genes[1:4,1:4] g_max <- aggregate(. ~X, data = genes, max) g_max[1:4,1:4] rownames(g_max) <- g_max$X gene_matrix <- as.matrix(g_max[,-1]) is.numeric(gene_matrix) gene_matrix[1:4,1:4] Daniel
On 4 Aug 2022, at 21:55, Cesar Rabak por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:
Algumas sugestões dadas aqui são interessantes, mas a importação dos seus dados indica que tens as linhas 10 e 162 com mesmo nome de gene "AR".
Isso perturba a importação da 1ª coluna como nome de linhas (rownames), tanto se fosse usada o parâmetro row.names=1 na chamada a read.csv() ou se a vírgula inicial da primeira linha do arq CSV fosse retirada...
HTH
On Thu, Aug 4, 2022 at 10:52 AM Michele Claire Breton por (R-br) <r-br@listas.c3sl.ufpr.br <mailto:r-br@listas.c3sl.ufpr.br>> wrote: Caríssimos(as) utilizadores(as) do R,
Estou em outro nível de problema. Quero converter FPKM em log2CPM. Para tanto, fiz o seguinte:
dados<-read.csv("/home/Genes interesse NePCa.csv") head(dados) class(dados)
[1] "data.frame"
geneLength <- rowMeans(dados) Error in rowMeans(dados) : 'x' must be numeric
dadoslog2cpm <- convertCounts(dados, unit = "cpm", log = TRUE, normalize = "tmm") Error: countsMatrix must be a numeric matrix or dataframe of N genes x M Samples. All columns must be numeric.
Não entendo o que possa estar errado. A tabela de dados está em anexo. Vocês podem me ajudar, por favor?
Obrigada,
Michele -- ------------------------------------------------------------------------ Dra. Michele Claire Breton Researcher in Bioinformatics PhD in Cellular and Molecular Biology CICS - Health Sciences Research Center Faculty of Health Sciences University of Beira Interior Covilhã - Castelo Branco - Portugal _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br <mailto:R-br@listas.c3sl.ufpr.br> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br <https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia <http://www.leg.ufpr.br/r-br-guia>) e forneça código mínimo reproduzível. _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Muito bom dia Daniel Tiezzi e Cesar Rabak, Agradeço imensamente a ajuda e vocês. Ao Cesar, agradeço por ter observado a duplicidade dos valores de expressão do gene AR. É aquele velho ditado: "a pressa é inimiga da perfeição". Eu tenho 3 vias metabólicas de genes representados nesta tabela, e o gene AR participa de duas delas. Não tinha reparado nisto. Ao Daniel, agradeço as linhas de comando. Vou estudá-las para tentar perceber e assimilar este conhecimento. Já rodei aqui nos meus dados e funcionou perfeitamente. Tenham um excelente fim de semana! Michele Daniel Guimarães Tiezzi por (R-br) <r-br@listas.c3sl.ufpr.br> escreveu no dia sexta, 5/08/2022 à(s) 02:11:
genes <- read.csv('~/Downloads/NePCa.csv')
genes[1:4,1:4]
g_max <- aggregate(. ~X, data = genes, max) g_max[1:4,1:4]
rownames(g_max) <- g_max$X
gene_matrix <- as.matrix(g_max[,-1]) is.numeric(gene_matrix) gene_matrix[1:4,1:4]
Daniel
On 4 Aug 2022, at 21:55, Cesar Rabak por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:
Algumas sugestões dadas aqui são interessantes, *mas* a importação dos seus dados indica que tens as linhas 10 e 162 com mesmo nome de gene "AR".
Isso perturba a importação da 1ª coluna como nome de linhas (*rownames*), tanto se fosse usada o parâmetro row.names=1 na chamada a read.csv() ou se a vírgula inicial da primeira linha do arq CSV fosse retirada...
HTH
On Thu, Aug 4, 2022 at 10:52 AM Michele Claire Breton por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Caríssimos(as) utilizadores(as) do R,
Estou em outro nível de problema. Quero converter FPKM em log2CPM. Para tanto, fiz o seguinte:
dados<-read.csv("/home/Genes interesse NePCa.csv") head(dados) class(dados)
*[1] "data.frame"*
geneLength <- rowMeans(dados) *Error in rowMeans(dados) : 'x' must be numeric*
dadoslog2cpm <- convertCounts(dados, unit = "cpm", log = TRUE, normalize = "tmm") *Error: countsMatrix must be a numeric matrix or dataframe of N genes x M Samples. All columns must be numeric.*
Não entendo o que possa estar errado. A tabela de dados está em anexo. Vocês podem me ajudar, por favor?
Obrigada,
Michele -- ------------------------------------------------------------------------ *Dra. Michele Claire Breton* Researcher in Bioinformatics PhD in Cellular and Molecular Biology CICS - Health Sciences Research Center Faculty of Health Sciences University of Beira Interior Covilhã - Castelo Branco - Portugal _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (3)
-
Cesar Rabak
-
Daniel Guimarães Tiezzi
-
Michele Claire Breton