[R-br] Duvida sobre a função query() do pacote seqinr

Augusto Ribas ribas.aca em gmail.com
Terça Maio 8 23:17:35 BRT 2012


Ola pessoal, eu estou tentando procurar e extrair algumas sequências de DNA
pelo R
Em um livro que estou lendo fui guiado até o pacote seqinr, ele tem uma
função chamada query() pra fazer isso.

A principio tudo parece bem simples e intuitivo.
Por exemplo, eu tenho interesse na sequência 16s rRNA de varias especies de
sapinhos.

Ai se procuro pra uma especie tenho:

> library(seqinr)
> s <- choosebank("genbank")
> query("SP","SP=Rhinella rubescens AND K=16S RIBOSOMAL RNA",s$socket)
> SP$nelem
[1] 1
> getName(SP)
[1] "GU907196.RR1"

Blz eu achei 1 sequência especifica pro que eu quero, e o nomezinho pra
acessar ela.

Procuro outra
> query("SP","SP=Leptodactylus syphax AND K=16S RIBOSOMAL RNA",s$socket)
> print(SP$nelem)
[1] 2
> print(getName(SP))
[1] "JF789923" "JF789924"

Blz, 2 sequencias,ai eu fui ao site do genbank, que é a base da dados da
uma olhada e estao la blz

So que muitas especies que procuro  o R para.
Por exemplo:
> query("SP","SP=Leptodactylus marmoratus AND K=16S RIBOSOMAL RNA",s$socket)

O R fica parado e tenho que fechar ele.
Eu não entendo o que esta dando errado, principalmente pq algumas especies
funcionam e outras não.
Essa especie em especifico num era pra achar nada, não achei registro dela
procurando pelo site do genbank.
Mas a hora que vou usar o R num vai.
Outro exemplo é "Leptodactylus syphax" que devia acha 2 sequencias mas ele
para também.

E a maior parte das especies num vai.
Eu uso windows 7 como SO. Estou com o R 2.15.0, internet residencial.

Alguem tem experiencia com isso? Sabe dizer o que esto fazendo de errado?
E alguem conhece alguma outra forma de fazer o mesmo tipo de busca usando o
R? O task view indica o Biocondutor que tem o pacote SRAdb que deve fazer a
mesma coisa, mas não consegui usar.

Eu vi que o livro que é de 2011 a função mudou a ordem dos argumentos, e
teve um update no pacote, mas não sei se estou fazendo algo errado, se
tenho que fazer mais alguma coisa. Os manuais que vi não tem um faq com
problemas comum e soluções.

Minha lista de especies caso alguem queria ver é:
lista.spp<-c("Rhinella rubescens", "Rhinella fernandezae", "Elosia
rustica",
"Crossodactylus gaudichaudii", "Leptodactylus pustulatus", "Leptodactylus
syphax",
"Dendropsophus cachimbo", "Leptodactylus marmoratus", "Physalaemus
soaresi",
"Hylodes nasus", "Scinax fuscomarginatus", "Leptodactylus petersii",
"Chiasmocleis capixaba", "Ceratophrys aurita", "Pleurodema diplolister",
"Cystignatus gigas", "Scinax trilineatus", "Elosis nasus", "Dryadophis
bifossatus"
)

Se alguem puder dar uma luz, não sei nem por onde começar a procurar pra
entender o que ta acontecendo.
Vou quebrando a cabeça por enquanto, Boa noite a todos.


-- 
Grato
Augusto C. A. Ribas

Site Pessoal: http://augustoribas.heliohost.org
Lattes: http://lattes.cnpq.br/7355685961127056
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20120508/d453c5ea/attachment.html>


Mais detalhes sobre a lista de discussão R-br