[R-br] Procurando números no nome

Daniel Marcelino dmarcelino em live.com
Sábado Abril 13 01:54:04 BRT 2013


Lê-se na verdade a negação do que foi enviado, então:
subset(dados,select=x, w != "-1")


2013/4/13 Daniel Marcelino <dmarcelino em live.com>

> Homem de sessenta anos é um bom nome. Tenho minhas dúvidas se isso é mesmo
> um erro. Em todo o caso, você precisa dizer qual é o tipo de saída que você
> precisa, pois a solução dada pelo Rodrigo mostra onde estão os problemas.
> No meu exemplo também, você precisaria pedir para listar as observações em
> que não tiver "-1", algo como isso:
> # seguindo meu último exemplo:
> subset(dados,select=x, w == "-1")
>
>
>
> 2013/4/12 Fátima Lima Paula <fatima.lima.paula em gmail.com>
>
>> Daniel, é um banco de dados do SUS e pode haver erro de digitação. Na
>> verdade, é só para certificar-se de que o banco está o mais 'limpo'
>> possível.
>> Com o comando anterior, achei em nome "homem de 60 anos". Agora pensei em
>> testar se há erros de digitação, entende?
>>
>>
>>
>> Em 12 de abril de 2013 20:22, Daniel Marcelino <dmarcelino em live.com>escreveu:
>>
>> Fátima, porque há números entre os caracteres? Você acha que são erros de
>>> digitação ou erros de leitura dos dados. As vezes pode estar ocorrendo erro
>>> na leitura da codificação, por exemplo. dados codificados em latin1 lidos
>>> em ambiente UTF8, etc. Talvez valesse a pena verificar isso antes, pois
>>> poderia te poupar bastante dor de cabeça.
>>>
>>>
>>>
>>> Daniel
>>>
>>>
>>> 2013/4/12 Fátima Lima Paula <fatima.lima.paula em gmail.com>
>>>
>>>> Na verdade a outra forma resolveu, mas o que eu queria mesmo é
>>>> verificar se há números entre os nomes. Do tipo Pa8la, Jos3 etc
>>>> Tem uma forma de fazer?
>>>> Se precisar envio um script para teste.
>>>>
>>>>
>>>>
>>>> Em 12 de abril de 2013 16:58, Daniel Marcelino <dmarcelino em live.com>escreveu:
>>>>
>>>> Uma solução possível :
>>>>>
>>>>> x <-c('Joao 01', 'Maria 02', 'Gigante', 'Pé de 03 feijao 04')  # vetor
>>>>> com números
>>>>> #Voce deve ter um data.frame, então vamos converter isso em um:
>>>>> dados <- data.frame(x)
>>>>> # Vamos pedir para identificar a posição dos números m em uma coluna w:
>>>>> dados$w <- gregexpr("[0-9]",dados$x)
>>>>>
>>>>> > dados
>>>>>                    x            w
>>>>> 1            Joao 01         6, 7
>>>>> 2           Maria 02         7, 8
>>>>> 3            Gigante           -1
>>>>> 4 Pé de 03 feijao 04 7, 8, 17, 18
>>>>>
>>>>> ***Onde tiver "-1" é porque não há números. Por  outro lado, onde
>>>>> aparecer algum número diferente de -1 é porque há números. O número que
>>>>> aparecer é a posição do caracter na string.
>>>>>
>>>>> Daniel
>>>>>
>>>>>
>>>>>
>>>>> On Fri, Apr 12, 2013 at 3:12 PM, Fátima Lima Paula <
>>>>> fatima.lima.paula em gmail.com> wrote:
>>>>>
>>>>>> Parece que funciona, mas o problema é que tenho um banco com 302163
>>>>>> linhas. Como faço para saber os nomes que apresentam números?
>>>>>>
>>>>>>
>>>>>> Em 12 de abril de 2013 15:21, Rodrigo Coster <rcoster em gmail.com>escreveu:
>>>>>>
>>>>>> dados <- c('Joao 01', 'Maria 02', 'Gigante', 'Pé de 03 feijao 04')
>>>>>>> gsub('[^0-9]', '', dados)
>>>>>>> as.integer(gsub('[^0-9]', '', dados))
>>>>>>>
>>>>>>>
>>>>>>>
>>>>>>> 2013/4/12 Fátima Lima Paula <fatima.lima.paula em gmail.com>
>>>>>>>
>>>>>>>> Olá pessoal.
>>>>>>>> Como faço para buscar números em uma coluna com nomes?
>>>>>>>> Obrigada
>>>>>>>> Fátima
>>>>>>>>
>>>>>>>> _______________________________________________
>>>>>>>> R-br mailing list
>>>>>>>> R-br em listas.c3sl.ufpr.br
>>>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
>>>>>>>> forneça código mínimo reproduzível.
>>>>>>>>
>>>>>>>
>>>>>>>
>>>>>>> _______________________________________________
>>>>>>> R-br mailing list
>>>>>>> R-br em listas.c3sl.ufpr.br
>>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
>>>>>>> forneça código mínimo reproduzível.
>>>>>>>
>>>>>>
>>>>>>
>>>>>> _______________________________________________
>>>>>> R-br mailing list
>>>>>> R-br em listas.c3sl.ufpr.br
>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>>>> código mínimo reproduzível.
>>>>>>
>>>>>
>>>>>
>>>>>
>>>>> --
>>>>> \begin{signature}
>>>>> Daniel Marcelino
>>>>>dm.silva em umontreal.ca
>>>>> ☎ (514) 343 6111 #3799
>>>>> Skype: d.marcelino
>>>>> ✎ 3200 Jean Brillant,  Office C5071
>>>>> Montreal, QC; H3T 1N8
>>>>> Canada
>>>>> \end{signature}
>>>>>
>>>>> "Small steps toward a much better world"
>>>>>
>>>>> _______________________________________________
>>>>> R-br mailing list
>>>>> R-br em listas.c3sl.ufpr.br
>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>>> código mínimo reproduzível.
>>>>>
>>>>
>>>>
>>>> _______________________________________________
>>>> R-br mailing list
>>>> R-br em listas.c3sl.ufpr.br
>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>> código mínimo reproduzível.
>>>>
>>>
>>>
>>>
>>> --
>>> \begin{signature}
>>> Daniel Marcelino
>>>dm.silva em umontreal.ca
>>> ☎ (514) 343 6111 #3799
>>> Skype: d.marcelino
>>> ✎ 3200 Jean Brillant,  Office C5071
>>> Montreal, QC; H3T 1N8
>>> Canada
>>> \end{signature}
>>>
>>> "Small steps toward a much better world"
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
>
> --
> \begin{signature}
> Daniel Marcelino
>dm.silva em umontreal.ca
> ☎ (514) 343 6111 #3799
> Skype: d.marcelino
> ✎ 3200 Jean Brillant,  Office C5071
> Montreal, QC; H3T 1N8
> Canada
> \end{signature}
>
> "Small steps toward a much better world"
>



-- 
\begin{signature}
Daniel Marcelino
☁ dm.silva em umontreal.ca
☎ (514) 343 6111 #3799
Skype: d.marcelino
✎ 3200 Jean Brillant,  Office C5071
Montreal, QC; H3T 1N8
Canada
\end{signature}

"Small steps toward a much better world"
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20130413/60eacc60/attachment.html>


Mais detalhes sobre a lista de discussão R-br