[R-br] Procurando números no nome

Fátima Lima Paula fatima.lima.paula em gmail.com
Sexta Abril 12 20:57:05 BRT 2013


Daniel, é um banco de dados do SUS e pode haver erro de digitação. Na
verdade, é só para certificar-se de que o banco está o mais 'limpo'
possível.
Com o comando anterior, achei em nome "homem de 60 anos". Agora pensei em
testar se há erros de digitação, entende?



Em 12 de abril de 2013 20:22, Daniel Marcelino <dmarcelino em live.com>escreveu:

> Fátima, porque há números entre os caracteres? Você acha que são erros de
> digitação ou erros de leitura dos dados. As vezes pode estar ocorrendo erro
> na leitura da codificação, por exemplo. dados codificados em latin1 lidos
> em ambiente UTF8, etc. Talvez valesse a pena verificar isso antes, pois
> poderia te poupar bastante dor de cabeça.
>
>
>
> Daniel
>
>
> 2013/4/12 Fátima Lima Paula <fatima.lima.paula em gmail.com>
>
>> Na verdade a outra forma resolveu, mas o que eu queria mesmo é verificar
>> se há números entre os nomes. Do tipo Pa8la, Jos3 etc
>> Tem uma forma de fazer?
>> Se precisar envio um script para teste.
>>
>>
>>
>> Em 12 de abril de 2013 16:58, Daniel Marcelino <dmarcelino em live.com>escreveu:
>>
>> Uma solução possível :
>>>
>>> x <-c('Joao 01', 'Maria 02', 'Gigante', 'Pé de 03 feijao 04')  # vetor
>>> com números
>>> #Voce deve ter um data.frame, então vamos converter isso em um:
>>> dados <- data.frame(x)
>>> # Vamos pedir para identificar a posição dos números m em uma coluna w:
>>> dados$w <- gregexpr("[0-9]",dados$x)
>>>
>>> > dados
>>>                    x            w
>>> 1            Joao 01         6, 7
>>> 2           Maria 02         7, 8
>>> 3            Gigante           -1
>>> 4 Pé de 03 feijao 04 7, 8, 17, 18
>>>
>>> ***Onde tiver "-1" é porque não há números. Por  outro lado, onde
>>> aparecer algum número diferente de -1 é porque há números. O número que
>>> aparecer é a posição do caracter na string.
>>>
>>> Daniel
>>>
>>>
>>>
>>> On Fri, Apr 12, 2013 at 3:12 PM, Fátima Lima Paula <
>>> fatima.lima.paula em gmail.com> wrote:
>>>
>>>> Parece que funciona, mas o problema é que tenho um banco com 302163
>>>> linhas. Como faço para saber os nomes que apresentam números?
>>>>
>>>>
>>>> Em 12 de abril de 2013 15:21, Rodrigo Coster <rcoster em gmail.com>escreveu:
>>>>
>>>> dados <- c('Joao 01', 'Maria 02', 'Gigante', 'Pé de 03 feijao 04')
>>>>> gsub('[^0-9]', '', dados)
>>>>> as.integer(gsub('[^0-9]', '', dados))
>>>>>
>>>>>
>>>>>
>>>>> 2013/4/12 Fátima Lima Paula <fatima.lima.paula em gmail.com>
>>>>>
>>>>>> Olá pessoal.
>>>>>> Como faço para buscar números em uma coluna com nomes?
>>>>>> Obrigada
>>>>>> Fátima
>>>>>>
>>>>>> _______________________________________________
>>>>>> R-br mailing list
>>>>>> R-br em listas.c3sl.ufpr.br
>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>>>> código mínimo reproduzível.
>>>>>>
>>>>>
>>>>>
>>>>> _______________________________________________
>>>>> R-br mailing list
>>>>> R-br em listas.c3sl.ufpr.br
>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>>> código mínimo reproduzível.
>>>>>
>>>>
>>>>
>>>> _______________________________________________
>>>> R-br mailing list
>>>> R-br em listas.c3sl.ufpr.br
>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>> código mínimo reproduzível.
>>>>
>>>
>>>
>>>
>>> --
>>> \begin{signature}
>>> Daniel Marcelino
>>>dm.silva em umontreal.ca
>>> ☎ (514) 343 6111 #3799
>>> Skype: d.marcelino
>>> ✎ 3200 Jean Brillant,  Office C5071
>>> Montreal, QC; H3T 1N8
>>> Canada
>>> \end{signature}
>>>
>>> "Small steps toward a much better world"
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
>
> --
> \begin{signature}
> Daniel Marcelino
>dm.silva em umontreal.ca
> ☎ (514) 343 6111 #3799
> Skype: d.marcelino
> ✎ 3200 Jean Brillant,  Office C5071
> Montreal, QC; H3T 1N8
> Canada
> \end{signature}
>
> "Small steps toward a much better world"
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20130412/ce20b797/attachment.html>


Mais detalhes sobre a lista de discussão R-br