[R-br] Procurando números no nome
Daniel Marcelino
dmarcelino em live.com
Sábado Abril 13 01:52:50 BRT 2013
Homem de sessenta anos é um bom nome. Tenho minhas dúvidas se isso é mesmo
um erro. Em todo o caso, você precisa dizer qual é o tipo de saída que você
precisa, pois a solução dada pelo Rodrigo mostra onde estão os problemas.
No meu exemplo também, você precisaria pedir para listar as observações em
que não tiver "-1", algo como isso:
# seguindo meu último exemplo:
subset(dados,select=x, w == "-1")
2013/4/12 Fátima Lima Paula <fatima.lima.paula em gmail.com>
> Daniel, é um banco de dados do SUS e pode haver erro de digitação. Na
> verdade, é só para certificar-se de que o banco está o mais 'limpo'
> possível.
> Com o comando anterior, achei em nome "homem de 60 anos". Agora pensei em
> testar se há erros de digitação, entende?
>
>
>
> Em 12 de abril de 2013 20:22, Daniel Marcelino <dmarcelino em live.com>escreveu:
>
> Fátima, porque há números entre os caracteres? Você acha que são erros de
>> digitação ou erros de leitura dos dados. As vezes pode estar ocorrendo erro
>> na leitura da codificação, por exemplo. dados codificados em latin1 lidos
>> em ambiente UTF8, etc. Talvez valesse a pena verificar isso antes, pois
>> poderia te poupar bastante dor de cabeça.
>>
>>
>>
>> Daniel
>>
>>
>> 2013/4/12 Fátima Lima Paula <fatima.lima.paula em gmail.com>
>>
>>> Na verdade a outra forma resolveu, mas o que eu queria mesmo é verificar
>>> se há números entre os nomes. Do tipo Pa8la, Jos3 etc
>>> Tem uma forma de fazer?
>>> Se precisar envio um script para teste.
>>>
>>>
>>>
>>> Em 12 de abril de 2013 16:58, Daniel Marcelino <dmarcelino em live.com>escreveu:
>>>
>>> Uma solução possível :
>>>>
>>>> x <-c('Joao 01', 'Maria 02', 'Gigante', 'Pé de 03 feijao 04') # vetor
>>>> com números
>>>> #Voce deve ter um data.frame, então vamos converter isso em um:
>>>> dados <- data.frame(x)
>>>> # Vamos pedir para identificar a posição dos números m em uma coluna w:
>>>> dados$w <- gregexpr("[0-9]",dados$x)
>>>>
>>>> > dados
>>>> x w
>>>> 1 Joao 01 6, 7
>>>> 2 Maria 02 7, 8
>>>> 3 Gigante -1
>>>> 4 Pé de 03 feijao 04 7, 8, 17, 18
>>>>
>>>> ***Onde tiver "-1" é porque não há números. Por outro lado, onde
>>>> aparecer algum número diferente de -1 é porque há números. O número que
>>>> aparecer é a posição do caracter na string.
>>>>
>>>> Daniel
>>>>
>>>>
>>>>
>>>> On Fri, Apr 12, 2013 at 3:12 PM, Fátima Lima Paula <
>>>> fatima.lima.paula em gmail.com> wrote:
>>>>
>>>>> Parece que funciona, mas o problema é que tenho um banco com 302163
>>>>> linhas. Como faço para saber os nomes que apresentam números?
>>>>>
>>>>>
>>>>> Em 12 de abril de 2013 15:21, Rodrigo Coster <rcoster em gmail.com>escreveu:
>>>>>
>>>>> dados <- c('Joao 01', 'Maria 02', 'Gigante', 'Pé de 03 feijao 04')
>>>>>> gsub('[^0-9]', '', dados)
>>>>>> as.integer(gsub('[^0-9]', '', dados))
>>>>>>
>>>>>>
>>>>>>
>>>>>> 2013/4/12 Fátima Lima Paula <fatima.lima.paula em gmail.com>
>>>>>>
>>>>>>> Olá pessoal.
>>>>>>> Como faço para buscar números em uma coluna com nomes?
>>>>>>> Obrigada
>>>>>>> Fátima
>>>>>>>
>>>>>>> _______________________________________________
>>>>>>> R-br mailing list
>>>>>>> R-br em listas.c3sl.ufpr.br
>>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
>>>>>>> forneça código mínimo reproduzível.
>>>>>>>
>>>>>>
>>>>>>
>>>>>> _______________________________________________
>>>>>> R-br mailing list
>>>>>> R-br em listas.c3sl.ufpr.br
>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>>>> código mínimo reproduzível.
>>>>>>
>>>>>
>>>>>
>>>>> _______________________________________________
>>>>> R-br mailing list
>>>>> R-br em listas.c3sl.ufpr.br
>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>>> código mínimo reproduzível.
>>>>>
>>>>
>>>>
>>>>
>>>> --
>>>> \begin{signature}
>>>> Daniel Marcelino
>>>> ☁ dm.silva em umontreal.ca
>>>> ☎ (514) 343 6111 #3799
>>>> Skype: d.marcelino
>>>> ✎ 3200 Jean Brillant, Office C5071
>>>> Montreal, QC; H3T 1N8
>>>> Canada
>>>> \end{signature}
>>>>
>>>> "Small steps toward a much better world"
>>>>
>>>> _______________________________________________
>>>> R-br mailing list
>>>> R-br em listas.c3sl.ufpr.br
>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>> código mínimo reproduzível.
>>>>
>>>
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>>
>> --
>> \begin{signature}
>> Daniel Marcelino
>> ☁ dm.silva em umontreal.ca
>> ☎ (514) 343 6111 #3799
>> Skype: d.marcelino
>> ✎ 3200 Jean Brillant, Office C5071
>> Montreal, QC; H3T 1N8
>> Canada
>> \end{signature}
>>
>> "Small steps toward a much better world"
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
--
\begin{signature}
Daniel Marcelino
☁ dm.silva em umontreal.ca
☎ (514) 343 6111 #3799
Skype: d.marcelino
✎ 3200 Jean Brillant, Office C5071
Montreal, QC; H3T 1N8
Canada
\end{signature}
"Small steps toward a much better world"
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20130413/a41f21a6/attachment-0001.html>
Mais detalhes sobre a lista de discussão R-br