> gsub("\\xA0|[ \t\n\r\f\v]", "\\+", cidade)<br>[1] "Águas+Lindas+de+Goiás"<br><b><br>Não acredito que finalmente deu certo. Preciso aprender a usar esse Emacs.<br><br>Valeu, Benilton!<br></b><br>
<br><div class="gmail_quote">Em 5 de março de 2012 13:34, Benilton Carvalho <span dir="ltr"><<a href="mailto:beniltoncarvalho@gmail.com">beniltoncarvalho@gmail.com</a>></span> escreveu:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Resultado do emacs:<br>
<br>
character: (160, #o240, #xa0)<br>
preferred charset: unicode (Unicode (ISO10646))<br>
code point: 0xA0<br>
syntax: . which means: punctuation<br>
category: .:Base, b:Arabic, j:Japanese, l:Latin<br>
buffer code: #xC2 #xA0<br>
file code: #xC2 #xA0 (encoded by coding system utf-8-unix)<br>
display: by this font (glyph code)<br>
nil:-apple-Courier-medium-normal-normal-*-18-*-*-*-m-0-iso10646-1 (#xA6)<br>
hardcoded face: nobreak-space<br>
<br>
Character code properties: customize what to show<br>
name: NO-BREAK SPACE<br>
old-name: NON-BREAKING SPACE<br>
general-category: Zs (Separator, Space)<br>
decomposition: (noBreak 32) (noBreak ' ')<br>
<br>
<br>
dai', no meu teste:<br>
<br>
txt = paste("meu" , "texto", sep=loucura)<br>
gsub("\\xA0", "\\+", txt)<br>
<br>
com o resultado:<br>
<br>
[1] "meu+texto"<br>
<div class="HOEnZb"><div class="h5"><br>
<br>
b<br>
<br>
2012/3/5 Lucas Barbosa <<a href="mailto:lucasbcr@gmail.com">lucasbcr@gmail.com</a>>:<br>
>> gsub("[[:blank:]]+", "\\+", cidade)<br>
> [1] "Águas Lindas+de+Goiás"<br>
><br>
>> save(loucura, file='caracter_loucura.RData')<br>
><br>
> Já estou quase desistindo. Pra quem tiver curiosidade segue anexo o arquivo<br>
> caracter_loucura.RData<br>
><br>
> Em 5 de março de 2012 12:35, Benilton Carvalho <<a href="mailto:beniltoncarvalho@gmail.com">beniltoncarvalho@gmail.com</a>><br>
> escreveu:<br>
><br>
>> Hmmm...<br>
>><br>
>> Eu ainda tentaria algo como:<br>
>><br>
>> gsub("[[:blank:]]+", "\\+", cidade)<br>
>><br>
>> e, falhando tudo, abriria o arquivo de origem dos dados no meu bom e<br>
>> velho Emacs e usaria describe-char para tentar entender a fonte do<br>
>> probelma.<br>
>><br>
>> b<br>
>><br>
>> 2012/3/5 Lucas Barbosa <<a href="mailto:lucasbcr@gmail.com">lucasbcr@gmail.com</a>>:<br>
>> >> Encoding(cidade)<br>
>> > [1] "unknown"<br>
>> >> cidade <- enc2native(cidade)<br>
>> >><br>
>> >> cidade<br>
>> ><br>
>> > [1] "Águas Lindas de Goiás"<br>
>> >><br>
>> >> Encoding(cidade)<br>
>> > [1] "unknown"<br>
>> ><br>
>> >><br>
>> >> gsub( "[ \t\n\r\f\v]" , "\\+", cidade)<br>
>> > [1] "Águas Lindas+de+Goiás"<br>
>> >><br>
>> >> gsub( "[ \t\n\r\f\v]" , "\\+", cidade, useBytes=T)<br>
>> > [1] "Águas Lindas+de+Goiás"<br>
>> ><br>
>> > O pior é que eu consigo imprimir o "loucura" na tela, copiar e colar:<br>
>> ><br>
>> >> loucura<br>
>> > [1] " " # " " copiado<br>
>> >> gsub( " " , "\\+", cidade) # " " colado<br>
>> > [1] "Águas+Lindas de Goiás"<br>
>> ><br>
>> > Existe alguma função que receba um caracter e retorne o código unicode<br>
>> > dele<br>
>> > ou algo assim?<br>
>> ><br>
>> ><br>
>> > Em 5 de março de 2012 11:10, Benilton Carvalho<br>
>> > <<a href="mailto:beniltoncarvalho@gmail.com">beniltoncarvalho@gmail.com</a>><br>
>> > escreveu:<br>
>> ><br>
>> >> Parece algo de codificacao de caracteres... Qual o resultado de:<br>
>> >><br>
>> >> Encoding(cidade)<br>
>> >><br>
>> >> ?<br>
>> >><br>
>> >> E se vc converter 'cidade'?<br>
>> >><br>
>> >> cidade <- enc2native(cidade)<br>
>> >><br>
>> >> e tentar a partir dai'?<br>
>> >><br>
>> >> Ou, possivelmente, usar gsub() com useBytes=TRUE ?<br>
>> >><br>
>> >> b<br>
>> >><br>
>> >> 2012/3/5 Lucas Barbosa <<a href="mailto:lucasbcr@gmail.com">lucasbcr@gmail.com</a>>:<br>
>> >> > Bom dia pessoal,<br>
>> >> ><br>
>> >> > Estou escrevendo um código para calcular a distancia entre cidades<br>
>> >> > brasileiras com o gmaps. Para construir os links eu preciso trocar os<br>
>> >> > espaços por "+" nos nomes das cidades.<br>
>> >> > Nos meus dados (uma lista de cidades) algumas strings contém um<br>
>> >> > caracter<br>
>> >> > que<br>
>> >> > parece um espaço em branco, mas não se comporta como tal:<br>
>> >> ><br>
>> >> >> cidades[[47]][[3]]<br>
>> >> > [1] "Águas Lindas de Goiás"<br>
>> >> >><br>
>> >> >> cidade <- cidades[[47]][[3]]<br>
>> >> >><br>
>> >> >> strsplit( cidade ,"[ \t\n\r\f\v]")<br>
>> >> > [[1]]<br>
>> >> > [1] "Águas Lindas" "de" "Goiás"<br>
>> >> >><br>
>> >> >> gsub( "[ \t\n\r\f\v]" , "\\+", cidade)<br>
>> >> > [1] "Águas Lindas+de+Goiás"<br>
>> >> >><br>
>> >> >> loucura <- substr(cidade, 6, 6)<br>
>> >> >><br>
>> >> >> gsub( loucura , "\\+", cidade)<br>
>> >> > [1] "Águas+Lindas de Goiás"<br>
>> >> >><br>
>> >> >> gsub( sprintf("[%s \t\n\r\f\v]", loucura) , "\\+", cidade)<br>
>> >> > [1] "Águas+Lindas+de+Goiás"<br>
>> >> ><br>
>> >> > Eu consegui resolver o problema (trocar espaços por "+"), mas<br>
>> >> > gostaria<br>
>> >> > de<br>
>> >> > escrever meu código sem extrair o caracter "loucura" com a substr().<br>
>> >> ><br>
>> >> > Se não é [ \t\n\r\f\v], o que é? Alguém tem uma dica?<br>
>> >> ><br>
>> >> > Abs.,<br>
>> >> > Lucas Cusinato<br>
>> >> ><br>
>> >> > _______________________________________________<br>
>> >> > R-br mailing list<br>
>> >> > <a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
>> >> > <a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
>> >> > Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça<br>
>> >> > código<br>
>> >> > mínimo reproduzível.<br>
>> >> _______________________________________________<br>
>> >> R-br mailing list<br>
>> >> <a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
>> >> <a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
>> >> Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça<br>
>> >> código mínimo reproduzível.<br>
>> ><br>
>> ><br>
>> ><br>
>> > _______________________________________________<br>
>> > R-br mailing list<br>
>> > <a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
>> > <a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
>> > Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça<br>
>> > código<br>
>> > mínimo reproduzível.<br>
>> _______________________________________________<br>
>> R-br mailing list<br>
>> <a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
>> <a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
>> Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça<br>
>> código mínimo reproduzível.<br>
><br>
><br>
><br>
> _______________________________________________<br>
> R-br mailing list<br>
> <a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
> <a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
> Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código<br>
> mínimo reproduzível.<br>
_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br>
</div></div></blockquote></div><br>