<div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr">Prezados, <div><br></div><div>Boa tarde,</div><div><br></div><div>Tenho uma conjunto de dados que são mensagens de textos e preciso identificar os cpf's digitados nestas mensagens.</div><div><br></div><div>Quando os cpf's são digitados sem pontos ou traços, consigo extrair esta informação. mas preciso selecionar também os casos como por exemplo:</div><div>000.000.000-00</div><div>Uma amostra de 69 mensagens dos dados estão nest link</div><div><a href="https://www.dropbox.com/s/cphsc02rz242z57/amostra.csv?dl=0">https://www.dropbox.com/s/cphsc02rz242z57/amostra.csv?dl=0</a><br></div><div><br></div><div>## CMR</div><div>d<-unlist(regmatches(dados[1:69,], gregexpr("[0-9,]+", dados[1:69,])))<br></div><div><div>d<- gsub(",", "", d)</div><div>d <- d[d != ""]</div></div><div><div>d[str_length(d)==11]</div></div><div><br></div></div></div></div></div></div>