[R-br] Pré-processamento de texto pacote 'tm'

Vinicius Brito Rocha viniciusbritor em gmail.com
Sexta Setembro 26 10:08:56 BRT 2014


Fernando,

dê uma ollhada no R-Blogers. Tem esse código para textmining todo pronto lá.

Abs

Em 26 de setembro de 2014 09:46, Fernando Gama <f.fabiogama88 em gmail.com>
escreveu:

> Bom dia pessoal,
>
> Estou com problemas na etapa  de *preenchimento do termo *da minha
> análise textual, o s.o que utilizo é o mac os x 10.8.5.
>
> segue o trecho do código:
>
> tdm_corpus <- Corpus(VectorSource(corpus))
>
> tdm_corpus<-tm_map(tdm_corpus, stemDocument, language = "portuguese")
>
> *tdm_corpus<-tm_map(tdm_corpus, stemCompletion, dictionary=corpus.copy) *
>
> As outras etapas de limpeza foram aplicadas e o stem foi realizado com
> sucesso! Porém ao executar a linha em negrito o seguinte erro é lançado:
>
> Warning message:
> In mclapply(content(x), FUN, ...) :
>   all scheduled cores encountered errors in user code
>
> Reforço que no windows o processo de preenchimento do termo fora realizado
> normalmente. Além do mais, de acordo com minhas pesquisas esta maneira de
> preenchimento do termo é muito usual e o "warning" é muito genérico, isso
> acabou me motivando a buscar ajuda de vcs!
>
> Grande abraço.
>
> Fernando.
>
> --
> Att,
>
> Fernando Gama da Mata
>
> Pesquisador - Instituto Tecnológico Vale
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>



-- 
*Vinicius Brito Rocha.*
*Estatístico e Atuário *
*M.Sc. Engenharia de Produção/PO*
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140926/de887708/attachment.html>


Mais detalhes sobre a lista de discussão R-br