[R-br] Corpus não funciona dentro de um TermDocumentMatrix() - Package TM

Fernando Gama f.fabiogama88 em gmail.com
Terça Março 4 16:13:52 BRT 2014


Galera,

Estou tendo um problema em relação a leitura de um corpus, quando executo a
função TermDocumentMatrix().


:: O trecho de erro do meu código:
term.sample<-TermDocumentMatrix(corpus, control=list(wordLengths=c(4,100)))


:: Quando executo este é o erro lançado:
Error: inherits(doc, "TextDocument") is not TRUE

Realizei alguns testes para ver se funcionava como:
Dei o inspect(corpus) antes do (term.sample) ele retorna normalmente com os
dados pós parsing.

E também testei os dados nativos da biblioteca, no caso o "crude" no lugar
do corpus, o que funcionou também.

Por esse motivo creio eu, que o problema pode estar no corpus, mas imagino
ao mesmo tempo, que se estivesse lá, teria retornado algum erro, ou não?

Alguém tem alguma idéia? Já enfrentou esse tipo de problema?

Abs,

Fernando.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140304/25d30178/attachment.html>


Mais detalhes sobre a lista de discussão R-br