Galera,
Estou tendo um problema em relação a leitura de um corpus, quando executo a função TermDocumentMatrix().
:: O trecho de erro do meu código:
term.sample<-TermDocumentMatrix(corpus, control=list(wordLengths=c(4,100)))
:: Quando executo este é o erro lançado:
Error: inherits(doc, "TextDocument") is not TRUE
Realizei alguns testes para ver se funcionava como:
Dei o inspect(corpus) antes do (term.sample) ele retorna normalmente com os dados pós parsing.
E também testei os dados nativos da biblioteca, no caso o "crude" no lugar do corpus, o que funcionou também.
Por esse motivo creio eu, que o problema pode estar no corpus, mas imagino ao mesmo tempo, que se estivesse lá, teria retornado algum erro, ou não?
Alguém tem alguma idéia? Já enfrentou esse tipo de problema?
Abs,
Fernando.