<div dir="ltr">Galera, <div><br></div><div>Estou tendo um problema em relação a leitura de um corpus, quando executo a função TermDocumentMatrix().</div><div><br></div><div><br></div><div>:: O trecho de erro do meu código: </div>
<div>term.sample<-TermDocumentMatrix(corpus, control=list(wordLengths=c(4,100)))<br></div><div><br></div><div><br></div><div>:: Quando executo este é o erro lançado: </div><div>Error: inherits(doc, "TextDocument") is not TRUE<br>
</div><div><br></div><div>Realizei alguns testes para ver se funcionava como:</div><div>Dei o inspect(corpus) antes do (term.sample) ele retorna normalmente com os dados pós parsing. </div><div><br></div><div>E também testei os dados nativos da biblioteca, no caso o "crude" no lugar do corpus, o que funcionou também. </div>
<div><br></div><div>Por esse motivo creio eu, que o problema pode estar no corpus, mas imagino ao mesmo tempo, que se estivesse lá, teria retornado algum erro, ou não? </div><div><br></div><div>Alguém tem alguma idéia? Já enfrentou esse tipo de problema?</div>
<div><br></div><div>Abs,</div><div><br></div><div>Fernando.</div></div>