4、将获取的词(Term)传给索引组件(Indexer)

全文字笔迹核准索的目录创设进程平常常有以下几步: 1、一些内需创制索引的文书档案(Documents)。

2、将原版的书文书档案传给分词组件(Tokenizer)。

3、将获得的词元(Token)传给语言处理组件(Linguistic Processor)。

4、将获得的词(Term)传给索引组件(Indexer)。

相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注

*
*
Website