严澜:数据挖掘入门—分词

基于词典的分词,需要先预设一个分词词典,比如上面句子切分出来的“假如、上午”这些词先存放在词典,然后把句子切分成单字组合成词语去词典里查找,匹配上了就挑选出来一个词。没有匹配上的就切分成单字。

2014-10-24 2000 0 数据挖掘入门 数据挖掘

顶部