学会偷懒,并懒出效率

标签:Mmseg

共 2 篇文章

如何在mmseg3添加词库。

一、了解几个文件

ll /opt/modules/mmseg3/etc/
mmseg.ini ————-
uni.lib ————- 编译后的词库,给sphinx 用的
unigram.txt ————- 原词库给人看的, 在这里面人工添加自己的词库

阅读全文

Centos下搭建coreseek4.1中文搜索

coreseek是一款基于sphinx开源的搜索引擎,因为sphinx只支持英文和俄文(即只能进行英文分词和俄文分词),所以如果要使用sphinx做中文搜索的话,需要自己独立去导入中文词库。而coreseek里集成了中文词库模块mmseg,所以直接使用coreseek会方便很多。

coreseek目前的最新版是coreseek4.1版本,2011年发布的,是基于Sphinx2.0.2的,早先有一个版本coreseek3.2.14版,2010年发布的,其中的Sphinx是0.9.9版。看版本号也能看到两者变化很大,2.0.2版性能更好。所以建议使用coreseek4.1版。

coreseek4.1包含sphinx2.0.2+mmseg3

阅读全文