GooSeeker分词扩展模块的安装方法

2026-6-15 11:01| 发布者: Fuller| 查看: 41| 评论: 0

摘要: 1. 扩展模块和基础模块的区别所谓的“扩展”是对原有的GooSeeker分词和分类检索平台功能的扩展。自从发布了扩展模块以后,我们这样分别称呼原先的分词工具和现在的扩展模块:基础模块:就是原先的GooSeeker分词 ...

1. 扩展模块和基础模块的区别

所谓的“扩展”是对原有的GooSeeker分词和分类检索平台功能的扩展。自从发布了扩展模块以后,我们这样分别称呼原先的分词工具和现在的扩展模块:

  • 基础模块:就是原先的GooSeeker分词和分类检索平台。从GooSeeker官网菜单进入:“产品”-> “分词工具”。这个基础模块是在GooSeeker官网服务器上运行的,用户只要打开浏览器就能使用上面的功能。主要功能是中文分词、选词、词云分析、共词关系图分析、基于词典的情感分析。
  • 扩展模块:为了支持机器学习和深度学习,使用python语言开发了扩展模块。这个模块需要安装在用户电脑上,而且必须先安装GooSeeker数据管家(爬虫软件),必须从数据管家启动扩展模块。扩展模块的功能还在持续增加中,目前已经支持:文本聚类、LDA分析(支持gensim的LDA模型和sklearn的LDA模型,以及NMF模型)、中文和英文分词和词性分析、基于深度学习的中英文情感分析、主题聚类(支持top2vec模型和bertopic模型)、情绪聚类等。
【注意】基础模块和扩展模块是两个独立不同的程序,两者之间不会共享数据。

1.1. 进入基础模块的方法

如下图,使用浏览器进入GooSeeker官网,选择菜单“产品”->“分词工具”,就能进入GooSeeker分词的基础模块,这是免安装的。

1.2. 进入扩展模块的方法

假设已经安装了数据管家和扩展模块,那么,打开数据管家,通过左栏菜单“词”进入分词基础模块,然后选择基础模块的左栏菜单“聚类+其他”进入扩展模块,如下图

2. 基础模块和扩展模块不能共享任务

【注意】目前基础模块和扩展模块不能共享任务。不能只在基础模块上创建任务,然后进入扩展模块,以为就能对基础模块的任务增加更多的处理功能,这是不对的。而是应该为扩展模块专门创建任务和导入数据。

3. 扩展模块的安装方法

无论使用数据管家浏览器还是其他浏览器,从分词基础功能一点击“聚类+其他”菜单,就能看到扩展模块安装说明页面,按照那个说明安装即可。这里要强调几点:

3.1. 安装需要10分钟左右,要耐心等待

在windows电脑上,安装扩展模块需要花费将近10分钟时间,安装过程不要打断。直到弹出一个提示框,说安装成功了才算完成。

3.2. 安装在数据盘上的方法

扩展模块很大,所以安装花费时间很长。还要创建本地数据库。而且在计算过程中会产生很多数据结果文件。所以,占用硬盘空间比较大。最好安装在数据盘上,参看将GooSeeker分词扩展模块安装在数据盘上的方法

3.3. 最有可能影响扩展模块运行的原因

个别安全卫士软件会对磁盘文件夹的权限做更改,导致扩展模块无法生成分析结果文件和各种图。另外,由于扩展模块会运行耗时较长的机器学习程序库,而且是从数据管家浏览器启动这些程序库的,个别安全卫士软件会拦截其运行。遇到运行异常时可以联系GooSeeker管理员。


鲜花

握手

雷人

路过

鸡蛋

最新评论

GMT+8, 2026-6-15 21:44