资源介绍
天据英眼 - 分词和分类检索平台
- 导入文本数据,系统自动分词不用安装软件,直接在界面里导入文本数据,就会自动分词,得到词语列表和分词效果表;
- 筛选词语,系统自动匹配原文本把词语列表按照词频大小排序,点击词语可以查看样本数据,筛选出有用的词,系统会自动把词语与原文本进行匹配,得到选词结果表和打标结果表;
- 下载数据结果表完成前面两步后,就可以同时下载到选词结果表、打标结果表、分词效果表三张数据表。
操作说明
1. 登录进入系统,点击【新建任务】,导入要做分词处理或者是要分析的数据文件。
2. 筛选词语,系统会把切出来的词语,按词频从大到小排序,勾选会用到的词语,具体选哪些词语要根据研究主题来定,每一页选完点击【确定】提交就会切换到下一页。

3. 如果需要补充词语,可以直接点【添加词语】来补充,或者回到筛选词语那里勾选。

4. 最后下载数据,前面的选词会与原数据进行匹配关联,最多可以下载到7张数据表。点击【下载】按钮,可以下载到切词表、分词效果表、选词结果表、打标结果表这4张表; 然后,还可以【下载匹配矩阵表】、【下载分词效果表】、导出分类数据。
(1)切词表
(2)分词效果表
(3)选词结果表
(4)打标结果表
(5)匹配矩阵表
(6)分词效果表
(7)分类数据表

(2)分词效果表

(3)选词结果表

(4)打标结果表

(5)匹配矩阵表

(6)分词效果表

(7)分类数据表

应用举例
一条条文本变成对应于每个特征词的矩阵,就能用量化计算对文本内容进行分析。例如,对消费者对手机使用体验的国内伊人大蕉在钱信息进行分词打标,得到这样一个矩阵
针对这样的数据表,通过统计运算和数据挖掘运算,可以得出很多量化的结论。

