中英文词频统计软件,可以统计一批Word文档(.doc;.docx)、网页文件(.htm;.html)或文本文件(.txt)中所有中英文单词出现的总次数,或分别在各文件中出现的频率。统计结果可以按出现次数排序输出为Excel表格或Word表格文档。
功能介绍
全量统计方式,即统计给定多个文档中的所有词汇的出现词频;
指定统计方式,只统计指定的某些特殊词汇的出现词频。
可以选择只统中文词汇、英语词汇或标点符号。
常见问题
问:词频分析结果是什么样的?比如我想把一篇文档进行分词,统计出高频词汇,这样能做到吗?分词是单个字,还是一个词语?
答:把一篇文档进行分词,统计出高频词汇,这就是这个软件的功能。分词是按语言学上的词语,比如“中化人民共和国”算一个词语。而且,对于一些新词,或特殊定义的词汇,如“新浪微博”这类新产生的词汇,软件提供了“自定义词汇表”功能,您只要把它添加到自定义的词汇表中,就可以作为一个词来进行统计。
全量统计方式,即统计给定多个文档中的所有词汇的出现词频;
指定统计方式,只统计指定的某些特殊词汇的出现词频。
可以选择只统中文词汇、英语词汇或标点符号。
问:词频分析结果是什么样的?比如我想把一篇文档进行分词,统计出高频词汇,这样能做到吗?分词是单个字,还是一个词语?
答:把一篇文档进行分词,统计出高频词汇,这就是这个软件的功能。分词是按语言学上的词语,比如“中化人民共和国”算一个词语。而且,对于一些新词,或特殊定义的词汇,如“新浪微博”这类新产生的词汇,软件提供了“自定义词汇表”功能,您只要把它添加到自定义的词汇表中,就可以作为一个词来进行统计。