OpenCorpus 漢語分析軟件V1.0

Haiyang Ai

Administrator
贾云龙 (WilliamJia) 日前来信,愿与大家分享他编写的 OpenCorpus漢語分析軟件V1.0

软件可以分析 Word 文档。大家把附件 OpenCorpus漢語分析軟件V1.0.exe_ 改成 .exe 就可以使用。使用方法也在附件中。

这里代表广大C友感谢 WilliamJia 分享他的劳动成果。
 

附件

  • OpenCorpusV1_0_exe_.zip
    527.1 KB · 浏览: 1,279
  • OpenCorpus漢語語料庫分析軟件使用方法.doc
    43 KB · 浏览: 1,209
回复: OpenCorpus 漢語分析軟件V1.0

先谢谢,回头再去试用软件。
 
回复: OpenCorpus 漢語分析軟件V1.0

很好用。直接针对Word,不用分词,也不用转Unicode。
 
回复: 统计汉语文本的N元组 程序

受楼主启发,设计里一个汉语文本N元统计软件,所需文本为txt文件。
#本程序能统计汉语文本的N元组
#使用时请把要统计的语料命名为”1.txt“;词频统计结果在”wordfreq-X元.txt“里
#结果以频率从大到小排序
#欢迎提出宝贵意见
 

附件

  • Chinese-n-gram.rar
    481.6 KB · 浏览: 369
回复: 统计汉语文本的N元组 程序

受楼主启发,设计里一个汉语文本N元统计软件,所需文本为txt文件。
#本程序能统计汉语文本的N元组
#使用时请把要统计的语料命名为”1.txt“;词频统计结果在”wordfreq-X元.txt“里
#结果以频率从大到小排序
#欢迎提出宝贵意见


好用!
 
回复: OpenCorpus 漢語分析軟件V1.0

Could have produced a version with English menu.
 
回复: OpenCorpus 漢語分析軟件V1.0

下面这个文件能直接统计utf-8编码的文本文件的汉字字数。
用法:
把要统计的计utf-8编码的文本文件命名为1.txt,点下这个东东,汉字字频就出现在frequency.txt文件里。
 

附件

  • Hanzifrenquencyutf-8.rar
    749.6 KB · 浏览: 179
Back
顶部