qhdjason的最近内容

  1. Q

    在使用nltk时如何匹配两个以上的名词?

    For <NN.*>{2,} try pattern = r"""NP: {<NN.*><NN.*>+}""" For <NN.*>{2,5} try pattern = r"""NP: {<NN.*><NN.*>} {<NN.*><NN.*><NN.*>} {<NN.*><NN.*><NN.*><NN.*>} {<NN.*><NN.*><NN.*><NN.*><NN.*>} """ Ugly but work. :) Run the following...
  2. Q

    急急!有關構式搭配分析軟體問題

    There's a very detailed explanation here: http://www.linguistics.ucsb.edu/faculty/stgries/teaching/groningen/readme.txt Just follow the instruction and you will get the result. The key for the R script to work is to organize your data as required. Take the collexeme_analysis as an example...
  3. Q

    请教:如何进行多个子语料库(7个)在某10个观察维度上频数间的两两差异显著性检验?谢谢!

    可以参考下面这本书(http://gen.lib.rus.ec/): An Introduction to Categorical Data Analysis (2nd Ed.) 第 2.2 节 有关 Odds Ratio 的介绍和 第 7.1 节(p.207) 有关 如何解读 Log Linear 模型的结果
  4. Q

    请教:如何进行多个子语料库(7个)在某10个观察维度上频数间的两两差异显著性检验?谢谢!

    你好,附件是一些测试数据的结果。Freq 那一列应该是频率数字。
  5. Q

    关于MAT软件

    如果特征原始频率一样,z 值也应一样。 猜测是否数据中有很多原始频率为 0 或 1 的特征。 p.s. 第三张不是 z 值吧?
  6. Q

    双语语料库软件AntPConc 用不了,没反应

    多谢!果然修改路径就可以了。
  7. Q

    双/多语语料库对齐软件 InterText

    回复: 双/多语语料库对齐软件 InterText InterText 的优点是提供了手工校对的图形界面,支持多人共同标注。自动对齐的效果并不好。 如果你试过 ABBYY,效果不理想的话就没有必有使用 InterText 了。这些开源软件对CJK语言,即 Chinese,Japanese 和 Korean 的支持都不好,有很多问题。
  8. Q

    mwetoolkit - The Multiword Expressions toolkit

    回复: mwetoolkit - The Multiword Expressions toolkit Thanks! Another interesting open source NLP tool, but developed under Linux. See here for installation on Windows.
  9. Q

    双/多语语料库对齐软件 InterText

    回复: 双/多语语料库对齐软件 InterText Use search engine!:)
  10. Q

    请教Stanford Parser怎么用

    回复: 请教Stanford Parser怎么用 http://www.bfsu-corpus.org/static/BFSUTools/BFSU_Stanford_Parser1.0.zip
  11. Q

    结巴中文分词 词性标注 R 语言版

    结巴中文分词有很多语言的版本,详见 https://github.com/fxsjy/jieba 试了下 R 语言的结巴,好像还不错。步骤如下: 1. 安装结巴 > install.packages("jiebaR") 2. 读取库文件 > library(jiebaR) 3. 调用 worker() 函数 > tagger = worker("tag", symbol=T) 4. 分词、词性标注 > tagger <= "D:/ludingji.txt" 标注结果保存在 D 盘。
  12. Q

    双/多语语料库对齐软件 InterText

    回复: 双/多语语料库对齐软件 InterText 多谢提醒! 我用的是Strawberry Perl,里面自带XML::LibXML模块。如果是Active Perl的话,可能需要安装一下。
  13. Q

    双/多语语料库对齐软件 InterText

    回复: 双/多语语料库对齐软件 InterText 应该是ABBYY Aligner吧。谢谢提醒。 我用《鹿鼎记》的中英文版试了一下,效果好像比 Hunalign 好些,不过人工校对是必不可少的。 我用的 ABBYY Aligner 不支持导出 .txt 文本,因此写了perl 脚本将 ABBYY Aligner 的 TMX 格式平行语料库转换为TXT格式,希望对大家有用。
  14. Q

    双/多语语料库对齐软件 InterText

    回复: 双/多语语料库对齐软件 InterText I wrote an article about the usage of InterText server, if you're interested, you can read it here
  15. Q

    R Fisher's Exact Test 脚本

    R 语言: Fisher's Exact Test 脚本 1. Why Fisher's Exact Test? Because Chi-squared Test is not so accurate when the expected frequency is less than 5. 2. How to use the script compute_fisher.r? It's very easy. Just copy all the code into R and change the fist line setwd() to the directory...
Back
顶部