搜寻结果

  1. D

    [Weird crap] What would you say about such a toy?

    回复:[Weird crap] It's being debugged and will be fininshed within a couple of days. I should make it clear that this tool can only extract goolge snippets. It can be used to collect a sample, but only when it still works if the context is small. This tool cuts a snippet apart at "..."...
  2. D

    [Weird crap] What would you say about such a toy?

    This thing, which I call a "GugleExtractor" is born out of my craziness for digging up things on Internet. The GugleExtractor, as it sounds like, is a tool that extracts text-only snippets out of Google results, which I've assumed not totally insuficient. And I've kind of worked up a weird...
  3. D

    [砖头] COLEN 及其搜索工具下载(更新)

    回复:[砖头] COLEN 及其搜索工具下载(更新) 原来是薛前辈 ... 您不妨写本书 ... 把有关语料库的计算机技术汇集一下 ... 这是很有意义的事情 ... 因为从所谓“技术恐惧症”的角度讲,技术的确是一个重要的层面 ... 据我的感觉(只是一种感觉)研究语言或者教授语言的人,在计算机应用方面从整体上来看,确实存在着某些难以逾越的障碍,其中包括“不为”与“难为”两方面 ...
  4. D

    [砖头] COLEN 及其搜索工具下载(更新)

    这里可以找到 .net framework: http://www.microsoft.com/downloads/search.aspx?displaylang=zh-cn&categoryid=10
  5. D

    [砖头] COLEN 及其搜索工具下载(更新)

    在DDL与语料库与课堂教学方面,楼主提供的是一笔非常有价值的资源。晚生曾在课堂上即时试用过Brown等语料库,效果Extremely不理想,后来考虑到是语料和检索工具方面的问题:若对语料不加控制,不考虑学习者的理解能力,“输入”的效果难以保证。在检索工具提供的上下文方面,如果不以句或句群的模式呈现出KWIC,不可预知是否前后文能提供足够的信息来实施进一步的教学活动。所以,从这两方面来看,选用与学习者理解能力相符的课本中的课文,并采用行/句为单位...
  6. D

    [砖头] COLEN 及其搜索工具下载(更新)

    930篇...TAGGED...晚生实在佩服...居然分文不取地拿出来了... 楼主的东西是精华, 非常,非常,非常有价值 ... 应予以重视... 楼主贴子前[砖头]二字中的意味 ... 楼主是个实力雄厚而且十分务实的人 ... 从他那"屡投屡败"的论文就能看出来 ... 技术 ... 所谓"要克服技术恐惧症" ... 但若是我这样的小东西 ... 本来论文就发不动, 是绝对不敢说技术的, 我只敢多说理论, 少谈技术, 多少整点数据美美容... 感谢楼主!祝福楼主!
  7. D

    Beginner"s books on programming language PERL?

    Perl is not a good start point of learning scripting or programming. Any programming language with a strict grammar yet not very complicated is better. I think Visual Basic is a good choice. That VB is commercial software might be the only reason it is not widely used in NLP or anything for that...
  8. D

    [推荐]两个Open source的下载工具

    One of the best: HTTRACK: http://www.httrack.com/
  9. D

    Python: a language choice for content analysis

    By the way, Python is a good start point in learning scripting and programming.
  10. D

    Python: a language choice for content analysis

    Python is free, easy to learn, and it has mingled the advantages of a few popular programming languages.
  11. D

    [求助]SARA中的Z-score怎么跟其它方法算出来的不一样?

    Click on "回复", instead of editing your post in "快速回复", and the upload widget you'll see.
  12. D

    求助:有没有比较好的用于日语语料库的检索工具?

    回复:求助:有没有比较好的用于日语语料库的检索工具? 我觉得这个也许你能派上用场: KWIC Concordance for Windows http://www.chs.nihon-u.ac.jp/eng_dpt/tukamoto/kwic_e.html
  13. D

    [求助]SARA中的Z-score怎么跟其它方法算出来的不一样?

    回复:[求助]SARA中的Z-score怎么跟其它方法算出来的不一样? 工作表:分析<<导论>>Z-score公式与BNCweb z-score公式中SPAN http://forum.corpus4u.org/upload/forum/2005101901231286.xls
  14. D

    [求助]SARA中的Z-score怎么跟其它方法算出来的不一样?

    在回帖之前,本人必须郑重声明:本人科研态度不够严谨,在得到正确结论之前就妄然发言,必将闭门检讨,端正自身作风。如下内容实属尝试性,假想性的发言,望各位同志批评指正。 在经过一番苦思之后,认定本人之前关于Z-score之观点大有可疑。虽发现了《导论》与BNCweb两算法间的不同,但却陷入了一种可疑的思路,未经明证的假想,在把两公式中S统一之后发现其结果近乎相似便止步不前,未进一步实证便提出观点并以为正确。惭愧之至,痛心疾首。以下文字是反思回想后再次得出的结论,希望各位同志批评,指正,讨论...
  15. D

    [求助]SARA中的Z-score怎么跟其它方法算出来的不一样?

    "Very frequent items and very infrequent items" refer to?
  16. D

    Excel制作的MI, MI3, T-score, Z-score计算工具

    计算公式均取自权威文献或可靠材料,和广泛应用的软件工具取得的结果也进行过比对. 一点说明:该工具中的Span未确切定义, 以便自行把握. 例如节点词两侧各取4个词,便可把Span指定为9(即2*4+1)。为防止公式被删除,工作表相应单元格已锁定并保护。但公式内容仍一目了然。 http://www.corpus4u.org/upload/forum/2005101407220799.xls
  17. D

    Excel中制作的Chi-square计算器

    http://www.corpus4u.org/forum/upload/forum/2005101406111283.xls
  18. D

    [求助]SARA中的Z-score怎么跟其它方法算出来的不一样?

    回复:[求助]SARA算出来的Z-score怎么跟我用其它方法算出来的不一样? 此外,不才我也认为Z-分值是揭示搭配力较好的方法。 MI的实质是观测值与期望值的比率,MI3是一种出色的改良,在某种程度上克服了MI过分的突出低频次搭配的不足,T-Score对频次有充分的强调,并考虑到总体,而Z分值的计算与上述种种因素均有反映。以上图表对此有明显的反映。就像各种考试系统偏爱标准分,原理相似的Z分值计算是一种衡量搭配力的好方法。
  19. D

    [求助]SARA中的Z-score怎么跟其它方法算出来的不一样?

    回复:[求助]SARA算出来的Z-score怎么跟我用其它方法算出来的不一样? Z分值计算数值的不同也许是因为公式的不同: 比如如下两个不同的Z分值公式 两公式原理是一样的,但有两处不同: 1. 搭配词概率(probability of the collocate ) BNCweb 公式中:搭配词概率 = 搭配词频数 / (整个文本长度 - 节点词频数) 《导论》公式中:搭配词概率 = 搭配词频数 / 整个文本长度 2. 小文本的跨距(span) BNCweb公式中的S与《导论》公式中的S表示不同,前者相当于后者中2S...
Back
顶部