搜寻结果

  1. williamJia

    Collocator和Colligator软件beta版

    回复: Collocator和Colligator软件beta版 注意Collocator和Colligator是两个不同的软件,不是1.0和2.0不同版本的关系。
  2. williamJia

    如何用正则表达式来检索呢?

    回复: 如何用正则表达式来检索呢? http://www.regexlab.com/zh/workshop.asp?pat=[bcd][bcd]&txt=abc123 正则表达式工作面板
  3. williamJia

    请教许博士和williamJia关于collocator1.0的问题

    回复: 请教许博士和williamJia关于collocator1.0的问题 本软件目前只支持 Word+分隔符+POS形式的文本,如:word_POS, word/POS 等 还不支持XML格式 你的文本标记没问题只是软件设计时忽略了<s></s>所在行的内容 因为Claws软件的格式如下: <s> word_pos word_pos word_pos word_pos </s> 第一行和第三行会被忽略,你的数据都集中在<s>后面,所以就被忽略了,如果另起一行就不会有问题。
  4. williamJia

    请教许博士和williamJia关于collocator1.0的问题

    回复: 请教许博士和williamJia关于collocator1.0的问题 去掉段首的<t><p><s>等标签就可以检索
  5. williamJia

    管理员

    回复: 管理员 这样的帖子可以结了吧?
  6. williamJia

    诺贝尔学术资源网——文献求助的好去处

    回复: 诺贝尔学术资源网——文献求助的好去处 :p
  7. williamJia

    语音语料库(可以先免费索取库例试用)

    回复: 语音语料库(可以先免费索取库例试用) 我觉得,如果有必要,论坛可以单独开一个版面,允许打广告,推荐语料库相关的商业产品及有偿服务!
  8. williamJia

    诺贝尔学术资源网——文献求助的好去处

    回复: 诺贝尔学术资源网——文献求助的好去处 垃圾网站推广,请删帖
  9. williamJia

    紧急求助!如何在CLEC里提取英语双宾结构?

    回复: 紧急求助!如何在CLEC里提取英语双宾结构? Colligator 2.0也支持正则表达式 NP的确定是主要的问题,问题在于很难计算出NP的界限 楼主可以先检索动词然后手动筛选
  10. williamJia

    语料库的开发见解

    回复: 语料库的开发见解 天下本无事,庸人自扰之。 多行不义,一定会自己跌倒,请多多规范自己的言行,尽量于自己的年龄相符。 学为人师,行为示范。 多一点宽容,尤其是对年轻人,不要老是以小人之心,先声夺人。 不要以泼妇骂街的方式讨论为题,这样只能增加大家对你的鄙视。 在伟大祖国60大寿之际,请管理员速速结果此贴。
  11. williamJia

    管理员出面干预

    回复: 管理员出面干预 此贴可结 马甲、吵架的、吃大蒜的、自我吹嘘的、无事生非的、爱捣乱的,请换个地方交流。
  12. williamJia

    紧急求助!如何在CLEC里提取英语双宾结构?

    回复: 紧急求助!如何在CLEC里提取英语双宾结构? 关键问题出现在NP上
  13. williamJia

    请教:Is Corpus Linguistics a linguistic tool or a theory?

    回复: 请教:Is Corpus Linguistics a linguistic tool or a theory? CL和Chomsky的TG Gammar有冲突么?只是研究方法和看问题的角度的不同而已。 目前很多模型会同时参考TG Gammar和CL,比如语言标注,把规则和统计数据结合准确率 会提高很多
  14. williamJia

    语料库的开发见解

    回复: 语料库的开发见解 A Little Learning by Alexander Pope A little learning is a dangerous thing ; Drink deep, or taste not the Pierian spring : There shallow draughts intoxicate the brain, And drinking largely sobers us again. Fired at first sight with what the Muse imparts, In fearless...
  15. williamJia

    紧急求助!如何在CLEC里提取英语双宾结构?

    回复: 紧急求助!如何在CLEC里提取英语双宾结构? Colligator 2.0 下载地址 http://www.corpus4u.org/showthread.php?t=4873 统计 V+N+N不难 但是,正如许老师所说统计 V+NP+N V+N+NP V+NP+NP 就不太容易了,首先要确定NP 如果使用对句法进行标注的语料可能会容易一些 NP= N NP= N + N NP= ADJ+N NP= N + ADJ (较少) NP = DET + N NP = DET + ADJ + N NP = ...
  16. williamJia

    紧急求助!如何在CLEC里提取英语双宾结构?

    回复: 紧急求助!如何在CLEC里提取英语双宾结构? 提取双宾语的正则表达式:\S+_V\w+\s\S+_[NP]\w+\s\S+_[NP]\w+\b 使用Colligator 2.0对Claws4标注过的文本进行分析: 1. recounted_VVD John_NP1 Walford_NP1 2. told_VVN Sinn_NN121 Fein_NN122 3. mismatched_VVD...
  17. williamJia

    如何解读Readability Analyzer中的数据(有Readability_Analyzer_Readme下载)

    回复: 如何解读Readability Analyzer中的数据(有Readability_Analyzer_Readme下载) 在about里面有: Xu, Jiajin & Yunlong Jia. (2009). Readability Analyzer 1.0: A text difficulty analyzing tool. Beijing: The National Research Centre for Foreign Language Education, Beijing Foreign Studies University.
  18. williamJia

    语料库的开发见解

    回复: 语料库的开发见解 1)检索一般使用预选生成的索引文件(lucene也是这样处理的),对数据库进行检索是不可取的 2)检索只是语言库研究的一个方面 3)目前国外的语料库技术其实也不是很理想,跟国内相比没有本质的差距 4)中文分词有自己的算法,目前普遍采取基于训练语料的算法,如CLAWS 5) 杨惠中老师的《语料库语言学概论》是本不错的入门教材,如果有兴趣可以读一下
  19. williamJia

    语料库的开发见解

    回复: 语料库的开发见解 1)脚本语言不一定比编译性语言慢,主要看算法。 2)脚本语言非常稳定,有时比编译性语言还要稳定;另外java和C++的编译机制完全不同,不可同日而语。 3)脚本语言完全可以胜任海量数据的分析和处理 4)PHP可能比Perl更实用一些
  20. williamJia

    compared to & compared with 区别

    回复: compared to & compared with 区别 BNC http://corpus.byu.edu/bnc/ SEE CONTEXT: CLICK ON WORD OR SELECT WORDS + [CONTEXT] [HELP...] TOT ALL % MI 1 WITH 223 639947 0.03 3.80 2 TO 34 2498603 0.00 -0.88 3 IN 14 1845041 0.00 -1.72 4 FOR 5 837783 0.00 -2.07...
Back
顶部