搜寻结果

  1. xujiajin

    求Shlesinger的Simultaneous Interpretation as a Factor in Effecting Shifts in the Position of Texts on the Oral-Literate Continuum一文

    https://www.researchgate.net/profile/Anthony-Pym-3/publication/329371864_Simultaneous_interpretation_as_a_factor_in_effecting_shifts_in_the_position_of_texts_in_the_oral-literate_continuum/links/5c054d4a458515ae544306f9/Simultaneous-interpretation-as-a-factor-in-effecting-shifts-in-the-position-o...
  2. xujiajin

    关于双向口译语料库

    这是个现实存在的真问题。 以下思路供参考。 语料库可存为两个版本。其中一个版本是完整版;另一个为删除非翻译内容的版本。检索分析可在第二个版本中进行,如有需要,再反查第一个版本,获取完整上下文。通常基于句对齐平行语料库的词句分析,不大用得上那么多上下文信息。 再有,若不删除非翻译内容,也可在文中逐个手工标出非翻译字段,以便检索分析时区别对待。 用ELAN做多模态平行库,工作量大,效价比不高,不建议尝试。其他网友若有这方面经验,好的做法,欢迎分享。
  3. xujiajin

    求助:BCC语料库总词容

    这里有字数说明:https://bcc.blcu.edu.cn/help BCC没有按词次来计算库容。词有争议,字相对更没有争议。 汉语一个词,可以粗略以1.6个汉字来折算。
  4. xujiajin

    Coh-Metrix是不是已经停用了

    他们官方宣布不再维护。他们提供了一个单机版的Coh-Metrix,但并不好用。 替代方案是Kristopher Kyle的系列工具:https://www.linguisticanalysistools.org/tools.html
  5. xujiajin

    求助:BCC语料库总词容

    https://bcc.blcu.edu.cn/downloads/papers/%E5%A4%A7%E6%95%B0%E6%8D%AE%E8%83%8C%E6%99%AF%E4%B8%8BBCC%E8%AF%AD%E6%96%99%E5%BA%93%E7%9A%84%E7%A0%94%E5%88%B6_%E8%8D%80%E6%81%A9%E4%B8%9C.pdf 荀恩东, 饶高琦, 肖晓悦, 臧娇娇. 大数据背景下BCC语料库的研制[J],语料库语言学,2016(1).
  6. xujiajin

    有没有一些近几年的二语学习者写作语料库,国内外都可以

    大规模中学生英语作文库,未见有可公开获取的。
  7. xujiajin

    2024语料库建设与应用研讨会征文(7月31日截止)免会务费

    “2024语料库建设与应用研讨会”由中国社会科学院语言研究所语料库暨计算语言学研究中心、北京外国语大学中国外语与教育研究中心、国家社会科学基金重大项目“辞书编纂用大型多功能语料库建设与研究”(23&ZD314)联合主办,外语教学与研究出版社协办。大会定于2024年8月10日在北京大兴北京外国语大学国际会议中心举行。本届会议主题为“语料库语言学前沿:数据驱动的语言研究、创新应用与未来展望”。本次会议的主旨发言人为:中国社会科学院顾曰国教授、北京航空航天大学卫乃兴教授、北京航空航天大学梁茂成教授、中国社会科学院张永伟研究员。 本次会议不收取会务费。...
  8. xujiajin

    有没有一些近几年的二语学习者写作语料库,国内外都可以

    -TECCL中国学生万篇英语作文语料库:http://corpus.bfsu.edu.cn/info/1070/1449.htm TECCL可全文下载 许家金. “中国学生万篇英语作文语料库”介绍. 语料库语言学, 2016, (2): 108-112. -iWriteBaby中国英语学习者语料库常见错误分析平台: -许家金,2019, iWriteBaby中国学习者英语语料库的创建,《语料库语言学》(1):105-109。 iWriteBaby可在线浏览偏误类型及在线检索。 https://iwritecorpus.unipus.cn/iwrite-baby-client/#/...
  9. xujiajin

    London–Lund Corpus 2 A corpus of spoken British English

    London–Lund Corpus 2 A corpus of spoken British English Welcome to the official website of LLC–2 The London–Lund Corpus 2 (LLC–2) is a half-a-million-word corpus of spoken language with recordings from 2014–2019 with adult educated speakers of British English. On the one hand, the corpus is a...
  10. xujiajin

    BFSU Collocator提取city一词的搭配情况,为什么只显示a、b、c开头的搭配呢?

    搭配词默认是按字母顺序排序,因此a、b、c开头的单词排在前头,翻页后应该可以看到其他搭配词。
  11. xujiajin

    关于北外的BFSU_Qualitative_Coder_1.2手工标注工具,我在使用autocode功能时,不知道哪里出现问题了,导致全文被标注,以下是我的codelist,大家可以帮我看一下是不是有问题啊?十分感谢!!

    请在正则表达式中的每个单词前后加上\b试试。 例如:regExpr=\bdo\b|\bdoes\b|\bdid\b \b这里表示单词边界,应该是boundary的首字母。
  12. xujiajin

    求:英汉双语平行文本自动对齐系统

    当然也可以尝试用大语言模型来实现:https://promptbank.unipus.cn/portal/detail?id=188 用于测试的两个文本可从下面链接获取: https://corpus.bfsu.edu.cn/A01A.EN.txt https://corpus.bfsu.edu.cn/A01A.ZH.txt
  13. xujiajin

    求:英汉双语平行文本自动对齐系统

    用过的对齐工具里较好的是ABBYY Aligner和TMXmall:https://www.tmxmall.com/aligner/home 两者都不免费。
  14. xujiajin

    【求助】关键性分析研究方法

    “纠正”不敢说,也仅是一个建议,供您参考。
  15. xujiajin

    本人很菜 想问用uam能统计出文本的六种及物性过程吗

    目前来看,用ChatGPT识别和标注6种及物性过程,效果很好。不妨一试。
  16. xujiajin

    【求助】关键性分析研究方法

    感觉BNC的数据在其中有些多余。 直接用A比C即可。C需要再进一步扩充。 至于选前100还是前200,没有一定之规,可在显著主题词中自行梳理,尝试得知。 语料库中的keywords,一般不译成“关键词”,而是译成“主题词”
  17. xujiajin

    [求助]如何删去语料库中的标注信息和附码信息

    底层就是用正则表达式匹配,然后替换删除。 我们做的Detagger也是这个原理,只是在正则表达式基础上加了个界面,以方便不熟悉正则表达式的同行。
  18. xujiajin

    BFSU Logistic Regression Tool

    您讲得很有道理。 这个不光是国内,国际语言学界也存在类似情况。在可能情况下,我们应尽量严谨。
Back
顶部