搜寻结果

  1. xujiajin

    2025年第七届全国语料库翻译学研讨会征文通知

    2025年第七届全国语料库翻译学研讨会征文通知 https://corpus.bfsu.edu.cn/cbts2025.html 会议地点:北京大兴北京外国语大学国际会议中心 会议时间:2025年8月1日全天及8月2日上午 中国英汉语比较研究会语料库翻译学专业委员会、北京外国语大学中国外语与教育研究中心联合主办 敬请关注!
  2. xujiajin

    求助:Yasumasa Someya建立的Business Letter Corpus的语料库信息

    这是日本学者Yasumasa Someya (染谷泰正)建设的网站,目前已不再维护了 相关信息可见:...
  3. xujiajin

    求助!《红楼梦》汉英平行语料库

    这个页面上有更多legacy corpora:http://corpus-hong.shisu.edu.cn/index.htm
  4. xujiajin

    求助!《红楼梦》汉英平行语料库

    谢谢ArthurW老师分享。 很高兴laohong让这个红楼梦库在上外昨日重现了,看到这个界面分外亲切。
  5. xujiajin

    求助!《红楼梦》汉英平行语料库

    http://corpus.usx.edu.cn/index.asp 中国汉英平行语料库大世界
  6. xujiajin

    求助!《红楼梦》汉英平行语料库

    谢谢willing52老师。的确是这样的。我试了一下,Chrome浏览器打不开,但火狐和Edge浏览器可以打开:http://corpus.usx.edu.cn/hongloumeng/
  7. xujiajin

    求助!《红楼梦》汉英平行语料库

    我这边试了,打开后显示的是绍兴文理学院的首页,不是语料库页面。
  8. xujiajin

    求助:AntConc将词性标注识别为单个词,如何解决?

    是的,同意ArthurW,这是AntConc很友好的一个设计。
  9. xujiajin

    detagging tools在win11上无法运行

    应该用正则表达式将元数据(metadata)清除后,再将正文中的XML标记内容也清除掉,得到生文本后计算TTR,才比较稳妥。 去除元数据时需要仔细一些,因为有可能库中不同文本所包含的元数据字段不完全相同。
  10. xujiajin

    电视剧台词语料库

    https://www.english-corpora.org/tv/ https://www.english-corpora.org/soap/
  11. xujiajin

    有没有计算STTR较好的测算软件

    TTR以小数、百分数、整数出现都是可能的。小数和百分数是对应的。如果是整数,一般会是100以下的一个整数,在表头处标明为百分比(%)更严谨。
  12. xujiajin

    求助:AntConc将词性标注识别为单个词,如何解决?

    有两种办法,一个是在AntConc设置里Hide tag,让AntConc在检索和创建词表时忽略tag; 另一种办法是再做一个生语料版本:可用https://corpus.bfsu.edu.cn/Detagger2.zip将语料库中的标注去除。请备份好原来已标注的语料库。
  13. xujiajin

    如何对汉语本文进行多维语域分析

    今天又读到两篇相关文献: 吴继峰,胡韧奋,彭一平. 学术汉语语体语言特征多维度测量研究——与新闻类、通用类、小说类语体对比视角 [J]. 语言文字应用, 2024, (3): 30-43. 周启红,王海峰. 汉语学术论文语篇特征变化多维分析 [J]. 语言文字应用, 2024, (3): 44-55.
  14. xujiajin

    有没有计算STTR较好的测算软件

    ArthurW老师说的应该是陆小飞老师的Lexical Complexity Analyzer https://sites.psu.edu/xxl13/lca/ 另外,还可关注一下Kristopher Kyle的两个工具 The Tool for the Automatic Analysis if Lexical Diversity (TAALED) The Tool for the Automatic Analysis of Lexical Sophistication (TAALES) https://www.linguisticanalysistools.org/tools.html
  15. xujiajin

    如何对汉语本文进行多维语域分析

    多维语域分析的核心统计方法是factor analysis,方法的操作说明可参考:https://corpus.bfsu.edu.cn/info/1084/1873.htm页面上的Principal component analysis (PCA) and factor analysis (CA) data and codes (https://corpus.bfsu.edu.cn/PCA_FA0608.zip) 可参看相关研究:许家金、李佳蕾,2022,近百年汉语书面语的语域演变研究,《外语与外语教学》(4):76-86。
  16. xujiajin

    一起帮我看看这个统计量怎么计算出来的

    可用这个工具:https://corpus.bfsu.edu.cn/LLX2.zip 计算时应使用原始频数,而不是标准化频率。
  17. xujiajin

    北外语料库团队利用ChatGPT开发的语料库软件及开发过程视频展示

    您可关注雷蕾老师开发的Chinese Readability工具:AlphaReadabilityChinese 1.0 https://github.com/leileibama/AlphaReadabilityChinese/releases/tag/AlphaReadabilityChinese
  18. xujiajin

    AntConc中n-gram使用求助

    未见有比较好的去处长短词块间重复计数的方法。 自然语言处理领域似乎不大理会这一问题。 作为语言学研究者,一般会根据提取出的词块进行手工剔除,舍弃其中语法语义不完整的词块,是否删除具有包含关系的词块,也可一并考虑。
  19. xujiajin

    求助!《红楼梦》汉英平行语料库

    目前线上的确无可用《红楼梦》汉英平行库,你可考虑其他语料。《红楼梦》翻译研究较多,选题不易出新,也难有新见。
  20. xujiajin

    老师们好,请问哪里可以找到2014年至今的外交部例行记者会双语语料库吗

    历年例行记者会均在外交部官方网站。 你设定时间范围进行检索即可获取。 见截图说明。 https://corpus.bfsu.edu.cn/briefings.png
Back
顶部