搜寻结果

2025年第七届全国语料库翻译学研讨会征文通知

2025年第七届全国语料库翻译学研讨会征文通知 https://corpus.bfsu.edu.cn/cbts2025.html 会议地点：北京大兴北京外国语大学国际会议中心会议时间：2025年8月1日全天及8月2日上午中国英汉语比较研究会语料库翻译学专业委员会、北京外国语大学中国外语与教育研究中心联合主办敬请关注！
- xujiajin
- 主题
- 2025-01-15
- 回覆: 0
- 论坛: 新闻和通知
求助：Yasumasa Someya建立的Business Letter Corpus的语料库信息

这是日本学者Yasumasa Someya (染谷泰正)建设的网站，目前已不再维护了相关信息可见：...
- xujiajin
- Post #2
- 2025-01-13
- 论坛: 专门用途语料库
求助！《红楼梦》汉英平行语料库

这个页面上有更多legacy corpora：http://corpus-hong.shisu.edu.cn/index.htm
- xujiajin
- Post #11
- 2025-01-12
- 论坛: 专门用途语料库
求助！《红楼梦》汉英平行语料库

谢谢ArthurW老师分享。很高兴laohong让这个红楼梦库在上外昨日重现了，看到这个界面分外亲切。
- xujiajin
- Post #10
- 2025-01-12
- 论坛: 专门用途语料库
求助！《红楼梦》汉英平行语料库

http://corpus.usx.edu.cn/index.asp 中国汉英平行语料库大世界
- xujiajin
- Post #8
- 2025-01-10
- 论坛: 专门用途语料库
求助！《红楼梦》汉英平行语料库

谢谢willing52老师。的确是这样的。我试了一下，Chrome浏览器打不开，但火狐和Edge浏览器可以打开：http://corpus.usx.edu.cn/hongloumeng/
- xujiajin
- Post #7
- 2025-01-10
- 论坛: 专门用途语料库
求助！《红楼梦》汉英平行语料库

我这边试了，打开后显示的是绍兴文理学院的首页，不是语料库页面。
- xujiajin
- Post #5
- 2025-01-08
- 论坛: 专门用途语料库
求助：AntConc将词性标注识别为单个词，如何解决？

是的，同意ArthurW，这是AntConc很友好的一个设计。
- xujiajin
- Post #5
- 2025-01-03
- 论坛: 语料库检索
detagging tools在win11上无法运行

应该用正则表达式将元数据（metadata）清除后，再将正文中的XML标记内容也清除掉，得到生文本后计算TTR，才比较稳妥。去除元数据时需要仔细一些，因为有可能库中不同文本所包含的元数据字段不完全相同。
- xujiajin
- Post #8
- 2024-12-29
- 论坛: 语料库标注
电视剧台词语料库

https://www.english-corpora.org/tv/ https://www.english-corpora.org/soap/
- xujiajin
- Post #2
- 2024-12-27
- 论坛: 口语语料库
有没有计算STTR较好的测算软件

TTR以小数、百分数、整数出现都是可能的。小数和百分数是对应的。如果是整数，一般会是100以下的一个整数，在表头处标明为百分比（%）更严谨。
- xujiajin
- Post #14
- 2024-12-26
- 论坛: 语料库语言学入门
求助：AntConc将词性标注识别为单个词，如何解决？

有两种办法，一个是在AntConc设置里Hide tag，让AntConc在检索和创建词表时忽略tag；另一种办法是再做一个生语料版本：可用https://corpus.bfsu.edu.cn/Detagger2.zip将语料库中的标注去除。请备份好原来已标注的语料库。
- xujiajin
- Post #2
- 2024-12-22
- 论坛: 语料库检索
如何对汉语本文进行多维语域分析

今天又读到两篇相关文献：吴继峰,胡韧奋,彭一平. 学术汉语语体语言特征多维度测量研究——与新闻类、通用类、小说类语体对比视角 [J]. 语言文字应用, 2024, (3): 30-43. 周启红,王海峰. 汉语学术论文语篇特征变化多维分析 [J]. 语言文字应用, 2024, (3): 44-55.
- xujiajin
- Post #3
- 2024-12-21
- 论坛: 常见问题
有没有计算STTR较好的测算软件

ArthurW老师说的应该是陆小飞老师的Lexical Complexity Analyzer https://sites.psu.edu/xxl13/lca/ 另外，还可关注一下Kristopher Kyle的两个工具 The Tool for the Automatic Analysis if Lexical Diversity (TAALED) The Tool for the Automatic Analysis of Lexical Sophistication (TAALES) https://www.linguisticanalysistools.org/tools.html
- xujiajin
- Post #9
- 2024-12-20
- 论坛: 语料库语言学入门
如何对汉语本文进行多维语域分析

多维语域分析的核心统计方法是factor analysis，方法的操作说明可参考：https://corpus.bfsu.edu.cn/info/1084/1873.htm页面上的Principal component analysis (PCA) and factor analysis (CA) data and codes （https://corpus.bfsu.edu.cn/PCA_FA0608.zip）可参看相关研究：许家金、李佳蕾，2022，近百年汉语书面语的语域演变研究，《外语与外语教学》（4）：76-86。
- xujiajin
- Post #2
- 2024-12-18
- 论坛: 常见问题
一起帮我看看这个统计量怎么计算出来的

可用这个工具：https://corpus.bfsu.edu.cn/LLX2.zip 计算时应使用原始频数，而不是标准化频率。
- xujiajin
- Post #3
- 2024-12-17
- 论坛: 语料库语言学入门
北外语料库团队利用ChatGPT开发的语料库软件及开发过程视频展示

您可关注雷蕾老师开发的Chinese Readability工具：AlphaReadabilityChinese 1.0 https://github.com/leileibama/AlphaReadabilityChinese/releases/tag/AlphaReadabilityChinese
- xujiajin
- Post #4
- 2024-12-17
- 论坛: 编程与工具开发
AntConc中n-gram使用求助

未见有比较好的去处长短词块间重复计数的方法。自然语言处理领域似乎不大理会这一问题。作为语言学研究者，一般会根据提取出的词块进行手工剔除，舍弃其中语法语义不完整的词块，是否删除具有包含关系的词块，也可一并考虑。
- xujiajin
- Post #2
- 2024-12-11
- 论坛: 语料库检索
求助！《红楼梦》汉英平行语料库

目前线上的确无可用《红楼梦》汉英平行库，你可考虑其他语料。《红楼梦》翻译研究较多，选题不易出新，也难有新见。
- xujiajin
- Post #3
- 2024-12-11
- 论坛: 专门用途语料库
老师们好，请问哪里可以找到2014年至今的外交部例行记者会双语语料库吗

历年例行记者会均在外交部官方网站。你设定时间范围进行检索即可获取。见截图说明。 https://corpus.bfsu.edu.cn/briefings.png
- xujiajin
- Post #6
- 2024-12-08
- 论坛: 语料库检索

Home
搜索