xujiajin's latest activity

  • xujiajin
    其实有关建模的知识,问大模型就很管用。
  • xujiajin
    根据您提供的信息,个人建议: 就低。即若出现次数最少朝代“来”的频次为100次,其他13个朝代则均随机抽取100条。...
  • xujiajin
    我前几个月做了个随机抽样工具,主要针对语料库研究中最常见的两种随机取样问题。https://corpus.bfsu.edu.cn/BFSU_Text_Randomizer2.zip 不知能否解决您的问题? 如果不能的话,不知您讲的针对年代进行分层抽样的具体含义。...
  • xujiajin
    DEAP语料库中所收均为学术期刊论文原文,全文分享有违版权。 DEAP语料库家族只能提供在线检索。 您可在“北外CQPweb多语种语料库平台”上找到DEAP (Database of English for Academic Purposes) family...
  • xujiajin
    DEAP语料库中所收均为学术期刊论文原文,全文分享有违版权。 DEAP语料库家族只能提供在线检索。 您可在“北外CQPweb多语种语料库平台”上找到DEAP (Database of English for Academic Purposes) family...
  • xujiajin
    https://corpus.bfsu.edu.cn/ChiLex1_2.zip 说明文档已随软件附上。 这个说明文档是请ChatGPT同学写的,完全达到我期待的技术细节和语言表达要求。 我请GPT基于软件的源代码写一个Readme,人家分分钟就完成了。
  • xujiajin
    请各位也关注一下雷蕾老师的AlphaReadabilityChinese工具 https://github.com/leileibama/AlphaReadabilityChinese/releases/tag/AlphaReadabilityChinese
  • xujiajin
    请试一下这一版,已加入TTR,并做了其他少量优化。 https://corpus.bfsu.edu.cn/ChiLex1_2.zip
  • xujiajin
    好的。谢谢Ray_Bai的反馈,TTR可以加上。我有意不显示TTR的,因为STTR正是为解决TTR缺陷而提出的,有STTR就没有再看TTR的必要了。算法说明会在定稿后版本的说明文档里加上。 Cf. Limitations of TTR...
  • xujiajin
    https://corpus.bfsu.edu.cn/ChiLex1.zip 请大家帮忙测试,并提宝贵意见。 软件的说明文档等功能测试完善后一并附上。
  • xujiajin
    这个应该可以的。我稍后写一个小程序传上来,然后请大家测试,并征求大家的修改意见。
  • xujiajin
    “主要是词汇”这个需求过于笼统。
  • xujiajin
    不支持中文及其他语种,只能分析英文文本。
  • xujiajin
    可到孔夫子旧书网(https://www.kongfz.com)搜索: (1)《中国学习者英语口语语料库建设与研究》 (2)《中国学生英语口笔语语料库》 这两本书都配有语料库光盘。最便宜的都是30块钱。 如果不愿花30块钱,可到学校图书馆借阅这两本书。
  • xujiajin
    可到孔夫子旧书网(https://www.kongfz.com)搜索: (1)《中国学习者英语口语语料库建设与研究》 (2)《中国学生英语口笔语语料库》 这两本书都配有语料库光盘。最便宜的都是30块钱。 如果不愿花30块钱,可到学校图书馆借阅这两本书。
Back
顶部