Latest activity

  • S
    StrayKtystal 发布新主题
    自建古诗英汉平行语料库,句对齐完成后(英汉在不同文档)进行词性标注,发现英文语料段落会被打乱,请问有什么不会打乱段落的标注软件,或者恢复段落的解决思路吗?比如用Excel或者Python? 【注:大约500多首诗歌,一半多英文没有标点符号,重对齐较麻烦】...
  • 其实detag这种事情可以用EmEditor使用正则表达式就可以解决了,EmEditor也支持批量处理文件,EmEditor支持处理超大型的txt文件,大到G级别的都可以。正则表达式不会的人可以直接问ChatGPT就行,只要描述明白,它就会给出准确的regex,当然需要告诉...
  • 你这个网页里面那些大语言模型搜集的还算比较全,那个TED平行语料库文件如果可以下载就好了,TED里面含有的现代语言的信息内容非常丰富。平行语料库还有几个比较容易获取的方式:1.用GetDict软件把mdx格式的词典文件把里面的数据解出来,再用EmEditor使用正则表达式把...
  • xujiajin
    xujiajin 发布新主题
    https://corpus.bfsu.edu.cn/CorporaAZ.htm 语料天涯Corpora A-Z 大语言模型LLMs A-Z 语料库语言学家及团队Corpus Linguists and Research Groups A-Z
  • xujiajin
    谢谢您的反馈。我们又重新做了一版,请您再试试: https://corpus.bfsu.edu.cn/Detagger2.zip
  • xujiajin
    请不要在本论坛发表与语料库语言学不相干的言论。
  • xujiajin
    的确如您所讲,每个人写的prompt可以风格不一样,只要效果好即可。 我们设置这个页面,就是欢迎大家上传个人自己的prompts。这是个开放平台。 大家点击去可以看到+add new prompt。 我们只是开个头,抛砖引玉。
  • apple_edu
    apple_edu 发布新主题
    大家好,我今天用BFSU...
  • 大致看了看你贴出来的这些Prompt的内容,个人观点是你搞的太复杂,写Prompt的要点是把要求准确无异议的传达即可,你的那些prompt写的很官样,老外写得那些prompt好像也是和你这种方式,写完了跟一篇论文似的。Prompt写简单点就可以,ChatGPT或者其他的AI...
  • xujiajin
    谢谢您的问题。 我们的观点基本没变。 我们现在提倡的是LLM-assisted corpus linguistics,大模型能做很多以前做不了的事情,可以成为我们的科研助理,但整个研究还应由人来主导。我已在近期的图书和论文中谈及这一“人机协同”模式。
  • 许博士是不是还在坚持去年对于ChatGPT的那些观点呢?ChatGPT发展到今年五月份已经可以进行视觉识别了,是跟人一样进行类似的视觉识别了,它通过视觉识别能解决的问题远不止OpenAI工作人员展示的那点内容。它到现在基本上跟终结者机器人出入不大了,只是它还没有机器人的躯体...
  • 精英英语 发布新主题
    在2023年的时候,我对于ChatGPT的观点就是可以取代语料库了,那时候许家金博士好像还不以为然,ChatGPT发展到现在2024年5月已经可以处理视频了处理语音了,可以通过摄像头让它通过视觉识别来帮人做很多事情了,除了它没有一个机器人的躯体,如果它有一个机器人的躯体,那...
  • xujiajin
    应该录用通知已发,我周围的一些朋友已经收到录用通知了。 这次会议的拒稿率应该比较高。
  • S
    想请问一下,2024亚太语料库会议的摘要录用通知现在发了吗?没有收到邮件通知,所以想确认一下。谢谢!
Back
顶部