首先我是一个后来者,新人,所以我说的有些不对的,大家还多指正。
接触语料库有一段时间了,最近有些困惑和迷茫。频数,搭配,语域,类联接,各种统计公式(T-SCORE,Z-SCORE, MI,etc.)各种统计软件的使用,学习者语料库,在线检索,NS corpus,...一直在不停的算,统计,检索,RE提取,语料库不断的追求large-scale。但这一切。。。让我自己迷茫了。我在做什么?我想做什么?这一切的统计是否。。。
现在流行做多模态语料库,技术更新的确很快。如我看的双语字幕电影一样。。我想到乔姆斯基曾经对语料库做出的批评,我没觉得他是完全对的。但我的感觉很复杂。...