搜寻结果

  1. williamJia

    求寻适合藏文检索的语料库软件

    回复: 求寻适合藏文检索的语料库软件 http://www.corpus4u.org/showthread.php?t=4217 我写的这个软件底层是用unicode实现的,用来检索中文,也许能检索藏文。因为藏文和中文都是unicode而且不用空格作为字的间隔。你可以把藏文发给我一点,我试一试。我的邮箱jyl_java#126#com(分别用@和.代替#)
  2. williamJia

    新人求助!!!希望高老师帮忙解答,赐教

    回复: 新人求助!!!希望高老师帮忙解答,赐教 你可以参考WordSmith的说明书,也许对你会有启发 同时也可以参考其他的软件,本论坛中有不少语料库分析工具,可供你参考。 http://www.corpus4u.org/showthread.php?t=4873
  3. williamJia

    Collocator和Colligator软件beta版

    回复: Collocator和Colligator软件beta版 很抱歉现在软件不支持<w VVG>Reading</w>这种格式的标注,只支持Word_POS格式的,您可以先把文本转化一下再使用。
  4. williamJia

    推荐两本 Programming for Linguists 的书 PERL JAVA

    回复: 推荐两本 Programming for Linguists 的书 PERL JAVA 如果大家想开发在线语料库检索系统,建议使用PHP,简单快捷,效率很高。学习PHP基本语法只需要2个小时左右。既跨平台,又开源,还有大量的社区。PHP是目前最受欢迎的开发语言之一,排名居于perl之前java之后,大家有兴趣可以试一试。 我很久不用VB了,觉得VB的局限太大了,开发Win32程序,我还是认为Delphi最方便。 以下是我认为语料库开发应该解决的几个基本问题: 1)快速统计词频和快速排序 2)检索(正则表达式)...
  5. williamJia

    Collocator和Colligator软件beta版

    回复: Collocator和Colligator软件beta版 演示视频
  6. williamJia

    Collocator和Colligator软件beta版

    回复: Collocator和Colligator软件beta版 软件截图
  7. williamJia

    Collocator和Colligator软件beta版

    这是我为许家金等老师最新编写的2个小软件,目前还在测试阶段,欢迎大家试用! 附件中包含一个演示视频,录得不太好,语无伦次,请大家将就使用! About BFSU Colligator 2.0 beta: Colligator 2.0 is a re-write of Colligator 1.0, a previously released colligation extraction and analysis tool. Colligator 2.0 was programmed by Mr Yunlong Jia (William Jia), and designed by...
  8. williamJia

    听计算机专业朋友说,在线检索不用sql可能更快。。

    回复: 听计算机专业朋友说,在线检索不用sql可能更快。。 我对这个问题的看法: 如果您使用的是桌面程序,如WordSmith等,而且频繁更换语料库(或文章库),最好不要用数据库,因为这样操作很麻烦,使用数据库是有成本的,每次建立连接和插入数据,都需要时间,而且数据库对基于正则表达式的查询支持有限。最好是直接在内存中操作,这是最快的方法,同时要优化算法,加快查询速度,也可以先产生索引,再检索,这等于用空间换时间。...
  9. williamJia

    求助:MYSQL精确匹配单词查找

    回复: 求助:MYSQL精确匹配单词查找 我的经验: 1.首先处理标点,在标点前或后加入空格,这样He said, "I am OK!" 就变成了He said , " I am OK ! " 2.注意给句子的开头和结尾也都补上1个空格,不然句子开头的单词的可能查不到,如果是以标点结尾,就不用贾空格(因为第一步已经加了) 3. 写SQL语句时,在索引词的前后各加上一个空格,这样就能精准匹配 一般,我直接使用正则表达式,处理文本,用数据库很不方便。
  10. williamJia

    [求助]关于各类计算keywords的算法

    回复: [求助]关于各类计算keywords的算法 以下时WS5提供的材料 Formulae Top Previous Next Reference > formulae For computing collocation strength, we can use Mutual Information Log to base 2 of (A divided by (B times C)) where A = joint frequency divided by total tokens B = frequency of word 1 divided by...
  11. williamJia

    [求助]关于各类计算keywords的算法

    回复: [求助]关于各类计算keywords的算法 http://ucrel.lancs.ac.uk/llwizard.html
  12. williamJia

    [求助]关于各类计算keywords的算法

    :) 我们想对给类Keywords的计算方法进行一下汇总和评估,不知那位大侠能提供一些材料,先谢谢了。 WilliamJia@OpenCorpus.org
  13. williamJia

    [求助]急需关于自动附码的文献材料

    回复: [求助]急需关于自动附码的文献材料 waiting in darkness
  14. williamJia

    [求助许博士]plot dispersion 的算法

    回复: [求助]plot dispersion 的算法 我现在的算法是根据标准差来计算
  15. williamJia

    [求助许博士]plot dispersion 的算法

    老许你好: WS5的帮助文件这样写的: How it is calculated The plot dispersion calculated in KeyWords and Concord dispersion plots uses the first of the 3 formulae supplied in Oakes (1998: 190-191), which he reports as having been evaluated as the most reliable. Oakes, Michael P. 1998, Statistics for...
  16. williamJia

    [求助]急需关于自动附码的文献材料

    大家好: 我们Open Corpus Project 开发团队目前正在开发语料库处理和分析系统,现在急需一些关于自动附码方面的材料,如果您的手头有关于以下几个方面的材料,非常希望与您分享: 1.词性附码 2.错误附码 3.语义附码 4.句法标柱 5.屈折还原 ... 我们的邮箱:Wiki@OpenCorpus.org 我们的网站:www.OpenCorpus.org
  17. williamJia

    恳求许博士帮忙

    回复: 恳求许博士帮忙 可以快速统计多文本:D
  18. williamJia

    恳求许博士帮忙

    回复: 恳求许博士帮忙 I will write a delphi program for you, it will be easy to use.:)
  19. williamJia

    请问:能不能自动插入对应文本?

    回复: 请问:能不能自动插入对应文本? 我帮你合并 文件发给我 jyl_java@126.com
  20. williamJia

    [Help]求汉语常用词汇表

    哪位朋友有现代汉语常用词汇表?
Back
顶部