1、建议在语料库中对异形词采用“通用词”进行标注,既避免“噪音”和漏检,又能解决字形不够用的问题,对相关研究具有重要意义。
2、中文系教授正准备建一个中文语料库。
3、本文分析了大规模汉语语料库兼类词词性标注序列之后,提出了汉语语料库词性标注一致性检查和自动校对的方法。
4、实验表明,在无需词典和语料库的前提下,该算法能够快速准确地抽取文档中的中、高频词。
5、平行语料库研究是近年来语料库语言学横向发展的新趋势。
6、本文所选取的语料库涵盖了从第一届美国总统华盛顿至现任总统奥巴马的就职演说,历时220多年,共56篇演说稿。
7、其次,对体育语域语料库中的体育赛事语料进行词频统计,编制体育赛事基本词表,从中提取体育赛事基本词汇2217个。
8、本研究采用语料库方法,从实证角度对生物医学类英文摘要中第一人称的使用及相关问题进行了研究。
9、该中心的监测语料库会全年采集数据,从中产生当年的十大网络用语。
10、工程分2期进行,计划用20年建成中国首个2亿词级的蒙古语、达斡尔语、鄂温克语、鄂伦春语大型综合性语料库。
