文本语料

工业科幻文学语料库

汇集与工业、制造业、科技发展相关的中英文科幻文学作品,为风格分析、术语挖掘和跨语种对比研究提供文本资源。

规模建设中
中英文
2025
文本语料

理工科学术写作语料库

汇集化工、机械、电子等学校五大发展支柱专业的学术写作语料,总量超过 300 万字,用于理工科论文写作、术语和篇章结构研究。

3M+ 字
英文为主
2025
文本语料

人文社科学术写作语料库

包含语言学、文学、管理学等人文社科领域的学术写作文本,总量超过 300 万字,可用于学术体裁分析、跨学科写作比较与语用研究。

3M+ 字
英文为主
2025
文本语料

研究生学习者英语写作语料库

收录研究生在不同课程与任务中的英语写作文本,建设规模为 100 万字以上,用于学习者语料研究和写作能力发展分析。

1M+ 字
英语学习者
2025
语音语料

研究生学习者英语口语语料库

包含研究生在课堂讨论、展示、访谈等场景中的英语口语,以及相应的视频转录文本,建设规模在 50 万字以上。

500k+ 字转写
英语学习者
2025
多模态

多模态汉语口语语料库

以汉语口语为核心,包含 10 小时以上的视频素材及其转写文本、语音信号和多模态标注,可用于语音、手势与互动研究。

10+ 小时视频
汉语
2025

如何使用语料库

  1. 选择语料库:根据研究需求选择合适的语料库资源
  2. 在线检索:使用检索工具进行在线查询和分析(功能逐步开放)
  3. 申请下载:填写申请表单,说明使用目的
  4. 引用规范:在论文中正确引用语料库来源

注意:部分语料库需要学术授权才能下载使用,请提前申请。