依托自然语言处理技术的中文文本分析平台


中文文本分析平台(Chinese Text Analysis Platform, CTAP)提供了一系列工具以帮助您对文本语料进行复杂度特征自动分析,分析结果可用于文本定级、可读性评估等不同任务。

本平台涵盖语料库管理、特征集构建、复杂度分析、可视化展示四大功能。语料库管理支持您建立自己的语料库,特征集构建支持您自由选择不同的特征,复杂度分析帮助您进行文本特征的自动计算,可视化展示可以让您清晰地看到不同特征的变化轨迹。不同模块间的结合可以使您的文本分析高度定制化。详情可见使用文档及公众号推文


欢迎您将使用体验及建议反馈给我们,同时也希望您能为本项目的开发和维护贡献自己的一份力量! 



邮箱:blcuicall@163.com

如果您使用了本项目的内容,或者认为本项目对您的研究有帮助,请引用本项目。

Yue Cui, Junhui Zhu, Liner Yang, Xuezhi Fang, Xiaobin Chen, Yujie Wang, and Erhong Yang. 2022.  CTAP for Chinese: A linguistic Complexity Feature Automatic Calculation Platform. In Proceedings of LREC 2022.

已引用 CTAP 的工作,可参见:

  1. Andrea Horbach, Joey Pehlke, Ronja Laarmann-Quante, and Yuning Ding. 2023. Crosslingual Content Scoring in Five Languages Using Machine-Translation and Multilingual Transformer Models. International Journal of Artificial Intelligence in Education.
  2. Zhang, Mi, Xudong Pan, and Min Yang. 2023. JADE: A Linguistics-based Safety Evaluation Platform for LLM. arXiv preprint arXiv:2311.00286.
  3. 朱君辉, 王梦焰, 聂锦燃, 杨尔弘, 王誉杰, 岳岩, 杨麟儿. 2023. 人工智能生成语言与人类语言对比研究—以ChatGPT为例. 第二十二届中国计算语言学大会.
  4. Yue Xu, Shaojie Geng, Liangjie Yuan, Wei Wei, and Zhimin Wang. 2023. Comparing Human and GPT Model in Chinese Tourist Text Simplification. 2023. In Proceedings of IALP 2023.
  5. Jiaxin Yuan, Cunliang Kong, Chenhui Xie, Liner Yang, and Erhong Yang. 2022. COMPILING: A Benchmark Dataset for Chinese Complexity Controllable Definition Generation. In Proceedings of CCL 2022.

CTAP

中文文本分析平台