世界汉语教学

2020, v.34(01) 81-97

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

汉语文本可读性特征体系构建和效度验证
Development of Linguistic Features System for Chinese Text Readability Assessment and Its Validity Verification

吴思远;于东;江新;

摘要(Abstract):

本文研究如何利用汉语文本的语言特征对文本的可读性进行分析。首先从汉字、词汇、句法和篇章四个层面出发,构建了一个预测汉语文本可读性的多层面、多维度特征体系,该特征体系包含13个维度共104项指标。然后以12个年级的语文教材语料库为基础,通过建立机器学习模型考察不同层面、不同维度语言特征的预测能力。实验结果显示:汉字、词汇、句法和篇章四个层面中,基于词汇层面特征的模型准确率最高,基于篇章层面特征的模型准确率最低;13个维度中,预测准确率最高的前5个维度依次为汉字熟悉度、汉字多样性、词汇多样性、短语句法结构复杂度和词汇熟悉度。我们还发现,四个层面语言特征对低难度文本的预测能力均最强。

关键词(KeyWords): 汉语文本可读性;语言特征;机器学习;效度验证

Abstract:

Keywords:

基金项目(Foundation): 国家社科基金重大项目(项目批准号17ZDA305);; 教育部人文社会科学研究青年基金项目(19YJCZH230);; 北京语言大学一流学科团队支持计划(GF201906)的支持

作者(Author): 吴思远;于东;江新;

Email:

DOI:

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享