基于字特征的黄帝内经自动分词研究开题报告

 2023-01-07 10:52:08

1. 研究目的与意义

1.论文研究内容本论文以《黄帝内经》为样本,借助条件随机场统计模型对其进行基于字特征的自动分词,具体从以下几个方面展开:(1)《黄帝内经》简繁校对、词性标注(2)分词、中医术语细分(3)条件随机场模型(4)CRF分词原理(5)CRF的分词实验(6)实验结果的验证(7)小结以及待研究的内容本课题组将进一步完善《黄帝内经》中基本词以及中医术语词切分标注以及校对,建立起《黄帝内经》词切分标注语料库,继续探讨CRF标注性能的方法以及特征模板。

进一步细化中医术语词类体系,对中医术语体系进行扩展,从而便于中医术语的检索与查询。

2.论文研究意义中文信息处理技术在现代汉语领域建设中占据了一个举足轻重的地位,而分词又是中文信息处理技术的基础,该研究虽取得了一定的成果,但古代汉语信息处理还处于初步阶段。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 文献综述

3.研究现状《黄帝内经》又简称《内经》,此书最早被记载在《汉书.艺文志》,探讨本书成书的年代声音此起彼伏,国内外很多知名学者都认为《黄帝内经》成书于战国,是我国现存最早的中医典籍专著,在它汇编成书后,又经过了许多有志学者修订与补充。

其中主要有(1)隋.杨上善撰写《黄帝内经太素》,又简称《太素》,将《灵枢》和《素问》的162篇全部拆散,按其表示的内容性质,归纳为摄生、阴阳、脏腑、 腧穴、人合、 诊候、设方、营卫气、邪论、风论、九针、补养、伤寒、寒热、经脉、身度、症候、气论、杂病等19大类,每个大类又分割成若干小类,详加注解,有纲有目[1]。

(2)继上善之后,唐代王冰补注的《黄帝内经素问》,将《素问》论述养生之道的篇目,移至全书之首,主导全书,将自称得先师秘藏的大论补入已流失的第七卷中[2],显现更加完善。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 设计方案和技术路线

1.设计方案 (1)以郭霭春版《黄帝内经》为样本,借助条件随机场统计模型对其进行基于字特征的自动分词研究。

(2)基于条件随机场自动分词方法(3)对实验结果进行验证

4. 工作计划

2022年7月:确定选题;2022年9月:资料查阅,编写开题报告,开题报告答辩;2022年10-11月:进行数据处理,完成初稿;2022年11-12月:完善方法,对初稿进行修改并完成定稿;2022年12月:提交论文并进行预答辩;

5. 难点与创新点

(1)探讨《黄帝内经》中基本词以及中医术语词切分标注以及校对,建立起《黄帝内经》词切分标注语料库,。

进一步细化中医术语词类体系,对中医术语体系进行扩展,从而便于中医术语的检索与查询。

(2)继续探讨CRF标注性能的方法以及特征模板,优化其功能。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。