领域大语言模型下的古籍词性标注应用研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

领域大语言模型下的古籍词性标注应用研究
朱丹浩;赵志枭;胡蝶;赵文华;孙光耀;王东波
【期刊名称】《科技情报研究》
【年(卷),期】2024(6)2
【摘要】[目的/意义]大语言模型的发展为古籍文本挖掘带来了新的思路,将大语言模型与古籍数字化、智能化相结合是新时代古籍工作的必经之路。

[方法/过程]文章使用《左传》词性标注语料,通过数据清洗和预处理,构建了一批高质量的词性标注指令数据,在此基础上,分别使用500、1 000、2 000、5 000条数据对大语言模型进行指令微调,并在另外1 000条数据上进行性能测试。

[结果/结论]实验结果表明,“荀子”系列模型在古籍文本词性标注任务上性能优于通用领域模型,在微调数据量达到5 000时,Xunzi-Baichuan2-7B模型表现出了最优性能,F1值达到81.67%。

【总页数】9页(P21-29)
【作者】朱丹浩;赵志枭;胡蝶;赵文华;孙光耀;王东波
【作者单位】江苏警官学院刑事科学技术系;南京农业大学信息管理学院
【正文语种】中文
【中图分类】G352
【相关文献】
1.大语言模型的技术发展及金融领域应用展望
2.大语言模型发展现状及其在金融领域的应用研究
3.生成式大语言模型在医疗领域的潜在典型应用与面临的挑战
4.大
语言模型在网络安全领域的应用探索5.生成式大语言模型关键技术在民航维修领域中的应用探索与挑战
因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档