诗词检索 诗词检索的心得
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
诗词检索诗词检索的心得
用过许多软件,多是赏析诗词。
若是学习写诗,我觉得最好的还是搜韵和诗词吾爱。
先说搜韵。
收录从先秦至近代诗词八十万余首,并收录有诗学、词学等各类电子书。
同时还有电子版"类书(见另一回答)",对于诗词创作十分有益。
有以下功能:校验格律,查询词牌,检索平水韵、词林正韵,查字典,积累典故词汇,辅助对仗,提供权威的创作修改建议。
当然最重要的还有教学视频。
使用体验:
首页
诗词吾爱是较常用的,
主要功能有:诗词格律检测、自动笺注、典故分析、繁简转换、组词、历代诗词检索。
古诗词检测小程序有哪些古诗词检测小程序有哪些古诗词检测小程序有:
1、我爱读诗词。
可以查询唐诗宋词,各个朝代的,有赏析,注释,解释。
2、古诗词查询小程序,里边有诗词文2万首左右。
3、汉语诗词宝典小程序提供古诗词内容检索,唐诗三百首,宋词三百首,小学生必背古诗词,古诗词翻译、注释、赏析。
如何从一个数据集按照关键词快速检索诗词?如何从一个数据集按照关键词快速检索诗词?对于数据集按照关键词快速检索功能性需求大致要考虑以下几点:数据是格式化的还是非格式化数据?要构建索引的原始数据,类型很多。
我把它分为两类,一类是结构化数据,比如MySQL中的数据;另一类是非结构化数据,比如搜索引擎中的网页。
对于非结构化数据,我们一般需要做预处理,提取出查询关键词,对关键词构建索引。
数据是静态数据还是动态数据?如果原始是一组静态数据,也就是说,不会有数据的增加、删除、更新操作,所以,我们在构建索引的时候,只需要考虑查询效率就可以了。
这样,索引的构建就相对简单些。
不过,大部分情况下,我们都是对动态数据构建索引,也就是说,我们不仅要考虑到索引的查询效率,在原始数据更新时,我们还需要动态的更新索引。
支持动态数据集合的索引,设计越来相
对更复杂些。
索引是存储在内存还是硬盘?如果索引存储在内存中,那技术要求的速度肯定要比存储的磁盘中的高。
但是,如果原始数据量很大的情况下,对应的索引可能也会很大。
这个时候,因为内存有限,我们可能就不得不将索引存储在硬盘中了。
实际上,还有第三种情况,那就是一部分存储在内存,一部分存储在磁盘,这样就可以兼顾内存消耗和查询效率。
单值查找还是区间查找?所谓单值查找,也就是根据查询关键词等于某个值的数据。
这种查询需求最常见。
所谓区间查找,就是查找关键词处于某个区间值的所有数据。
实际上,不同的应用场景,查询的需求会多种多样。
单关键词查找还是多关键词组合查找?比如,搜索引擎中构建的索引,既要支持一个关键词的查找,比如“数据结构”,也要支持组合关键词查找,比如“数据结构 AND算法”。
对于单关键词查找,索引构建起来相对简单些。
对于多关键词查找来说,要分多种情况。
像MySQL这种结构化数据的查询需求,我们可以实现针对多个关键词组合,建立索引;对于像搜索引擎这样的非结构数据的查询需求,我们可以针对间个关键词构建索引,然后通过集合操作,比如求并集、求交集等,计算出多个关键词组合的查询结果。
实际上,不同的场景,不同的原始数据,对于索引的需求也会千差万别。
诗词检索。