基于智能投研提高券商投研能力的探讨
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Ԏᖜ᥉㉏ࣷⴒ䃳ः
ܳᲽⵁ酉
㻯◦ॵ⣝
ᮧ㘪䉱䃜ᣕ䔮 ᮧ㘪᥉㉏ᑂ᧻ 䲋㐀Ჱࡃᢛः
ᲱᐧͨҀڠ㈨㑾㐉 ࣾᣅڠ㖁θУ
᪴ႄࡃᆂ 㶕ᵩࣷఫᒏࡃᆂ
㜗♣䄚㼭ั⤳ឭᱜ ᗲᙌܳᲽឭᱜ
ⴒ䃳ఫ䅞ឭᱜ ᣕ⤳ ๔ᢛឭᱜ
㜗♣䄚㼭⩌ឭᱜ ज㻳ࡃឭᱜ
图 1 智能投研的业务流程
66
2019.06
金融实务
能够理解并运用人类的自然语言,简化人类 将自然语言转化为计算机语言的复杂过程。自 然语言处理可以大体分为两个领域 :自然语言 理 解(Natural Language Understanding,NLU) 和自然语言生成(Natural Language Generation, NLG)。自然语言理解是指机器能够理解自然 语言的意义。自然语言生成是指机器能够以 自然语言文本来表达其运算结果。
金融知识图谱的构建主要包括两个步骤, 即 :实体识别和关系构建。实体识别步骤中, 系统从新闻资讯、公司公告、券商研究报告等 海量的信息源中抓取实体。关系构建步骤中, 系统基于机器学习等方法发掘实体之间的各 种关系。对于非结构化信息的处理,在实体 识别和关系构建中都要用到自然语言处理和 深度学习等技术。
(三)因果推理(Causal Inference) 因果推理被一些学者认为是通向真正智 能机器的必经之路,它源于对物理系统中各 变量之间的相互确定关系的讨论,目前已经 推广到讨论事件之间的决定关系,但其本质 仍是变量值之间的相互确定关系。 因果推理过程包括两个步骤 :首先根据 已有的各种关于系统的结构、行为和功能的 知识构造出因果关系图,主要实现方法基于 因果顺序理论、组合建模方法等。然后是基 于因果关系图和关于系统的原有知识对变量 行为进行传播,通过回顾重要的行为序列便可 以对系统行为做出解释。通过因果推理,机 器不仅能把相关的事物联系起来,还能够推 理原因为什么能引发结果,从而可以查询某
自然语言理解的研究可以分为四个层面, 即 :词典构造、语法分析、语义分析和篇章 分析。词典构造是指构造包含尽量多的语法 信息、语义信息、语用信息等的机器语言词 典,将其作为构建自然语言理解平台的基础, 此 方 面 的 研 究 成 果 有 WordNet、FrameNet、 MindNet、HowNet 等。语法分析是指对自然语 言进行表层的形式化分析,包括词法分析和句 法分析两部分。词法分析是将自然语言进行切 分,并将每个切分的词加上词性标记,它是句 法分析的基础。针对汉语的分词算法主要有三 类 :基于词典的方法、基于统计的方法和基于 理解的方法 ;词性标注方法主要可分为三类 :
自然语言生成包括内容规划、句子规划 和表层生成三个基本功能。内容规划主要决定 生成的文本所要表达的内容,并对已确定内 容进行结构化描述,使之符合阅读理解习惯, 主要的技术有 :模式生成技术、短语 / 规划扩 展技术等。句子规划进一步明确定义规划文 本的细节,主要以黑板模型和管道模型两种 方式实现。表层生成是将句子规划后的文本 描述映射至由文字、标点和结构注解信息组 成的表层文本。
65
金融实务
2019.06
间的内在逻辑,这对研究人员的信息处理能 力、逻辑分析能力、专业知识水平等均提出 了较高的要求。在观点呈现步骤中,人工整合、 发布研究结果用时较长,使整个流程的时滞 性更强。
三、智能投研的业务流程 智能投研的业务流程从本质上看与传统 投研并没有显著的不同,但它基于人工智能、 大数据等技术可以帮助传统投研中的每一步 提高效率、优化质量,如图 1 所示。 在信息搜索及知识提取步骤中,智能投 研基于自然语言处理技术实现智能资讯推送 和智能搜索引擎,从而使系统具有较强的联 想能力,能够理解更为通俗化、模糊化的搜 索表达。智能投研基于自然语言处理技术和情 感分析技术实现对非结构化数据的提取,通 过实体提取、段落提取、关系提取、表格提 取等方式从海量信息,如交易数据、卫星照片、 天气数据、快递数据及社交媒体数据等中抓 取相关信息,并将其转化为机器可以识别的 结构化数据,使信息来源更加广泛。 在分析研究步骤中,智能投研基于知识
在金融行业,借助自然语言处理,人们 可以从消息面数据中挖掘出舆情因素对市场 后续走势的影响,通过充分的信息获取辅助 尽职调查,自动生成研究报告等。
(二)知识图谱(Knowledge Graph) 知 识 地 图 的 概 念 由 英 国 情 报 学 家 B. C. Brooks 在《情报学基础》中最早提出,它是指 将知识结构绘制成以各个知识单元概念为节 点的地图。知识图谱是知识地图的一种高级表 现形式,是利用信息可视化技术构建的一种知 识之间关系的语义网络,它是人工智能领域重 要的基础设施。构建知识图谱的理论主要包 括 :引文分析理论、词频分析理论、社会网 络分析理论等,关键技术主要包括:寻径网络、 自组织特征映射、力矢量布局算法、最小生 成树算法等。
情感分析(Sentiment Analysis)是自然语 言处理中一个重要的研究方向,是指对带有 情感色彩的主观性文本进行分析、处理、归 纳和推理的过程。情感信息的提取是指在文 本中抽取有价值的情感信息。情感信息的分 类主要包括主、客观信息的分类和主观信息 的情感分类。情感信息检索可以检索出与主 题相关且包含情感信息的文档。情感信息归 纳可以将大量主题相关的情感文档进行自动
关键词 :智能投研 自然语言处理 知识图谱 因果推理 中图分类号 :F832.5 文献标识码 :A 文章编号 :1009 - 1246(2019)06 - 0065 - 07
一、智能投研的定义 投研即投资研究,是指通过对金融市场、 行业、公司进行基本面分析,建立财务分析 模型、估值模型等,从而确定证券的合理价值。 同时,通过技术分析、演化分析等对具体投 资操作的时间和空间进行判断。最终,将以 上两方面的研究结果用于投资决策。 智能投研与传统的人工投研相对,是指 通过人工智能、大数据等技术对数据、事件、 观点等信息进行综合性、自动化的处理和分 析,提高投资决策人员的工作效率和分析、投 资能力。 二、传统投研的流程及其局限性 传统的投资研究流程一般包括三个步骤 : 一是信息搜索及知识提取 :通过互联网信息 门户、金融终端、书籍文献、公司网站等途 径获得市场、行业、公司、产品的基本信息,
并提取信息中的数据及知识 ;二是分析研究 : 基于第一步中得到的知识,运用逻辑推演、运 算等方法提炼出观点 ;三是观点呈现 :将分 析研究结果以合适的方式呈现出来。
在以上的各个步骤中,传统的方式均存 在着一定的局限性。在信息搜索及知识提取步 骤中,人工获取信息往往不够及时,并且提 取信息的过程与研究人员的知识体系有很大 的关系,使得信息往往不够完整,随机性较强, 提取到的数据和知识也不能较好地体现被研 究事物的全貌。同时,研究人员在查询资料时 如果想要获得较为理想的结果需要十分专业、 准确的搜索表达,这对研究人员的知识的全 面性提出了较高的要求。在分析研究步骤中, 人工分析易受到情绪、偏见、知识体系等方面 的影响,稳定性较差。同时,研究人员要在大 量的信息、数据之间找寻关联,学习事物之
种干预会如何影响因果关系。 五、券商开展智能投研业务的意义 从产品和业务角度看,智能投研是金融
行业的发展动向之一。智能投研可以有效拓展 信息的获取渠道,对大量信息进行即时处理, 从而提高分析的全面性,同时降低研究人员对 于某细分领域的专业知识门槛 ;智能投研可以 完整、理性地揭示事物之间的联系,避免情绪、 偏见、知识体系等方面的影响,稳定性较佳 ; 智能投研可以即时呈现观点,此外对于某些涉 及大量固定格式的撰写工作,如合规性文件、 IPO 文件、研究报告等文件中的某些章节,智 能投研可以完成自动化生产。在以上的各个环 节中,智能投研可以为投研人员节约大量的 时间和精力用于思考和推理等高级分析活动。
ড়ӭԈ
Џԧ ݀ৌ
ゲѝᇍ
݀ৌ
݀ৌ
݀ৌ
图 3 金融领域知识图谱示意图
68
2019.06
金融实务
在金融领域,知识图谱中的节点可以表 示公司、产品、证券等实体 ;边表示实体之间 的关系,可以是上下游关系、竞争或合作关系、 担保关系、股权关系等,如图 3 所示。知识图 谱可以将金融实体之间的复杂关系以网络的 方式直观地呈现出来,当实体或关系发生变 化时,它还能基于关系的传导分析得出可能 造成的影响,从而可以协助投研人员掌握更 全面的信息,进行更深层次的研究。
2019.06
金融实务
基于智能投研提高券商投研能力的探讨
wk.baidu.com李嘉宝
摘要 :随着自然语言处理、机器学习、生物识别等 AI 技术在金融领域的深入运用,金融业 衍生出多种创新业态和应用场景。对于资金管理领域而言,面对券商等 B 端机构的智能投研将 是未来发展方向之一。本文总结了智能投研的业务流程,分析智能投研运用的金融科技原理和 具体实践案例,并基于智能投研的现存问题,提出了通过智能投研提升券商投研能力的相关建议。
㜗♣䄚㼭⤳㼐 䃺ڥᲱ䕍 䄚∂ܳᲽ 䄚ͶܳᲽ ヴ」ܳᲽ
㜗♣䄚㼭ั⤳⮱Ꮑ⩕
๔ᢛܳᲽ ᬒᔄᡃᣅࣷܳᲽ
㜗ߕᦅ㺮 䄚䴠䃳ݘ
ᱧக㔨䃾 䬛め㈨㐌 Ԏᖜᷭ㉏
ćć
㜗♣䄚㼭⩌ ڲღ㻱ܿ ऒၽ㻱ܿ 㶕ᅯ⩌
图 2 自然语言处理的技术基础及应用领域
݀ৌ կᑨଚ
կᑨଚ
݀ৌ
ᅶ᠋
կᑨଚ
݀ৌ
݀ৌ
ᅶ᠋
݀ৌ
կᑨଚ
图谱技术,可以从公司公告、券商研究报告、 第三方机构报告、新闻等资源中自动批量提取 出公司的股东、子公司、供应商、客户、合作 伙伴、竞争对手等信息,构建出研究主体的关 系网络。基于因果推理和大数据技术,智能投 研可以在海量的事件之中发现有关联的事件。
在观点呈现步骤中,智能投研基于自然 语言生成技术可以实现对研究结果的文字化 展示,基于可视化技术可以将研究结果的数 据自动转化为表格或图形化展示,并最终进 行自动排版。
基于规则的方法、基于统计的方法和混合方 法。句法分析是将句子的词语序列映射为句 法成分的层次结构,目前主要的句法理论有 短语结构语法、扩充转移网络、词汇功能语 法、功能合一文法和依存语法等。语义分析是 在语法分析的基础上理清句子的语义结构关 系,对整个句子的语义进行组合和表达并说明 句子中词语搭配上存在的各种语义限制条件。 主要的语义分析理论有义素分析法、格语法、 语义网络、优选语义学等。篇章分析是研究 句子之间的关系以及整个篇章中包含的知识, 主要的篇章分析方法有框架理论、脚本理论、 故事语法、修辞结构理论等。
四、智能投研用到的金融科技原理详解 在智能投研的业务流程中,自然语言处 理、知识图谱和因果推理等技术扮演着重要 的角色,并且他们都是人工智能领域的关键 技术,本文对这些技术的原理进行较为详细 的解释。 (一)自 然 语 言 处 理(Natural Language Processing,NLP) 自然语言处理是人工智能和语言学领域 的分支学科,指通过计算机通过算法模拟人 类的自然交流,如写作、说话等过程,从而
自 然 语 言 理 解 的 研 究 起 源 于 1954 年, Georgetown 大学与 IBM 公司合作,第一次通 过机器将俄语翻译成英语,展示了机器翻译 的可能性。20 世纪 70 年代前后,人们提出了 有关自然语言表示和处理的理论和方法,并 将其扩展到人机接口、专家系统等应用领域。 20 世纪 90 年代以后,随着互联网技术和移动 互联网技术的兴起,自然语言理解获得了快速 的发展,出现了在线机器翻译、跨语言的信息 搜索、多语言通信系统、计算机辅助写作系统, 面向移动设备的自然语言接口等。
67
金融实务
2019.06
分析和归纳并得出情感分析结论。 自然语言处理的常用实现算法包括 :隐
含马尔科夫模型、条件随机场、神经网络算法 等,它主要应用在大数据分析、日志挖掘及分 析、自动摘要、文本分类、信息提取、文本 朗读 / 语音合成、语音识别、信息检索、文字 校对、机器翻译、问答系统等领域,可以成 为各行各业特定场景的解决方案,如图 2 所示。
从机构角度看,大型金融机构为保持竞 争力,依靠其平台优势对智能投研等新技术具 有快速试错的能力,可以进行积极探索,获 取智能投研产品的主要方式有自建技术、与 供应商合作、通过并购获得能力等 ;中小金 融机构通过智能投研可以以较低的成本提升 自身投研效率与效益,可以通过对国外案例 及国内大机构的模式进行学习和验证,从而 决定开展智能投研业务的时机。