【CN110136712A】实现智能语音AI功能的方法及装置【专利】
人工智能语音助手的设计原理与实现方法
人工智能语音助手的设计原理与实现方法随着人工智能技术的快速发展,语音助手已经成为我们生活中不可或缺的一部分。
从手机、智能音箱到车载导航系统,各种应用都开始使用语音助手来实现与用户的交互。
但是,人工智能语音助手的设计和实现涉及到多个复杂的领域,包括语音识别、自然语言处理和机器学习等。
本文将介绍人工智能语音助手的设计原理和实现方法,以便读者能够更好地了解其背后的技术原理。
1. 语音识别语音识别是人工智能语音助手的核心技术之一。
它主要涉及将人类语言转化为机器可识别的文字信息。
语音识别的过程包括语音信号的采样、特征提取、声学模型的训练和解码等步骤。
具体而言,采样阶段将语音信号转化为数字信号,特征提取阶段使用傅里叶变换等技术将语音信号转化为频谱信息,然后声学模型使用机器学习算法对不同音素进行训练,最后解码阶段根据特征信息将语音信号转化为文字信息。
2. 自然语言处理自然语言处理是人工智能语音助手的另一个重要组成部分。
它主要涉及将用户的自然语言输入转化为机器可理解的形式,并进行意图识别和语义理解。
在自然语言处理过程中,首先要进行分词,将连续的文本切分成有意义的词汇单位。
接下来,需要进行词性标注,确定每个词的词性和语法关系。
然后,需要进行语法分析,分析句子的结构和语义关系。
最后,进行语义理解,将用户的输入转化为机器可处理的语义表示。
3. 机器学习机器学习是人工智能语音助手设计和实现过程中的关键技术之一。
它主要用于对大量的语音和文本数据进行训练和优化,以提高语音识别和自然语言处理的准确度和性能。
机器学习算法主要分为有监督学习和无监督学习两类。
在人工智能语音助手的设计中,有监督学习算法常用于声学模型的训练和优化,而无监督学习算法则常用于语义理解和意图识别的模型训练。
4. 知识图谱知识图谱是人工智能语音助手设计和实现中的另一个重要技术。
它主要用于构建和管理大规模的知识库,用于语义理解和答案生成。
知识图谱是一种基于图结构的知识表示方式,通过实体和关系的连接来表示不同概念之间的关联关系。
AI语音识别技术专利
AI语音识别技术专利随着科技的发展,人工智能(AI)在各领域都展现出了巨大的潜力。
其中,AI语音识别技术作为一项重要的研究领域,正在迅速崛起和应用。
本文将介绍AI语音识别技术的专利,探讨其现状、挑战和未来发展。
一、AI语音识别技术概述AI语音识别技术是指通过计算机模拟人类的听觉器官和认知能力,将语音信号转化为文本或命令的一项技术。
该技术结合了自然语言处理、机器学习和人工智能等领域的知识,旨在实现计算机对自然语言的准确理解和处理。
二、AI语音识别技术的专利现状近年来,AI语音识别技术逐渐成为人们研究和应用的热点领域。
许多公司和研究机构纷纷投入大量资源进行技术研发,并申请了相关专利。
这些专利涉及语音识别算法、语音训练模型、语音识别设备等各个方面。
在专利申请中,AI语音识别技术的核心创新点主要集中在以下几个方面:1. 稳定性和可靠性的提升:通过优化算法和模型,降低语音识别的误识率,提高系统的稳定性和可靠性。
2. 多语种和多方言支持:针对不同语种和方言,设计相应的语音训练模型和识别算法,实现精准、准确的语音识别。
3. 远场语音识别:解决语音识别在复杂环境下的问题,如噪音干扰、距离远近、语速变化等,在远场环境中实现高质量的语音识别。
4. 语音识别与其他领域的结合:将语音识别技术与其他领域相结合,如智能家居、自动驾驶、医疗诊断等,开发出更多实用的应用。
三、AI语音识别技术的挑战虽然AI语音识别技术有着广阔的应用前景,但也面临着一些挑战。
1. 多样性与个性化:不同人的发音、语速、语调等存在差异,如何准确地进行个性化的语音识别是一个难题。
2. 环境干扰:在嘈杂的环境中,语音识别系统容易受到噪音的影响,导致识别率下降。
3. 隐私和安全:语音识别技术需要处理大量的语音数据,如何保护用户的隐私和数据安全是一个重要问题。
4. 法律与伦理问题:AI语音识别技术的应用范围广泛,但也涉及到一些法律与伦理问题,如言语辨别、个人隐私等。
智能语音助手专利
智能语音助手专利近年来,随着人工智能技术的快速发展,智能语音助手已经成为我们日常生活中不可或缺的一部分。
无论是智能音箱、智能手机还是智能汽车,智能语音助手都能够为我们提供便捷的语音交互服务。
然而,智能语音助手的背后涉及到大量的技术专利,这些专利不仅对技术进步具有重要意义,还能保护创新者的合法权益。
本文将探讨智能语音助手相关的专利问题。
一、智能语音助手的技术原理智能语音助手是基于人工智能和自然语言处理技术的一种智能交互系统。
它通过语音识别、语言理解和语音合成等关键技术,能够与用户进行自然语言对话,并根据用户的需求提供相应的服务。
例如,我们可以通过语音指令告诉智能语音助手要播放音乐,它会根据我们的指令自动搜索并播放所需的音乐。
智能语音助手的核心技术原理是将语音信号转化为文本,然后通过自然语言处理技术进行语义理解,并最终生成相应的服务输出。
二、智能语音助手相关专利的重要性智能语音助手作为一项创新的技术,涉及到多个领域的专利保护。
首先,语音识别技术是智能语音助手的基础,它能够将声音信号转化为可识别的文本。
而实现高精度的语音识别技术需要大量的数据训练和算法优化,这涉及到语音识别算法、数据处理方法等方面的专利保护。
其次,语言理解技术对于智能语音助手的功能实现至关重要。
语言理解涉及到自然语言处理、知识图谱、机器学习等多个领域,各个方面的技术创新都需要通过专利来保护。
此外,智能语音助手还涉及到语音合成、情感识别、交互设计等多个方面的技术,在这些方面的创新同样需要通过专利保护。
三、智能语音助手专利的申请与保护针对智能语音助手相关的技术创新,创新者可以通过申请专利来保护自己的合法权益。
首先,创新者需要针对自己的技术发明进行充分的调研和项目规划,确保其具有技术创新性和市场应用性。
然后,创新者可以委托专利代理机构或律师事务所进行专利申请。
专利申请需要提供详细的技术描述、专利要求以及相关附图等。
一旦专利被授予,创新者就可以获得一项合法的专利权,并通过专利权维护自己的权益。
智能语音识别系统专利
智能语音识别系统专利专利名称:智能语音识别系统专利摘要:智能语音识别系统专利是一项基于人工智能技术的技术创新。
通过将语音信号转化为可识别的文本信息,该系统可以实现实时语音识别、语音指令控制、语音交互等功能。
本文将介绍智能语音识别系统的工作原理、应用场景、技术特点及未来发展方向。
一、技术原理智能语音识别系统基于深度学习算法和语音信号处理技术,通过建立声学模型和语言模型来实现语音信号到文本信息的转换。
系统首先对语音信号进行分析,提取声音特征并进行预处理。
然后,利用训练好的深度神经网络模型对声学特征进行识别,将其转化为对应的文本信息。
最后,系统通过后处理模块对识别结果进行校正和优化,提高识别准确率。
二、应用场景智能语音识别系统广泛应用于多个领域,包括但不限于以下几个方面:1. 虚拟助手:智能语音识别系统可以与虚拟助手相结合,实现语音指令控制、信息查询、日程安排等功能。
用户只需通过语音提问或下达指令,虚拟助手即可迅速响应并提供准确的答案或完成相应任务。
2. 语音转写:智能语音识别系统可以将会议记录、讲座内容等口述信息转换为文本,提高文档处理效率。
这在学术研究、法律咨询等领域具有广泛应用前景。
3. 语音翻译:智能语音识别系统可以实现实时的语音翻译功能,将一种语言的口语信息转换成另一种语言的文本输出。
这在国际交流、旅行等场景中非常实用。
4. 语音助听:智能语音识别系统结合助听设备,可以提供即时的语音转写和语音增强功能,帮助听障人士更好地与他人进行沟通。
三、技术特点1. 高度准确性:智能语音识别系统利用深度学习算法进行训练和优化,识别准确率高达90%以上,有效提升了语音识别的质量。
2. 实时性能好:智能语音识别系统能够在极短的时间内完成语音识别任务,保证实时性能。
3. 多语种支持:智能语音识别系统支持多种语种的语音输入和输出,具备良好的语言适应性。
4. 用户友好性:智能语音识别系统具备良好的用户交互界面,方便用户进行配置和操作,提升用户体验。
人工智能语音助手的工作原理与实现技巧
人工智能语音助手的工作原理与实现技巧人工智能(AI)语音助手是一种可以通过语音指令与用户进行交互的智能程序。
它能够理解和回应用户的语音指令,提供各种功能和信息。
人工智能语音助手的工作原理涉及语音识别、自然语言处理和语音合成等技术。
在本文中,我们将介绍人工智能语音助手的工作原理和实现技巧。
首先,人工智能语音助手的工作原理之一是语音识别。
语音识别技术允许语音助手将用户的语音指令转换为可理解的文本。
它使用声音传感器捕捉用户的语音输入,并将其转换为数字表示,然后使用语音识别算法将其转换为文本。
这种算法通常基于机器学习和深度学习技术,通过训练大量的语音数据来提高准确性和识别率。
语音识别的准确性对语音助手的性能至关重要,因为它直接影响了助手对用户指令的理解能力。
其次,人工智能语音助手的工作原理还包括自然语言处理(NLP)。
NLP技术使语音助手能够理解用户的语义和意图。
它通过将用户的文本指令转换为结构化的语义表示,以便进一步处理和响应。
NLP涉及词法分析、句法分析、语义分析等技术,用于抽取关键信息、理解句子结构以及识别用户的意图和需求。
NLP的发展和改进是通过训练大规模语料库和使用高性能计算技术来提高的。
最后,人工智能语音助手通过语音合成技术将其回应转换为可听的语音输出。
语音合成技术通过生成合成音频来模拟人类的语音,使语音助手能够以自然的方式与用户进行交流。
这种技术通常基于文本到语音(TTS)技术,使用预先录制的语音片段或合成音频来生成声音。
语音合成的质量对语音助手的用户体验至关重要,因此该领域的研发也在不断推进。
实现一个高效的人工智能语音助手需要综合运用语音识别、自然语言处理和语音合成等专业技术,并将其整合在一个稳定的系统中。
以下是一些实现人工智能语音助手的技巧和建议:首先,准确的语音识别是关键。
为了提高语音识别的准确性,可以使用大量的训练数据进行模型训练,并使用适当的算法和技术进行优化。
还可以考虑使用远场麦克风、降噪技术和声学模型的改进来提高语音输入的质量。
一种实现语音识别功能的方法及装置[发明专利]
专利名称:一种实现语音识别功能的方法及装置专利类型:发明专利
发明人:林俊萱
申请号:CN201210370145.1
申请日:20120927
公开号:CN103701981A
公开日:
20140402
专利内容由知识产权出版社提供
摘要:本发明公开了一种实现语音识别功能的方法,该方法包括:设置移动终端机身的姿态参数与语音识别模式的对应关系;如移动终端上的重力感应器检测到移动终端机身的姿态参数的变化满足语音识别模式切换的条件,则进行语音识别模式的切换,在切换后的语音识别模式下进行语音识别。
本发明通过自适应切换移动终端的语音识别模式,能够使移动终端的语音识别功能最大限度地解放用户的双手,并且节省耗电量。
本发明还公开了一种实现语音识别功能的装置。
申请人:中兴通讯股份有限公司
地址:518057 广东省深圳市南山区高新技术产业园科技南路中兴通讯大厦法务部
国籍:CN
代理机构:北京安信方达知识产权代理有限公司
更多信息请下载全文后查看。
使用人工智能开发技术实现智能语音助手的步骤
使用人工智能开发技术实现智能语音助手的步骤一、引言人工智能(Artificial Intelligence,AI)作为一门前沿科技,正日益渗透到我们的生活中。
智能语音助手作为AI的重要应用之一,已成为我们手机、电脑、智能音箱等设备中的常见功能。
本文将介绍使用人工智能开发技术实现智能语音助手的步骤和相关技术。
二、语音识别技术语音识别技术是智能语音助手的核心技术之一。
它能够将人类的语音转换为可被计算机理解的文本信息。
在开发智能语音助手时,需要选择合适的语音识别引擎,并根据需求进行相应的配置和开发。
目前较为常用的开源语音识别引擎包括百度的DeepSpeech、Google的Speech-to-Text等。
三、自然语言处理技术自然语言处理技术是智能语音助手的另一个关键技术。
它能够将用户的文本或语音指令进行语义解析和理解,并作出相应的响应和反馈。
在开发自然语言处理模块时,可以借助开源框架如NLTK、spaCy等,利用机器学习算法和语料库进行模型训练和优化,从而提高对用户指令的准确性和智能化水平。
四、对话管理技术对话管理技术是实现智能语音助手具备持续性对话能力的关键。
它能够帮助语音助手理解并管理多轮对话,并根据用户的需求和上下文进行合理回应。
对话管理技术可以借助强化学习、循环神经网络等技术进行模型构建和训练,使语音助手具备智能化的对话处理和响应能力。
五、语音合成技术语音合成技术是智能语音助手的输出环节,它能将文本信息转换为逼真的语音输出。
通过语音合成技术,语音助手可以将查询结果、提醒事项等信息通过声音的形式传达给用户。
目前市面上已有较成熟的语音合成引擎可供使用,如百度的DeepSpeech、Google的Text-to-Speech等。
六、与硬件设备的接入智能语音助手通常需要与硬件设备进行集成和接入,以实现对硬件设备的控制和操作。
例如,语音助手可以通过语音命令控制智能家居设备的开关、调节音量等。
在与硬件设备的接入方面,需要有相应的开发文档和接口供开发者使用,并且要按照设备的特性进行适配和开发。
智能语音助手人工智能技术实现语音交互
智能语音助手人工智能技术实现语音交互智能语音助手是一种基于人工智能技术实现的语音交互系统。
它通过语音识别、语音合成、自然语言处理等技术,能够与用户进行语音对话,执行各种指令和提供相关的服务。
本文将介绍智能语音助手的技术原理和实现方式。
一、语音识别技术智能语音助手的语音识别技术是其核心功能之一。
语音识别技术可以将用户的语音输入转化为可理解的文本形式。
它依赖于声音信号的特征提取和模式匹配。
通常,语音识别技术可以分为离线语音识别和在线语音识别两种方式。
离线语音识别是指将输入的语音信号转化为文本形式后再进行处理。
这种方式通常需要在智能语音助手设备上安装较为庞大的语音识别模型,并通过对识别结果进行离线处理来提高识别速度和准确性。
在线语音识别则是指将用户的语音输入通过网络传输进行实时转化。
用户的语音信号会通过网络传输到云端服务器进行识别,然后将结果返回给用户。
这种方式具有实时性和准确性较高的优势,但对网络连接的稳定性要求较高。
二、语音合成技术语音合成技术是指将文字信息转化为语音信号的过程。
智能语音助手通过语音合成技术,将文字回复转化为声音输出给用户。
语音合成技术目前有多种实现方式,包括基于规则的合成方法和基于统计的合成方法。
基于规则的合成方法是通过预先定义的音素、音节和语调等规则来合成语音。
这种方法需要大量人工参与和规则的设计,因此合成结果更加自然和流畅,但可变化性较差。
基于统计的合成方法则是通过对大量语音样本进行分析和训练,利用统计模型来生成语音。
这种方法不需要人工规则,能够更好地适应用户的需求和个性化特点,但合成结果可能不如基于规则的方法自然。
三、自然语言处理技术自然语言处理技术是智能语音助手实现语音交互的关键。
它通过分词、语法分析、语义理解等方法,对用户的语音输入进行解析和理解,从而确定用户的意图和需求。
在语音助手的自然语言处理过程中,还需要进行对话管理和对话生成等操作。
对话管理决定系统如何回应用户的输入,可以根据预定的规则或者基于机器学习的方法进行决策。
人工智能语音助手专利
人工智能语音助手专利现今,随着科技的迅猛发展,人工智能(Artificial Intelligence,简称AI)技术已经成为引领智能化时代的关键。
其中,人工智能语音助手作为AI技术的一项重要应用,正日益受到广大用户和企业的青睐。
为了保护和推动相关技术的发展,专利法律在人工智能语音助手领域起到了至关重要的作用。
本文将以人工智能语音助手专利为主题,讨论其重要性、技术创新以及专利保护等相关内容。
一、人工智能语音助手的重要性随着智能手机以及智能家居市场的迅速崛起,人工智能语音助手在我们的日常生活中变得越来越普遍。
人们可以通过语音指令来实现手机操作、智能家居控制、信息查询等功能,极大地提高了用户的使用便利性和生活效率。
人工智能语音助手的兴起不仅改变了用户的生活方式,还对商业模式和市场开拓产生了重要影响。
二、人工智能语音助手的技术创新人工智能语音助手的成功运作离不开背后复杂的技术支持。
在语音识别技术方面,由于不同用户的发音差异、语速变化等问题的存在,研发人员需要通过深度学习、自然语言处理等方法,提高语音识别的准确性和稳定性。
此外,人工智能语音助手还需要具备智能问答、语义理解、情感分析等高级技术,以更好地满足用户的需求。
技术创新的持续推进是人工智能语音助手能够不断提升用户体验和拓宽应用领域的重要保障。
三、人工智能语音助手专利保护的意义专利是保护创新技术的法律手段,对于人工智能语音助手技术同样适用。
专利保护能够鼓励企业在技术创新上进行持续投入,并为其提供经济利益回报,从而推动人工智能语音助手技术的发展。
另外,专利保护还能够阻止他人未经许可使用相关技术,维护企业的市场竞争优势。
因此,专利保护在人工智能语音助手领域具有重要的意义。
四、人工智能语音助手专利的申请流程在进行人工智能语音助手专利申请时,以下是一般的申请流程:1. 技术分析:对所需要申请专利的人工智能语音助手技术进行充分研究和分析,确定其创新点和实际应用价值。
人工智能开发技术如何实现智能语音助手
人工智能开发技术如何实现智能语音助手随着科技的不断进步和人们对便捷高效生活的追求,智能语音助手逐渐成为现代人生活中不可或缺的一部分。
无论是手机上的Siri、小爱同学,还是智能音箱中的Alexa、Google Assistant,它们都在人工智能技术的支持下,为用户提供了方便快捷的语音交互功能。
那么,人工智能开发技术如何实现智能语音助手呢?本文将对此进行探讨。
一、语音识别技术实现智能语音助手的核心技术之一是语音识别技术。
语音识别技术是指将人的语音信号转换为机器可理解的文本或命令。
具体而言,语音识别技术的实现通常包括两个关键步骤:声学建模和语言建模。
声学建模是指将语音信号转换为声学特征,以便机器进行处理和识别。
这一过程涉及到声音的频谱特征提取、噪音抑制和音频对齐等技术方法。
通过对大量的语音数据进行训练和建模,可以提高语音识别系统对不同说话人、语境和语速的适应能力。
语言建模是指基于语言统计学和自然语言处理技术,对识别结果进行进一步的处理和优化。
它主要关注的是在给定语音输入的情况下,预测用户可能会说的下一个词或短语。
语言建模可以通过分析语料库中的语言规律和模式来提高语音识别的准确性和流畅性。
二、自然语言处理技术除了语音识别技术,实现智能语音助手还需要自然语言处理技术的支持。
自然语言处理技术是指将人类语言转化为机器可以理解和处理的形式的一系列技术方法。
它可以帮助语音助手理解用户的语义和意图,并生成相应的回复。
自然语言处理技术的核心任务包括语音理解、语义分析和语音合成。
语音理解是指将用户的语音输入转换为机器可理解的语义表示。
它可以通过词性标注、句法分析和语义解析等技术方法来实现。
语音理解的目标是提取出用户意图和关键信息,为后续的处理和回复提供基础。
语义分析是指对语音输入进行进一步的语义解析和推理。
它可以通过知识图谱、语义网络和深度学习等技术方法,对用户的意图进行更加深入和准确的理解。
语义分析的目标是尽可能准确地捕捉用户的需求,并生成相应的回复或行动。
智能语音助手技术的开发与实现方法分享
智能语音助手技术的开发与实现方法分享智能语音助手技术作为一种新兴的人工智能应用,在我们的日常生活中起到了越来越重要的作用。
通过语音识别、自然语言处理和机器学习等技术手段,智能语音助手可以听懂用户的指令、回答问题、提供服务,甚至能够模拟人类的交流方式进行对话。
本文将分享智能语音助手技术的开发与实现方法。
首先,智能语音助手的开发离不开强大的语音识别技术。
语音识别技术是指将人类语音信息转化为可理解的文本信息的过程。
在智能语音助手的开发中,我们可以借助各种开源的语音识别引擎,如Google的Speech Recognition和百度的DeepSpeech等。
这些引擎基于深度神经网络和机器学习算法,通过大规模的训练数据集对语音进行分析和判断,并输出相应的文本结果。
其次,在实现智能语音助手的时候,自然语言处理技术也是非常重要的一环。
自然语言处理是指对人类语言进行分析和理解的技术。
在智能语音助手中,我们需要将用户的语音指令转化为机器可理解的指令,并提取其中的关键信息,以便进行后续的处理和回答。
为了实现这个目标,我们可以使用自然语言处理工具包,如NLTK和spaCy,来进行词法分析、句法分析和语义分析等任务。
另外,智能语音助手的实现还需要借助机器学习技术。
机器学习是指通过训练算法模型,从大规模数据中学习和提取知识,并用于智能决策和行为预测的技术。
在智能语音助手中,我们可以利用机器学习算法来训练模型,以实现语音识别的准确性和语义理解的智能化。
常用的机器学习算法包括决策树、支持向量机和深度神经网络等。
此外,深度学习技术在语音识别和自然语言处理领域也表现出了强大的潜力。
除了以上提到的关键技术,智能语音助手的实现还需要考虑以下几个方面。
首先是响应时间的优化,即在用户发出语音指令后,智能语音助手需要迅速作出反应,提供准确的答案或服务。
其次是用户界面的设计,智能语音助手应具备友好的交互界面,方便用户使用,并提供多样化的服务功能。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910376683.3
(22)申请日 2019.05.07
(71)申请人 甄十信息科技(上海)有限公司
地址 200241 上海市闵行区紫星路588号2
幢4015室
(72)发明人 曾景文
(74)专利代理机构 上海百一领御专利代理事务
所(普通合伙) 31243
代理人 王奎宇 甘章乖
(51)Int.Cl.
G10L 15/22(2006.01)
G10L 15/18(2013.01)
G10L 15/30(2013.01)
H04L 12/58(2006.01)
H04L 29/08(2006.01)
(54)发明名称
实现智能语音AI功能的方法及装置
(57)摘要
本发明的目的是提供一种实现智能语音AI
功能的方法及装置,本发明通过从设备端获取语
音流数据,并将所述语音流数据发送至第三方语
音AI服务器;接收所述第三方语音AI服务器识别
所述语音流数据后反馈的对应的AI服务回复数
据;对所述AI服务回复数据进行解析,得到AI服
务文本数据和AI服务语音数据并发送给所述设
备,能够实现非智能设备或老旧平台的设备,能
够通过中转服务器迅速接入第三方语音AI服务
器的语音AI服务功能,流畅使用智能语音服务,
使智能语音服务能够在非智能设备上成功商用。
中转服务器可根据需求切换第三方AI服务厂商,
对设备无影响,
无须设备重发固件版本。
权利要求书2页 说明书8页 附图1页CN 110136712 A 2019.08.16
C N 110136712
A
权 利 要 求 书1/2页CN 110136712 A
1.一种在中转服务器端实现智能语音AI功能的方法,其中,该方法包括:
从设备端获取语音流数据,并将所述语音流数据发送至第三方语音AI服务器;
接收所述第三方语音AI服务器识别所述语音流数据后反馈的对应的AI服务回复数据;
对所述AI服务回复数据进行解析,得到AI服务文本数据和AI服务语音数据并发送给所述设备。
2.根据权利要求1所述的方法,其中,所述中转服务器为Linux操作系统的云端服务器,从设备端获取语音流数据,并将所述语音流数据发送至第三方语音AI服务器,包括:与设备建立长连接链路;
通过所述长连接链路,从设备端获取各段压缩后的语音流数据,并将各段压缩后的语音流数据解压后,使用第三方语音AI服务器提供的Linux的SDK接入语音AI服务将解压后的语音流数据透传至第三方语音AI服务器,并维持所述长连接链路。
3.根据权利要求2所述的方法,其中,对所述AI服务回复数据进行解析,得到AI服务文本数据和AI服务语音数据并发送给所述设备,包括:
对所述AI服务回复数据进行解析,从中抽取出ASR语音识别结果、NLP语义理解结果和TTS语音合成结果;
将所述ASR语音识别结果、NLP语义理解结果和TTS语音合成结果分别组包,并分段下发至所述设备。
4.一种在设备端实现智能语音AI功能的方法,其中,该方法包括:
录制用户输入的指令语音,将所述指令语音转换为语音流数据,并将所述语音流数据发送至中转服务器;
接收所述中转服务器返回的AI服务文本数据和AI服务语音数据,其中,所述AI服务文本数据和AI服务语音数据由所述中转服务器解析第三方语音AI服务器返回的AI服务回复数据得到,所述语音流数据由所述中转服务器发送给所述第三方语音AI服务器,所述第三方语音AI服务器识别所述语音流数据后向所述中转服务器反馈对应的AI服务回复数据;
基于所述AI服务文本数据进行对应的文本显示,AI服务语音数据进行对应的语音播报。
5.根据权利要求4所述的方法,其中,当所述中转服务器为Linux操作系统的云端服务器时,录制用户输入段指令语音,将所述指令语音转换为语音流数据,并将所述语音流数据发送至中转服务器,包括:
录制用户输入的指令语音,将所述指令语音转换为各段语音流数据;
与所述中转服务器建立长连接链路;
将各段语音流数据压缩后通过所述长连接链路发送至中转服务器,并维持长连接链路。
6.根据权利要求5所述的方法,其中,接收所述中转服务器返回的AI服务文本数据和AI 服务语音数据,包括:
从所述中转服务器接收分别组包并分段下发的ASR语音识别结果、NLP语义理解结果和TTS语音合成结果,其中,所述中转服务器对所述AI服务回复数据进行解析,从中抽取出ASR 语音识别结果、NLP语义理解结果和TTS语音合成结果;
将所述ASR语音识别结果、NLP语义理解结果作为AI服务文本数据;将TTS语音合成结果
2。