AI赋能语音交互解决方案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

interaction)
Voice data
*FSM : Finite State Machine
Alink event Business Manager
Device Context FSM
Task Queue FIFO
OS(Linux/RTOS)
Command s
(JSON RPC)
MCU Controller mplayer
Register/Unregister
WebSocket
ASR Service Router Service
Encoded data Encode
Opus Speex
VAD Switch Local VAD
ASR result with business data
packaged (less device/cloud
9
Leabharlann Baidu
服务执 行
家居控 制
音频内容引 擎
服务APIs
对话生 成
知识图 谱
用户画 像
语音支 付
深度学 习
对话管 理
声纹识 别
唤醒算法提供 商
MIC阵列提供 商
语音模组提供 商
TTS提供 商
NLP提供商
ASR提供商
服务能力提供 商
Turnkey 语音 解决方案
设备厂商
Link Voice
• B2B2C的语音服务 • 一站式智能语音解决方案 • 输出技术、服务、内容、生态系统 • 允许厂商自定义唤醒词、开发自有App
赋能车机
Link Voice落地场景
家居
家电
运动健康
汽车车载
按摩椅语音产品 智能家居终控
冰箱方案
电饭煲
蓝牙耳机、音箱
跑步机解决方案
赋能车机
智能音箱的核心服务
智能控制吸引人
音乐播放留住人
信息交互创造无限可能
Link Voice覆盖核心场景
音乐
百度、虾米、豆瓣 喜马 拉雅、蜻蜓 贝瓦儿歌
2000万+ 可用曲库 音频资源、内容资源
厂商自测
LinkVoice认证
1.品牌与LinkVoice沟通跑步机需要控制
的交互流程,产出文档。
以语音跑步机为例,主要包
2.品牌与LinkPlay及LinkVoice确认流程 及
括。
LinkPlay双麦远场方案
语音与跑步机控制指令的转换。
3.LinkVoice团队开发云端跑步机控制语
1.按照产品的使用场景范围 定义,测试语音指令识别率

音Skill。

4.品牌端侧产品功能开发,上报本地状 态及响应云端指令。
2.测试跑步机产品功能定义 3.测试APP
5.如果有独立APP,基于 SDS SDK(Android/iOS),开发对应的APP。
成本 Cost Down
双麦 Far Field
Linux
单麦 Push+Tab
Android
MIPS
ARM
Link Voice方案举例
Alibaba
Linkplay DSP Module C02
Linkplay Wi-Fi Module A31/A61/A76/AXX
I2S DAC
IR Remote
Link Voice在语音识别准确率、用户体验正确率均处行业领先水平
ASR识别句正确率
95%
NLP理解正确率
98%
热门内容覆盖率
95%
用户体验正确率
91%
服务响应速度
1.5s
如何做一个智能语音硬件
Link Voice硬件端模组化输出
家居家电
Link Voice
模组化
音箱
Link Voice设备端模块
Cache manager Trigger Signal
Flash manager
(by LinkPlay)
System API Speake r Wifi/AP
Button trigger
Link Voice对接流程
设备接入Link Voice流程
确认产品形态 以语音跑步机为例
选择现有方案
产品对接联调
I2C Keypad
UART
Buttons LEDs
GPIO MCU
Provided by Linkplay
Link Voice架构概览
ALink Server
LinkVoice Server
Link Voice Embedded SDK
ALink Date/Time Sync
Upstream/Downstre am
操作系统
Linux AliOS RTOS Android iOS
声学信号处理
声源定位 回声消除 波束形成 自动增益调节 噪声消除
算法
端点检测 语音唤醒 语音识别 语义理解 语音合成 声纹识别
云平台
音乐内容 有声读物 家居控制 生活服务 语音支付 海量并发支撑
Link Voice业务形 态

成功唤
说出语音指
Link Voice VUI System Embedded Alink Agent
AliOS / RTOS / Linux / 安卓
codec / Algorithm
WiFi
SPI
DSP
Link Voice麦克风及平台
Mic陈列
操作系统 主控平台
六麦 Far Field 声源定位
RTOS
四麦
Far Field 声源定位
消费者
Link Voice平台概览
服务 交互 交互 语音 硬件
微服务平台(Skills)
交互解决方案(有屏+无屏)
交互解决方案(有屏+无屏)
语音技术(ASR、TTS)
自然语音处理技术
Push Talk
Tab Talk
音乐&音频内容 及互 联网服务
Far Field
Link Voice核心技术指标
智能家居 品类覆盖完整
1000万+语音可控 设备集合
工具
音乐闹钟 提醒
四则运算 百科 翻 译
贴心的个人小助手
生活服务
语音支付、生活缴费 猫超 购物
叫车、叫外卖 路 况与导航 天气
集合阿里系 完整的生活服务
智能语音产品的要素
智能语音是多领域交叉融合型产品
硬件层
Mic阵列设计 声腔结构 声效处理 密封 减震
Link Voice解决方案 AI赋能语音交互解决方案
1 云平台介绍
2 端模块介绍
3 产品介入研发流程
4 验收认证
Link Voice 云平台
智能语音的行业现状
Link Voice落地场景
按摩椅语音产品
智能家居终控
蓝牙耳机、音箱
跑步机解决方案
家居
运动 健康
家电
汽车 车载
冰箱方案
空调、风扇
电饭煲
收听语音播
醒1
醒2
令3
报1
麦克风阵

Beamformin
KWS
4
语音WIFI模组2
Alink SDK LV SDK
g
AEC
5
1
Link Voice Service Gateway
1
6
ASR语音识

7
声学模 语言模


NLP语义处理
领域判断 意图识 别
参数提取 语义算 8法
10 TTS语音合 成
TTS
相关文档
最新文档