上面提到的开源工具箱主要都是用于语音识别的,其他的开源语音识别项目还有Kaldi 、simon 、iATROS-speech 、SHoUT 、 Zanzibar OpenIVR 等。
其他的影响力较大商用语音交互平台有谷歌的语音搜索(Google Voice Search),百度和搜狗的语音输入法等等。
Baidu AI开放平台:提供语音识别API,支持多种语言离线及实时识别,适合集成到自定义软件中。DeepSpeech:Mozilla开发的开源语音识别引擎,运用深度学习,识别准确度高,支持多种语言及方言。Kaldi:C++语言编写的语言识别工具包,适合语言识别研究,广泛应用于商用语言识别系统。
三大著名的开源平台包括Kaldi、CMU Sphinx和Julius。Kaldi以其强大的DNN支持和快速的更新迭代受到青睐,成为了商用开源代码中的佼佼者。CMU Sphinx在高性能连续语音识别方面表现出色,而Julius则凭借其简便的建模方式和C语言开发,成为实用高效的双通道大词汇连续语音识别引擎。
百度AI开放平台:百度提供了多个 AI 工具和服务,包括图像识别、语音识别、自然语言处理等方面的能力。 腾讯AI开放平台:腾讯提供了一系列 AI 工具和服务,如人脸识别、语音合成、机器翻译等,涵盖了多个领域和场景。
小米开放平台:小米提供了开放平台和工具,这些可以帮助开发者在小米设备上集成和开发AI语音助手。小米AI开放平台具备语音识别、语音合成等功能。 百度语音识别和语音合成:百度提供了语音识别和语音合成的API,开发者可以利用这些API将百度拆源的语音技术集成到自己的应用中,适用范围不限于小米设备。
腾讯AI开放平台**:由腾讯提供,集自然语言处理、图像识别、语音识别等技术于一体,适用于开发智能化应用。集成智能客服、智能推荐、智能营销等工具与解决方案,提升效率、降低成本、优化服务质量。
1、Baidu AI开放平台讯飞输入法5.4:提供语音识别API讯飞输入法5.4,支持多种语言离线及实时识别,适合集成到自定义软件中。DeepSpeech讯飞输入法5.4:Mozilla开发讯飞输入法5.4的开源语音识别引擎,运用深度学习,识别准确度高,支持多种语言及方言。Kaldi:C++语言编写的语言识别工具包,适合语言识别研究,广泛应用于商用语言识别系统。
2、三大著名的开源平台包括Kaldi、CMU Sphinx和Julius。Kaldi以其强大的DNN支持和快速的更新迭代受到青睐,成为了商用开源代码中的佼佼者。CMU Sphinx在高性能连续语音识别方面表现出色,而Julius则凭借其简便的建模方式和C语言开发,成为实用高效的双通道大词汇连续语音识别引擎。
3、其他的影响力较大商用语音交互平台有谷歌的语音搜索(Google Voice Search),百度和搜狗的语音输入法等等。