腾讯云：一句话语音识别API接入步骤和说明

2019年07月26日由 Aaron 发表 275121 0

语音识别 API 升级到 3.0 版本。全新的 API 接口文档更加规范和全面，统一的参数风格和公共错误码，统一的 SDK/CLI 版本与 API 文档严格一致，给您带来简单快捷的使用体验。支持全地域就近接入让您更快连接腾讯云产品。

接口描述

接口请求域名： asr.tencentcloudapi.com 。

本接口用于对60秒之内的短音频文件进行识别，支持本地语音文件上传和语音URL上传两种请求方式。

当音频文件通过请求中body内容上传时，请求大小不能超过600KB；当音频以url方式传输时，音频时长不可超过60s。

所有请求参数放在POST请求的body中，编码类型采用x-www-form-urlencoded，参数进行urlencode编码后传输。

现暂只支持中文普通话和带有一定方言口音的中文普通话识别，支持识别8k16bit和16k16bit的mp3或者wav格式的单声道音频。

默认接口请求频率限制：25次/秒。

输入参数

以下请求参数列表仅列出了接口请求参数和部分公共参数，完整公共参数列表见：cloud.tencent.com/document/api/1093/35640

输出参数

示例

通过语音URL形式调用接口：

用户通过语音url（http%3A%2F%2Ftest-1256085166.cos.ap-guangzhou.myqcloud.com%2Fcase13.wav）的方式（SourceType为0）请求一句话识别服务，服务的引擎模型为：电话 8k （EngSerViceType = 8k），一句话语音的采样率为8k，声道数为单声道，长度为159768字节。

输入：

https://asr.tencentcloudapi.com/?Action=SentenceRecognition

&ProjectId=0

&SubServiceType=2

&EngSerViceType=8k

&SourceType=0

&Url=http%3A%2F%2Ftest-1256085166.cos.ap-guangzhou.myqcloud.com%2Fcase13.wav

&SecretId=111

&Timestamp=111

&VoiceFormat=wav

&UsrAudioKey=www

&DataLen=159768

&<公共请求参数>

输出：

{

  "Response": {

    "Result": "张先生，您好。那个为了规范保险从业人员的销售行为，也为了更好的保护您的合法权益。",

    "RequestId": "8984d9a9-343f-4c67-8fd9-5c79510a12da"

  }

}

开发者资源

API Explorer：该工具提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力，能显著降低使用云 API 的难度，推荐使用：console.cloud.tencent.com/api/explorer?Product=asr&Version=2019-06-14&Action=SentenceRecognition&SignVersion=

命令行工具：cloud.tencent.com/document/product/440/6176

错误码

业务逻辑相关

公共错误码：返回结果中如果存在 Error 字段，则表示调用 API 接口失败。 Error 中的 Code 字段表示错误码，所有业务都可能出现的错误码为公共错误码，下表列出了公共错误码。

文章来源腾讯云，查看更多相关文档请访问https://cloud.tencent.com/document/product

标签：

算量腾讯云

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇用Cython加速Python代码，快到起飞！

下一篇 Winograd快速卷积解析

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术