Skip to content

识别语音文件 (ASR)

语音文件识别接口,上传整段语音文件进行一次性识别。接口适合 60 秒以内音频识别。

Tip: 单租户限流:20QPS,同租户下的应用没有限流,共享本租户的 20QPS 限流。免费版不支持调用。

请求

项目
HTTP URLhttps://open.feishu.cn/open-apis/speech_to_text/v1/speech/file_recognize
HTTP MethodPOST
接口频率限制特殊频控
支持的应用类型custom,isv
权限要求 调用该 API 所需的权限。开启其中任意一项权限即可调用speech_to_text:speech 语音识别

请求头

名称类型必填描述
Authorizationstringtenant_access_token 值格式:"Bearer access_token" 示例值:"Bearer t-7f1bcd13fc57d46bac21793a18e560" 了解更多:如何选择与获取 access token
Content-Typestring固定值:"application/json; charset=utf-8"

请求体

名称类型必填描述
speechspeech语音资源
  └ speechstringpcm格式音频文件(文件识别)或音频分片(流式识别)经base64编码后的内容
示例值:"PdmrfE267Cd/Z9KpmNFh71A2PSJZxSp7+8upCg=="
configfile_config配置属性
  └ file_idstring仅包含字母数字和下划线的 16 位字符串作为文件的标识,用户生成
示例值:"qwe12dd34567890w"
  └ formatstring语音格式,目前仅支持:pcm
示例值:"pcm"
  └ engine_typestring引擎类型,目前仅支持:16k_auto 中英混合
示例值:"16k_auto"

请求体示例

json
{
    "speech": {
        "speech": "PdmrfE267Cd/Z9KpmNFh71A2PSJZxSp7+8upCg=="
    },
    "config": {
        "file_id": "qwe12dd34567890w",
        "format": "pcm",
        "engine_type": "16k_auto"
    }
}

响应

响应体

名称类型描述
codeint错误码,非 0 表示失败
msgstring错误描述
data\--
  └ recognition_textstring语音识别后的文本信息

响应体示例

json
{
    "code": 0,
    "msg": "success",
    "data": {
        "recognition_text": "你好,使用飞书吧"
    }
}

错误码

HTTP状态码错误码描述排查建议
4001040101invalid param参数错误,参考文档检查输入参数
5001040102network anomaly后端服务异常或网络异常,可重新请求

内容来源:飞书开放平台 · 自动爬取整理