识别语音文件 (ASR)

语音文件识别接口，上传整段语音文件进行一次性识别。接口适合 60 秒以内音频识别。

Tip: 单租户限流：20QPS，同租户下的应用没有限流，共享本租户的 20QPS 限流。免费版不支持调用。

请求

项目	值
HTTP URL	https://open.feishu.cn/open-apis/speech_to_text/v1/speech/file_recognize
HTTP Method	POST
接口频率限制	特殊频控
支持的应用类型	custom,isv
权限要求调用该 API 所需的权限。开启其中任意一项权限即可调用	`speech_to_text:speech` 语音识别

请求头

名称	类型	必填	描述
Authorization	string	是	`tenant_access_token` 值格式："Bearer `access_token`" 示例值："Bearer t-7f1bcd13fc57d46bac21793a18e560" 了解更多：如何选择与获取 access token
Content-Type	string	是	固定值："application/json; charset=utf-8"

请求体

名称	类型	必填	描述
`speech`	`speech`	是	语音资源
└ `speech`	`string`	否	pcm格式音频文件（文件识别）或音频分片（流式识别）经base64编码后的内容示例值："PdmrfE267Cd/Z9KpmNFh71A2PSJZxSp7+8upCg=="
`config`	`file_config`	是	配置属性
└ `file_id`	`string`	是	仅包含字母数字和下划线的 16 位字符串作为文件的标识，用户生成示例值："qwe12dd34567890w"
└ `format`	`string`	是	语音格式，目前仅支持：pcm 示例值："pcm"
└ `engine_type`	`string`	是	引擎类型，目前仅支持：16k_auto 中英混合示例值："16k_auto"

请求体示例

json

{
    "speech": {
        "speech": "PdmrfE267Cd/Z9KpmNFh71A2PSJZxSp7+8upCg=="
    },
    "config": {
        "file_id": "qwe12dd34567890w",
        "format": "pcm",
        "engine_type": "16k_auto"
    }
}

响应

响应体

名称	类型	描述
`code`	`int`	错误码，非 0 表示失败
`msg`	`string`	错误描述
`data`	`\-`	-
└ `recognition_text`	`string`	语音识别后的文本信息

响应体示例

json

{
    "code": 0,
    "msg": "success",
    "data": {
        "recognition_text": "你好，使用飞书吧"
    }
}

错误码

HTTP状态码	错误码	描述	排查建议
400	1040101	invalid param	参数错误，参考文档检查输入参数
500	1040102	network anomaly	后端服务异常或网络异常，可重新请求

银行卡

名片

营业执照

中国护照

合同

驾驶证

食品经营许可证

食品生产许可证

健康证

港澳通行证

身份证

简历

出租车发票

火车票发票

台湾通行证

增值税发票

车辆发票

车辆牌照

识别语音文件 (ASR)

请求

请求头

请求体

请求体示例

响应

响应体

响应体示例

错误码

识别语音文件 (ASR) ​

请求 ​

请求头 ​

请求体 ​

请求体示例 ​

响应 ​

响应体 ​

响应体示例 ​

错误码 ​

识别语音文件 (ASR)

请求

请求头

请求体

请求体示例

响应

响应体

响应体示例

错误码