中转云api
  1. ChatGPT音频(Audio)
中转云api
  • 引言
  • 在线调试说明
  • 发出请求
  • 中转站基本介绍
    • API 快速开始指南
    • 分组详细表格
    • 分组的特殊性及价格差异
    • 如何新建指定分组的令牌
    • 代理接口调用地址
    • API Key 额度查询服务
    • 免费AI聊天项目导航
  • Chat模型
    • ChatGpt 接口
      • ChatGPT音频(Audio)
        • 创建语音
          POST
        • 创建转录
          POST
        • 创建翻译
          POST
      • ChatGPT聊天(Chat)
        • 聊天完成对象
        • 聊天完成块对象
        • 创建聊天补全 (流式)
        • 创建聊天补全 (非流)
        • 创建聊天识图 (流式)
        • 创建聊天识图 (流式) best64
        • 创建聊天识图 (非流)
        • 官方Function calling调用
        • 官方N测试
        • 列出模型
        • 创建聊天函数调用 (只能非流)
        • 创建结构化输出
      • ChatGPT自动补全(Completions)
        • 完成对象
        • 创建完成
      • ChatGPT嵌入(Embeddings)
        • 嵌入对象
        • 创建嵌入
    • Anthropic Claude 接口
      • 聊天完成对象
      • 聊天完成块对象
      • 创建聊天补全 (流式)
      • 创建聊天补全 (非流)
      • 创建聊天识图 (流式)
      • 创建聊天识图 (非流)
    • 谷歌Gemini
      • 聊天接口
      • 识图接口
  • 文生图模型
    • README
    • 图像对象
    • MJ绘画
      • 提交Imagine任务
      • 根据任务ID 查询任务状态
      • 根据ID列表查询任务
      • 获取任务图片的seed
      • 执行Action动作
      • 提交Blend任务
      • 提交Describe任务
      • 提交Shorten任务
      • 提交Modal
      • 提交swap_face任务
    • ideogram 绘画
      • ideogram(文生图)
      • Remix(混合图)
      • Upscale(放大高清)
      • Describe(描述)
    • DALL·E 3
    • Flux(OpenAI dall-e-3格式)
    • 创建图片编辑
    • Stable-Diffusion
    • ideogram
    • recraftv3
    • 创建图像变体
  • 文生视频模型
    • luma 视频生成
      • 官方API格式
        • 提交生成视频任务
        • 扩展视频
      • 查询任务
        • 查询单个任务
        • 批量获取任务
    • 快手可灵
      • Callback协议
      • 图像生成
      • 文生视频
      • 图生视频
      • 查询任务(免费)
    • Runway 视频生成
      • 提交视频生成任务
      • 查询视频任务(免费)
      • 提交视频生成任务-chat格式
  • GPTs 相关
    • gpt-4-all(分析图片)
    • gpt-4-all(生成图片)
    • GPTs对话
  • 文生音乐 Suno
    • 说明
    • 参数
    • 任务提交
      • 生成歌曲(灵感、自定义、续写)
      • 生成歌词
      • 歌曲拼接
    • 查询接口
      • 批量获取任务
      • 查询单个任务
  • Python配置方式
    • python openai官方库(使用AutoGPT,langchain等)
    • python 连续对话
    • python 使用 语音转文本
    • python 使用文本转语音
    • python 使用Embeddings 向量化
    • python 调用DALL·E
    • python简单调用 openai function-calling demo
    • python 简单langchain 调用openai demo
    • python llama_index 配置
    • Python使用gpt-4o识别图片-本地图片
    • Python基础对话
    • Python使用gpt-4o识别图片
    • Python使用Claude识别图片
  • nodejs 配置方式
    • nodejs 基础对话
  • 帮助中心
    • HTTP状态码及其含义
  1. ChatGPT音频(Audio)

创建转录

POST
/v1/audio/transcriptions

请求参数

Authorization
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
Body 参数multipart/form-data
file
file 
必需
要转录的音频文件对象(不是文件名),格式为:flac、mp3、mp4、mpeg、mpga、m4a、ogg、wav 或 webm。
示例值:
file://D:\Backup\Downloads\123.mp3
model
string 
必需
要使用的模型 ID。目前只有 whisper-1 是可用的。
示例值:
whisper-1
language
string 
可选
输入音频的语言。以 ISO-639-1 格式提供输入语言可以提高准确性和延迟。
prompt
string 
可选
一个可选的文本来指导模型的风格或继续之前的音频段落。提示应该与音频语言匹配。
response_format
string 
可选
默认为 json
转录输出的格式,可选择:json、text、srt、verbose_json 或 vtt。
temperature
number 
可选
默认为 0
采样温度,between 0 和 1。更高的值像 0.8 会使输出更随机,而更低的值像 0.2 会使其更集中和确定性。如果设置为 0,模型将使用对数概率自动增加温度直到达到特定阈值。

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://zhongzhuan.cloud/v1/audio/transcriptions' \
--form 'file=@"D:\\Backup\\Downloads\\123.mp3"' \
--form 'model="whisper-1"'

返回响应

🟢200成功
application/json
Body
text
string 
必需
示例
{
  "text": "Imagine the wildest idea that you've ever had, and you're curious about how it might scale to something that's a 100, a 1,000 times bigger. This is a place where you can get to do that."
}
上一页
创建语音
下一页
创建翻译
Built with