火星API 接口对接
Python配置方式
复制页面
火星API 接口对接
引言
在线调试说明
发出请求
中转站基本介绍
API 快速开始指南
联系客服
分组详细表格
分组的特殊性及价格差异
如何新建指定分组的令牌
代理接口调用地址
API Key 额度查询服务
免费AI聊天项目导航
Chat模型
ChatGpt 接口
ChatGPT音频(Audio)
GPT-4o-audio
创建语音
创建转录
创建翻译 (不支持)
ChatGPT聊天(Chat)
聊天完成对象
聊天完成块对象
创建聊天补全 (流式)
创建聊天补全 (非流)
创建聊天识图 (流式)
创建聊天识图 (流式) best64
创建聊天识图 (非流)
创建聊天创作图 (非流)
官方Function calling调用
官方N测试
列出模型
创建聊天函数调用 (只能非流)
创建结构化输出
控制推理模型努力程度
新请求格式 (开发中)
ChatGPT自动补全(Completions)
完成对象
创建完成
ChatGPT嵌入(Embeddings)
嵌入对象
创建嵌入
ChatGPT绘画
创建
编辑
Web 搜索
web搜索
Anthropic Claude 接口
聊天完成对象
聊天完成块对象
创建聊天补全 (流式) [原生格式]
创建聊天补全 (流式)
创建聊天补全 (非流)
创建聊天识图 (流式)
创建聊天识图 (非流)
谷歌Gemini
聊天接口 [原生格式]
图片创作[原生格式]
图片编辑 [原生格式]
图片理解 [原生格式]
格式化输出 [原生格式]
文档理解 [原生格式]
视频理解-base64 [原生格式]
聊天接口 - 阅读网页 [原生格式] 开发中
视频理解-url [原生格式] 开发中
Imagen 3 生成图片 [原生格式] 开发中
gemini图片创作接口 [chat兼容格式]
聊天接口 [chat兼容格式]
识图接口 [chat兼容格式]
聊天+读取文件接口 [chat兼容格式]
文生图模型
README
图像对象
MJ绘画
上传图片
提交Imagine任务
根据任务ID 查询任务状态
根据ID列表查询任务
获取任务图片的seed
执行Action动作
提交Blend任务
提交Describe任务
提交Shorten任务
提交Modal
提交swap_face任务
ideogram 绘画
Generate 3.0(文生图)Generate
Generate 3.0(图片编辑)Edit
Generate 3.0(图片重制)Remix
Generate 3.0(图片重构)Reframe
Generate 3.0(替换背景) Replace Background
ideogram(文生图)
Remix(混合图)
Upscale(放大高清)
Describe(描述)
DALL·E 3
Flux 创建(OpenAI dall-e-3格式)
Flux编辑(OpenAI dall-e-3格式)
Stable-Diffusion
ideogram
文生视频模型
veo 视频生成
视频统一格式
创建视频
查询任务
创建视频,带图片
luma 视频生成
官方API格式
提交生成视频任务
扩展视频
查询任务
查询单个任务
批量获取任务
Kling 快手可灵
Callback协议
图像生成
文生视频
图生视频
查询任务(免费)
Runway 视频生成
提交视频生成任务
查询视频任务(免费)
提交视频生成任务-chat格式
GPTs 相关
gpt-4-all(分析图片)
gpt-4-all(生成图片)
GPTs对话
文生音乐 Suno
说明
参数
任务提交
生成歌曲(灵感模式)
生成歌曲(自定义模式)
生成歌曲(续写模式)
生成歌曲(歌手风格)
生成歌曲(上传歌曲二次创作)
生成歌曲(拼接歌曲)
生成歌词
歌曲拼接
查询接口
批量获取任务
查询单个任务
系统API
获取令牌列表
新增令牌
获取令牌支持模型
获取账号信息
Python配置方式
python openai官方库(使用AutoGPT,langchain等)
python 连续对话
python 使用 语音转文本
python 使用文本转语音
python 使用Embeddings 向量化
python 调用DALL·E
python简单调用 openai function-calling demo
python 简单langchain 调用openai demo
python llama_index 配置
Python使用gpt-4o识别图片-本地图片
python 库流式输出
gpt realtime模型调用
python request 请求 流式输出demo
python 使用gpt-image-1 创建编辑图片
Python基础对话
Python使用gpt-4o识别图片
Python使用Claude识别图片
nodejs 配置方式
nodejs 基础对话
php配置方式
php使用图片编辑demo
各种插件/软件使用教程
CherryStudio调用cluade MCP
Cherry Studio配置教程
CherryStudio配置o4推理级别
dify添加模型
cline 配置教程
aider 配置教程
Cursor 配置教程
lobechat 设置教程
ChatBox(推荐使用)
开源gpt_academic
nextchat 设置教程
zotero gpt 配置方法
CLAUDE DEV 配置教程
沉浸式翻译 设置gpt翻译
浏览器插件ChatGPT Sidebar
chatgpt-on-wechat 配置教程
chatgpt GPT Academic 学术优化配置gpt教程
帮助中心
AI返回字段: 思考相关
HTTP状态码及其含义
Python配置方式
复制页面
python 使用文本转语音
文字转语音 (TTS) API 指南
#
概述
#
音频 API 提供
speech
端点,基于 TTS 模型实现以下功能:
📝 博客文章朗读
🌍 多语言音频生成
🎵 实时音频流输出
重要提示
:必须向用户声明所听到的是 AI 生成的语音,而非人类声音
基础使用
#
基本示例
#
功能特性
#
音频质量选项
#
tts-1
: 低延迟,适合实时应用
tts-1-hd
: 更高质量,可能有更少的静态内容
可用声音
#
alloy
echo
fable
nova
shimmer
onyx
支持的输出格式
#
格式
特点
适用场景
MP3
默认格式
通用场景
Opus
低延迟
网络流媒体和通信
AAC
高效压缩
移动设备播放
FLAC
无损压缩
音频存档
WAV
无压缩
低延迟应用
PCM
原始采样
24kHz, 16位有符号
实时音频流
#
支持语言
#
支持多种语言,包括:
亚洲语言:中文、日语、韩语等
欧洲语言:英语、法语、德语等
其他语言:阿拉伯语、印地语等
注意
:当前声音主要针对英语优化
常见问题
#
Q: 如何控制生成音频的情感?
#
A: 目前没有直接控制机制。大写字母或语法可能影响输出,但效果不确定。
Q: 能创建自定义声音吗?
#
A: 不支持创建自定义声音。
Q: 生成的音频归属权?