Skip to content

对话补全 API

端点POST https://api.amapi.ai/v1/chat/completions

与 OpenAI Chat Completions API 完全兼容。


请求参数

参数类型必填说明
modelstring模型 ID,见模型列表
messagesarray对话消息列表
max_tokensinteger推荐填写最大输出 Token 数,Claude 模型必须显式指定(默认值较小)
streambooleantrue 开启流式输出(SSE),默认 false
temperaturefloat随机性,0–1,默认 1
top_pfloat核采样,默认 1
systemstring系统提示(也可放在 messages 的第一条 role=system 中)
stopstring/array停止词

注意:Claude 模型通过 OpenAI 兼容接口调用时,max_tokens 若不指定默认为 4096。如需更长输出请显式设置,最大支持 64K(部分模型 128K)。


请求示例

基础对话

python
from openai import OpenAI

client = OpenAI(
    api_key="sk-你的密钥",
    base_url="https://api.amapi.ai/v1"
)

response = client.chat.completions.create(
    model="claude-sonnet-4-6",
    messages=[
        {"role": "system", "content": "你是一位专业的 Python 开发者"},
        {"role": "user", "content": "如何用 Python 读取一个大文件而不占用过多内存?"}
    ],
    max_tokens=1000,
    temperature=0.7
)

print(response.choices[0].message.content)

多轮对话

python
messages = [
    {"role": "user", "content": "我想学习 Python"},
    {"role": "assistant", "content": "好的,你目前的编程基础如何?"},
    {"role": "user", "content": "我是完全的零基础"}
]

response = client.chat.completions.create(
    model="claude-sonnet-4-6",
    messages=messages,
    max_tokens=500
)

流式输出

python
stream = client.chat.completions.create(
    model="claude-sonnet-4-6",
    messages=[{"role": "user", "content": "写一篇 500 字的产品介绍"}],
    max_tokens=1000,
    stream=True
)

for chunk in stream:
    delta = chunk.choices[0].delta
    if delta.content:
        print(delta.content, end="", flush=True)

图片理解(多模态)

python
response = client.chat.completions.create(
    model="claude-sonnet-4-6",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {"url": "https://example.com/image.jpg"}
                },
                {
                    "type": "text",
                    "text": "请描述这张图片的内容"
                }
            ]
        }
    ],
    max_tokens=500
)

响应格式

json
{
  "id": "chatcmpl-xxx",
  "object": "chat.completion",
  "created": 1746000000,
  "model": "claude-sonnet-4-6",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "这是模型的回复内容..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 50,
    "completion_tokens": 120,
    "total_tokens": 170
  }
}

错误码

HTTP 状态码错误类型说明处理建议
400invalid_request_error请求参数错误检查参数格式
401authentication_errorAPI Key 无效或已过期检查 Key 是否正确
402insufficient_quota余额不足前往控制台充值
429rate_limit_error请求过于频繁降低请求速率,稍后重试
500server_error服务端错误稍后重试,如持续请联系客服
503service_unavailable上游模型暂时不可用稍后重试

© 2026 Amber Tech. All rights reserved.