Messages API（对话补全）

TLDR：Messages API 是 BUZZ AI 的核心接口，用于与 Claude 模型进行对话交互。

接口概述

Messages API 允许你向 Claude 发送消息并获取响应，支持：

单轮对话

多轮对话（上下文记忆）

流式响应

系统提示词

Prompt Caching（缓存优化）

创建消息

请求

POST /v1/messages

请求头

参数	必需	类型	说明
`Content-Type`	是	string	固定为 `application/json`
`x-api-key`	是	string	API Key 认证
`anthropic-version`	是	string	API 版本，固定为 `2023-06-01`

请求参数

参数	必需	类型	说明
`model`	是	string	模型 ID
`messages`	是	array	消息列表
`max_tokens`	是	integer	最大输出 token 数（1-8192）
`system`	否	string/array	系统提示词
`temperature`	否	number	温度参数（0-1），默认 1.0
`top_p`	否	number	核采样参数（0-1）
`top_k`	否	integer	Top-K 采样参数
`stream`	否	boolean	是否流式响应，默认 false
`stop_sequences`	否	array	停止序列

Messages 格式

{
  "messages": [
    {
      "role": "user",
      "content": "用户消息"
    },
    {
      "role": "assistant",
      "content": "助手回复"
    }
  ]
}

角色说明：

user：用户消息

assistant：助手回复（用于多轮对话）

基础示例

curl

Python (Anthropic SDK)

Python (OpenAI SDK)

Node.js

响应格式

成功响应

{
  "id": "msg_01XFDUDYJgAACzvnptvVoYEL",
  "type": "message",
  "role": "assistant",
  "content": [
    {
      "type": "text",
      "text": "你好！我是 Claude，一个由 Anthropic 开发的 AI 助手..."
    }
  ],
  "model": "claude-sonnet-4-6-20250514",
  "stop_reason": "end_turn",
  "stop_sequence": null,
  "usage": {
    "input_tokens": 10,
    "output_tokens": 25
  }
}

响应字段说明

字段	类型	说明
`id`	string	消息 ID
`type`	string	固定为 "message"
`role`	string	固定为 "assistant"
`content`	array	响应内容数组
`model`	string	使用的模型
`stop_reason`	string	停止原因（end_turn/max_tokens/stop_sequence）
`usage`	object	Token 使用统计

多轮对话

示例

系统提示词

基础用法

高级用法（Prompt Caching）

💡 提示：使用 Prompt Caching 可以大幅降低成本，特别适合长系统提示词。

流式响应

Python 示例

curl 示例

Node.js 示例

完整流式处理

参数详解

temperature

控制输出的随机性：

0.0：确定性输出，适合代码生成

0.7：平衡创造性和准确性

1.0：最大创造性，适合创意写作（默认）

max_tokens

限制输出长度：

最小：1

最大：8192

推荐：根据实际需求设置，避免浪费

stop_sequences

自定义停止序列：

错误处理

常见错误

400 Bad Request

{
  "type": "error",
  "error": {
    "type": "invalid_request_error",
    "message": "messages: field required"
  }
}

401 Unauthorized

{
  "type": "error",
  "error": {
    "type": "authentication_error",
    "message": "invalid x-api-key"
  }
}

429 Rate Limit

{
  "type": "error",
  "error": {
    "type": "rate_limit_error",
    "message": "Rate limit exceeded"
  }
}

Messages API（对话补全）

Messages API（对话补全）

接口概述

创建消息

请求

请求头

请求参数

Messages 格式

基础示例

curl

Python (Anthropic SDK)

Python (OpenAI SDK)

Node.js

响应格式

成功响应

响应字段说明

多轮对话

示例

系统提示词

基础用法

高级用法（Prompt Caching）

流式响应

Python 示例

curl 示例

Node.js 示例

完整流式处理

参数详解

temperature

max_tokens

stop_sequences

错误处理

常见错误

错误处理示例

最佳实践

1. 合理设置 max_tokens

2. 使用 Prompt Caching

3. 流式响应提升体验

Messages API（对话补全）

Messages API（对话补全）#

接口概述#

创建消息#

请求#

请求头#

请求参数#

Messages 格式#

基础示例#

curl#

Python (Anthropic SDK)#

Python (OpenAI SDK)#

Node.js#

响应格式#

成功响应#

响应字段说明#

多轮对话#

示例#

系统提示词#

基础用法#

高级用法（Prompt Caching）#

流式响应#

Python 示例#

curl 示例#

Node.js 示例#

完整流式处理#

参数详解#

temperature#

max_tokens#

stop_sequences#

错误处理#

常见错误#

错误处理示例#

最佳实践#

1. 合理设置 max_tokens#

2. 使用 Prompt Caching#

3. 流式响应提升体验#

Messages API（对话补全）

接口概述

创建消息

请求

请求头

请求参数

Messages 格式

基础示例

curl

Python (Anthropic SDK)

Python (OpenAI SDK)

Node.js

响应格式

成功响应

响应字段说明

多轮对话

示例

系统提示词

基础用法

高级用法（Prompt Caching）

流式响应

Python 示例

curl 示例

Node.js 示例

完整流式处理

参数详解

temperature

max_tokens

stop_sequences

错误处理

常见错误

错误处理示例

最佳实践

1. 合理设置 max_tokens

2. 使用 Prompt Caching

3. 流式响应提升体验