qwen3.5-flash
openai厂商:阿里云
模型 ID:aliyun/qwen3.5-flash
对话推理
输入价格
¥0.20 起/M tokens
0~131K¥0.20/M
131K~262K¥0.80/M
262K+¥1.20/M
输出价格
¥2.00 起/M tokens
0~131K¥2.00/M
131K~262K¥8.00/M
262K+¥12.00/M
上下文窗口
128Ktokens
模型介绍
阿里云通义千问系列轻量级模型,采用强化学习后训练技术,推理速度极快,延迟低至毫秒级。价格在千木全线模型中最低,适合高频调用、实时响应、批量处理等对速度和成本敏感的场景。131K/262K的超长上下文支持使其在轻量级模型中独具优势。
适用场景
- •高频调用
- •实时响应
- •批量处理
- •长文本处理
最佳实践
- ✓推荐用于需要极低延迟和高频调用的场景,131K版本性价比最高,适合大多数轻量级任务。
接入示例
from openai import OpenAI
client = OpenAI(
api_key="sk-your-api-key",
base_url="https://api-one.silvamux.com/v1"
)
response = client.chat.completions.create(
model="aliyun/qwen3.5-flash",
messages=[
{"role": "user", "content": "Hello!"}
],
stream=True
)
for chunk in response:
if chunk.choices[0].delta.content:
print(chunk.choices[0].delta.content, end="")同类模型对比
| 模型 | 厂商 | 输入价格 | 输出价格 | 上下文 | 能力 |
|---|---|---|---|---|---|
| qwen3.5-flash当前 | 阿里云 | ¥0.20 起/M | ¥2.00 起/M | 128K | 对话推理 |
| qwen3.5-plus | 阿里云 | ¥0.80 起/M | ¥4.80 起/M | 128K | 对话推理代码 |
| qwen3.6-plus | 阿里云 | ¥2.00 起/M | ¥12.00 起/M | 256K | 对话推理代码 |
Token 消耗趋势
加载中...
立即开始使用 qwen3.5-flash
3 步完成接入,即刻开始调用