qwen3.5-flash
openai厂商:阿里云
对话推理
输入价格
¥0.020/M tokens
输出价格
¥0.200/M tokens
上下文窗口
1.0Mtokens
模型介绍
阿里云通义千问系列轻量级模型,采用强化学习后训练技术,推理速度极快,延迟低至毫秒级。价格在千木全线模型中最低,适合高频调用、实时响应、批量处理等对速度和成本敏感的场景。131K/262K的超长上下文支持使其在轻量级模型中独具优势。
适用场景
- •高频调用
- •实时响应
- •批量处理
- •长文本处理
最佳实践
- ✓推荐用于需要极低延迟和高频调用的场景,131K版本性价比最高,适合大多数轻量级任务。
接入示例
from openai import OpenAI
client = OpenAI(
api_key="sk-your-api-key",
base_url="https://one.silvamux.com/v1"
)
response = client.chat.completions.create(
model="qwen3.5-flash",
messages=[
{"role": "user", "content": "Hello!"}
],
stream=True
)
for chunk in response:
if chunk.choices[0].delta.content:
print(chunk.choices[0].delta.content, end="")Token 消耗趋势
加载中...
立即开始使用 qwen3.5-flash
3 步完成接入,每月赠送 100 万 Token