qwen3.5-flash

openai

厂商:阿里云

模型 ID:aliyun/qwen3.5-flash

对话推理

输入价格

¥0.20 起/M tokens

0~131K¥0.20/M
131K~262K¥0.80/M
262K+¥1.20/M

输出价格

¥2.00 起/M tokens

0~131K¥2.00/M
131K~262K¥8.00/M
262K+¥12.00/M

上下文窗口

128Ktokens

模型介绍

阿里云通义千问系列轻量级模型,采用强化学习后训练技术,推理速度极快,延迟低至毫秒级。价格在千木全线模型中最低,适合高频调用、实时响应、批量处理等对速度和成本敏感的场景。131K/262K的超长上下文支持使其在轻量级模型中独具优势。

适用场景

  • 高频调用
  • 实时响应
  • 批量处理
  • 长文本处理

最佳实践

  • 推荐用于需要极低延迟和高频调用的场景,131K版本性价比最高,适合大多数轻量级任务。

接入示例

from openai import OpenAI

client = OpenAI(
    api_key="sk-your-api-key",
    base_url="https://api-one.silvamux.com/v1"
)

response = client.chat.completions.create(
    model="aliyun/qwen3.5-flash",
    messages=[
        {"role": "user", "content": "Hello!"}
    ],
    stream=True
)

for chunk in response:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

同类模型对比

模型厂商输入价格输出价格上下文能力
qwen3.5-flash当前阿里云¥0.20 起/M¥2.00 起/M128K
对话推理
qwen3.5-plus阿里云¥0.80 起/M¥4.80 起/M128K
对话推理代码
qwen3.6-plus阿里云¥2.00 起/M¥12.00 起/M256K
对话推理代码

Token 消耗趋势

加载中...

立即开始使用 qwen3.5-flash

3 步完成接入,即刻开始调用