qwen3.5-flash

openai

厂商：阿里云

模型 ID：aliyun/qwen3.5-flash

对话推理

输入价格

¥0.20 起/M tokens

0~131K¥0.20/M

131K~262K¥0.80/M

262K+¥1.20/M

输出价格

¥2.00 起/M tokens

0~131K¥2.00/M

131K~262K¥8.00/M

262K+¥12.00/M

上下文窗口

128Ktokens

模型介绍

阿里云通义千问系列轻量级模型，采用强化学习后训练技术，推理速度极快，延迟低至毫秒级。价格在千木全线模型中最低，适合高频调用、实时响应、批量处理等对速度和成本敏感的场景。131K/262K的超长上下文支持使其在轻量级模型中独具优势。

适用场景

•高频调用
•实时响应
•批量处理
•长文本处理

最佳实践

✓推荐用于需要极低延迟和高频调用的场景，131K版本性价比最高，适合大多数轻量级任务。

接入示例

from openai import OpenAI

client = OpenAI(
    api_key="sk-your-api-key",
    base_url="https://api-one.silvamux.com/v1"
)

response = client.chat.completions.create(
    model="aliyun/qwen3.5-flash",
    messages=[
        {"role": "user", "content": "Hello!"}
    ],
    stream=True
)

for chunk in response:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

Token 消耗趋势

加载中...

立即开始使用 qwen3.5-flash

3 步完成接入，即刻开始调用

查看接入文档免费注册

模型	厂商	输入价格	输出价格	上下文	能力
qwen3.5-flash当前	阿里云	¥0.20 起/M	¥2.00 起/M	128K	对话推理
qwen3.5-plus	阿里云	¥0.80 起/M	¥4.80 起/M	128K	对话推理代码
qwen3.6-plus	阿里云	¥2.00 起/M	¥12.00 起/M	256K	对话推理代码