qwen3.5-flash

openai

厂商：阿里云

对话推理

输入价格

¥0.020/M tokens

输出价格

¥0.200/M tokens

上下文窗口

1.0Mtokens

模型介绍

阿里云通义千问系列轻量级模型，采用强化学习后训练技术，推理速度极快，延迟低至毫秒级。价格在千木全线模型中最低，适合高频调用、实时响应、批量处理等对速度和成本敏感的场景。131K/262K的超长上下文支持使其在轻量级模型中独具优势。

适用场景

•高频调用
•实时响应
•批量处理
•长文本处理

最佳实践

✓推荐用于需要极低延迟和高频调用的场景，131K版本性价比最高，适合大多数轻量级任务。

接入示例

from openai import OpenAI

client = OpenAI(
    api_key="sk-your-api-key",
    base_url="https://one.silvamux.com/v1"
)

response = client.chat.completions.create(
    model="qwen3.5-flash",
    messages=[
        {"role": "user", "content": "Hello!"}
    ],
    stream=True
)

for chunk in response:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

Token 消耗趋势

加载中...

立即开始使用 qwen3.5-flash

3 步完成接入，每月赠送 100 万 Token

查看接入文档免费注册