qwen3.5-flash

openai

厂商:阿里云

对话推理

输入价格

¥0.020/M tokens

输出价格

¥0.200/M tokens

上下文窗口

1.0Mtokens

模型介绍

阿里云通义千问系列轻量级模型,采用强化学习后训练技术,推理速度极快,延迟低至毫秒级。价格在千木全线模型中最低,适合高频调用、实时响应、批量处理等对速度和成本敏感的场景。131K/262K的超长上下文支持使其在轻量级模型中独具优势。

适用场景

  • 高频调用
  • 实时响应
  • 批量处理
  • 长文本处理

最佳实践

  • 推荐用于需要极低延迟和高频调用的场景,131K版本性价比最高,适合大多数轻量级任务。

接入示例

from openai import OpenAI

client = OpenAI(
    api_key="sk-your-api-key",
    base_url="https://one.silvamux.com/v1"
)

response = client.chat.completions.create(
    model="qwen3.5-flash",
    messages=[
        {"role": "user", "content": "Hello!"}
    ],
    stream=True
)

for chunk in response:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

Token 消耗趋势

加载中...

立即开始使用 qwen3.5-flash

3 步完成接入,每月赠送 100 万 Token