跳转至

vLLM 离线客户端

创建模型

from_vllm_offline 需要传入 vllm.LLM 实例。

from vllm import LLM
from gimkit import from_vllm_offline

llm = LLM(model="Qwen/Qwen2.5-7B-Instruct")
model = from_vllm_offline(llm)

Note

请先安装扩展依赖:pip install gimkit[vllm](Linux)。

提示词建议

对于 GIM 训练的本地模型,建议保持 use_gim_prompt=False。 对于非 GIM 训练模型,可额外开启 use_gim_prompt=True

查询示例:

from gimkit import guide as g

query = f"""
Event: {g(name="event", desc="event type")}
Date: {g.datetime(name="date")}
"""

# GIM 训练模型路径
result = model(query)

# 非 GIM 训练模型路径
result_non_gim = model(query, use_gim_prompt=True)

输出类型

output_type="cfg"(默认)

result = model(query, output_type="cfg")

output_type="json"

result = model(query, output_type="json", use_gim_prompt=True)

说明

  • GIMKit 会确保在 vLLM 采样参数中包含 RESPONSE_SUFFIX 的 stop 条件。
  • 可通过 sampling_params= 和其他 **inference_kwargs 传递 vLLM 生成参数。