vLLM 离线客户端
创建模型
from_vllm_offline 需要传入 vllm.LLM 实例。
from vllm import LLM
from gimkit import from_vllm_offline
llm = LLM(model="Qwen/Qwen2.5-7B-Instruct")
model = from_vllm_offline(llm)
Note
请先安装扩展依赖:pip install gimkit[vllm](Linux)。
提示词建议
对于 GIM 训练的本地模型,建议保持 use_gim_prompt=False。 对于非 GIM 训练模型,可额外开启 use_gim_prompt=True。
查询示例:
from gimkit import guide as g
query = f"""
Event: {g(name="event", desc="event type")}
Date: {g.datetime(name="date")}
"""
# GIM 训练模型路径
result = model(query)
# 非 GIM 训练模型路径
result_non_gim = model(query, use_gim_prompt=True)
输出类型
output_type="cfg"(默认)
result = model(query, output_type="cfg")
output_type="json"
result = model(query, output_type="json", use_gim_prompt=True)
说明
- GIMKit 会确保在 vLLM 采样参数中包含
RESPONSE_SUFFIX的 stop 条件。 - 可通过
sampling_params=和其他**inference_kwargs传递 vLLM 生成参数。