模型使用总览

本页用于对比各类 client 的支持差异，并说明何时使用不同模式。

Client 对比

Client	构造方式	适用场景
OpenAI	`from_openai(client, model_name=...)`	托管 OpenAI 兼容 API
vLLM（服务端）	`from_vllm(client, model_name=...)`	OpenAI 兼容的 vLLM HTTP 服务
vLLM（离线）	`from_vllm_offline(llm)`	基于 `vllm.LLM` 的本地离线推理

能力项	OpenAI	vLLM（服务端）	vLLM（离线）
`use_gim_prompt=True`	推荐开启	仅非 GIM 训练模型开启	仅非 GIM 训练模型开启
`output_type=None`	OpenAI 服务商不支持 JSON 时兜底	可用但不推荐	可用但不推荐
`output_type="cfg"`	不支持	推荐	推荐
`output_type="json"`	支持	支持	支持

visible_tag_fields：控制哪些 MaskedTag 字段对模型可见（如 ["id", "name", "desc", "content", "regex"]）。默认为 None（仅基础字段：["id", "desc", "content"]）。
backend：选择 Outlines 后端实现。
**inference_kwargs：透传底层后端生成参数。