聊天验证台

先打通模型调用,再往配置中心和审计台扩

页面支持实时切换 `gpt_type`,保留 assistant 的 `reasoning_content`,并在前端展示 usage、provider、耗时和链路追踪。

当前模型 加载中 gpt_type -
最近耗时 - 来自服务端代理测量
总消息数 0 含 system / user / assistant
最近用量 - 等待首条响应

请求配置

模型与参数

读取模型中
模型
模型列表来自 `/v1/models`。

高级参数

采样、路由与平台头

会话窗口

多轮聊天

Idle

Enter 发送,Shift + Enter 换行。