推荐替代
推荐使用原生国产开源替代:Lingti-Bot
核心概念
Token 用量
Token 与成本统计、上下文占用与缓存策略。
计费与上下文
- 系统提示词与所有历史/工具结果均计入上下文
- 模型不同,token 计数不同;常见平均约 4 字符/Token
如何查看
/status查看当前上下文与成本(API key 才显示成本)/usage off|tokens|full控制每条回复尾部用量/usage cost显示本地成本汇总
缓存与裁剪
缓存 TTL 到期后可触发裁剪,减少重复缓存写入;心跳可保持缓存热度。
中文交流群
扫码加入中文交流群,分享网关搭建、渠道接入与运维经验。