lmdeploy serve api_server /home/cheng/model/Qwen3.5-27B-AWQ
--tp 4
--cache-max-entry-count 0.8
--log-level INFO
--max-concurrent-requests 4
--model-name Qwen3.5-27B-AWQ
--backend turbomind
--max_batch_size 64
--api-key abc123
--server-port 8000
--cache-block-seq-len 32 \