How does the Qwen3.5 model disable thinking?

lmdeploy serve api_server /home/cheng/model/Qwen3.5-27B-AWQ \
--tp 4 \
--cache-max-entry-count 0.8 \
--log-level INFO \
--max-concurrent-requests 4 \
--model-name Qwen3.5-27B-AWQ \
--backend turbomind \
--max_batch_size 64 \
--api-key abc123 \
--server-port 8000 \
--cache-block-seq-len 32 \