Your current environment <div class="snippet-clipboard-content notranslate posit

[Bug]: use thread after call multiple times. KeyError: request_id about vllm HOT 1 OPEN

xubzhlin commented on September 26, 2024

[Bug]: use thread after call multiple times. KeyError: request_id

from vllm.

Comments (1)

Elissa0723 commented on September 26, 2024

I had the same problem...

Traceback (most recent call last):
File "./swift/demo_server_vllm_xyf.py", line 106, in get_all_component_res
async for request_output in results_generator:
File "./vllm/vllm/engine/async_llm_engine.py",line 673,in generate
async for output in self._process_request(
File "./vllm/vllm/engine/async_llm_engine.py", line 780, in _process_request
raise e
File "./vllm/vllm/engine/asyncIlm_engine.py", line 776, in _process_request
async for request output in stream:
File "./vllm/vllm/engine/async_llm_engine.py", line 89, in _anext
raise result
File "./vllm/vllm/vllm/enggine/async_llm_engine.py", line 42, in _log_task_completiom
return_value = task.result()
File "./vllm/vllm/engine/async_limengine.py", line 532, in run_engine_loop
has_requests_in_progress = await asyncio.wait_for(
File "/opt/conda/envs/infer/lib/python3.10/asyncio/tasks.py", line 445in wait_for
return fut.result()
File "./vllm/vllm/vllm/engine/async_lngine.py", line 510, in engine_step
self._request_tracker.process_request_output(
File "./vllm/vllm/engine/async_llm_engine.py", line 130, in process_request_output
self._request_streams[request_id].put(request_output)
KeyError: 'cc2580f508eb473285a9e1bb47a6714f

from vllm.

[Bug]: use thread after call multiple times. KeyError: request_id about vllm HOT 1 OPEN

Comments (1)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent