Add stop event

sjmonson · sjmonson · commit b19a33b0b089 · 2025-07-15T14:32:51.000-04:00
diff --git a/src/guidellm/scheduler/scheduler.py b/src/guidellm/scheduler/scheduler.py
@@ -6,6 +6,7 @@
 from multiprocessing import Manager
 from queue import Empty as QueueEmpty
 from queue import Queue
+from threading import Event
 from typing import (
     Any,
     Generic,
@@ -126,7 +127,7 @@ async def run(
             ) as executor,
         ):
             requests_iter: Optional[Iterator[Any]] = None
-            futures, queues = await self._start_processes(
+            futures, queues, stop_event = await self._start_processes(
                 manager, executor, scheduling_strategy
             )
             run_info, requests_iter, times_iter = self._run_setup(
@@ -178,7 +179,7 @@ async def run(
                 run_info=run_info,
             )
 
-            await self._stop_processes(futures, queues.requests)
+            await self._stop_processes(futures, stop_event)
 
     async def _start_processes(
         self,
@@ -188,6 +189,7 @@ async def _start_processes(
     ) -> tuple[
         list[asyncio.Future],
         MPQueues[RequestT, ResponseT],
+        Event,
     ]:
         await self.worker.prepare_multiprocessing()
         queues: MPQueues[RequestT, ResponseT] = MPQueues(
@@ -197,6 +199,7 @@ async def _start_processes(
             times=manager.Queue(maxsize=scheduling_strategy.processing_requests_limit),
             responses=manager.Queue(),
         )
+        stop_event = manager.Event()
 
         num_processes = min(
             scheduling_strategy.processes_limit,
@@ -226,6 +229,7 @@ async def _start_processes(
                     executor,
                     self.worker.process_loop_asynchronous,
                     queues,
+                    stop_event,
                     False,  # TODO: Make configurable
                     requests_limit,
                     id_,
@@ -234,7 +238,7 @@ async def _start_processes(
 
         await asyncio.sleep(0.1)  # give time for processes to start
 
-        return futures, queues
+        return futures, queues, stop_event
 
     def _run_setup(
         self,
@@ -369,10 +373,9 @@ def _check_result_ready(
     async def _stop_processes(
         self,
         futures: list[asyncio.Future],
-        requests_queue: Queue[RequestSession[RequestT, ResponseT]],
+        stop_event: Event,
     ):
-        # FIXME: Need new method for stopping workers
-        for _ in futures:
-            requests_queue.put(None)
+        # stop all processes
+        stop_event.set()
 
         await asyncio.gather(*futures)
diff --git a/src/guidellm/scheduler/worker.py b/src/guidellm/scheduler/worker.py
@@ -6,6 +6,7 @@
 from dataclasses import dataclass
 from queue import Empty as QueueEmpty
 from queue import Queue
+from threading import Event
 from typing import (
     Any,
     Generic,
@@ -181,6 +182,7 @@ async def resolve_scheduler_request(
     def process_loop_asynchronous(
         self,
         queues: MPQueues[RequestT, ResponseT],
+        stop_event: Event,
         prioritize_sessions: bool,
         max_concurrency: int,
         process_id: int,
@@ -207,7 +209,10 @@ async def _process_runner():
                     if request_session is not None:
                         pending_sessions.append(request_session)
                     lock.release()
-                    continue
+                    if stop_event.is_set():
+                        return  # Exit if stop event is set
+                    else:
+                        continue
 
                 async def wait_then_requeue(
                     session: RequestSession[RequestT, ResponseT],
@@ -309,13 +314,15 @@ async def prepare_multiprocessing(self):
     def process_loop_asynchronous(
         self,
         queues: MPQueues[GenerationRequest, ResponseSummary],
+        stop_event: Event,
         prioritize_sessions: bool,
         max_concurrency: int,
         process_id: int,
     ):
         asyncio.run(self.backend.validate())
         super().process_loop_asynchronous(
             queues=queues,
+            stop_event=stop_event,
             prioritize_sessions=prioritize_sessions,
             max_concurrency=max_concurrency,
             process_id=process_id,