ray/release/serve_tests/workloads/serve_test_cluster_utils.py

#!/usr/bin/env python3
import logging

import ray
import requests
from ray import serve
from ray._private.test_utils import monitor_memory_usage
from ray.cluster_utils import Cluster
from ray.serve.config import DeploymentMode

logger = logging.getLogger(__file__)

# Cluster setup configs
NUM_CPU_PER_NODE = 10
NUM_CONNECTIONS = 10


def setup_local_single_node_cluster(
    num_nodes: int,
    num_cpu_per_node=NUM_CPU_PER_NODE,
    namespace="serve",
):
    """Setup ray cluster locally via ray.init() and Cluster()

    Each actor is simulated in local process on single node,
    thus smaller scale by default.
    """
    cluster = Cluster()
    for i in range(num_nodes):
        cluster.add_node(
            redis_port=6380 if i == 0 else None,
            num_cpus=num_cpu_per_node,
            num_gpus=0,
            resources={str(i): 2},
        )
    ray.init(address=cluster.address, dashboard_host="0.0.0.0", namespace=namespace)
    serve_client = serve.start(
        detached=True, http_options={"location": DeploymentMode.EveryNode}
    )

    return serve_client, cluster


def setup_anyscale_cluster():
    """Setup ray cluster at anyscale via ray.client()

    Note this is by default large scale and should be kicked off
    less frequently.
    """
    # TODO: Ray client didn't work with releaser script yet because
    # we cannot connect to anyscale cluster from its headnode
    # ray.client().env({}).connect()
    ray.init(
        address="auto",
        # This flag can be enabled to debug node autoscaler events.
        # But the cluster scaling has been stable for now, so we turn it off
        # to reduce spam.
        runtime_env={"env_vars": {"SERVE_ENABLE_SCALING_LOG": "0"}},
    )
    serve_client = serve.start(http_options={"location": DeploymentMode.EveryNode})

    # Print memory usage on the head node to help diagnose/debug memory leaks.
    monitor_memory_usage()

    return serve_client


@ray.remote
def warm_up_one_cluster(
    num_warmup_iterations: int,
    http_host: str,
    http_port: str,
    endpoint: str,
    nonblocking: bool = False,
) -> None:
    # Specifying a low timeout effectively makes requests.get() nonblocking
    timeout = 0.0001 if nonblocking else None
    logger.info(f"Warming up {endpoint} ..")
    for _ in range(num_warmup_iterations):
        try:
            resp = requests.get(
                f"http://{http_host}:{http_port}/{endpoint}", timeout=timeout
            ).text
            logger.info(resp)
        except requests.exceptions.ReadTimeout:
            # This exception only gets raised if a timeout is specified in the
            # requests.get() call.
            logger.info("Issued nonblocking HTTP request.")

    return endpoint
[serve] Multi & single deployment large scale test (#17310) 2021-07-27 08:46:45 -07:00			`#!/usr/bin/env python3`
[serve] Add component logger + basic access logging (#23558) Adds a "component logger" to standardize logging across the HTTP proxy, controller, and deployment replicas. 2022-04-12 18:16:58 -05:00			`import logging`
[serve] Multi & single deployment large scale test (#17310) 2021-07-27 08:46:45 -07:00
[serve] Add component logger + basic access logging (#23558) Adds a "component logger" to standardize logging across the HTTP proxy, controller, and deployment replicas. 2022-04-12 18:16:58 -05:00			`import ray`
[Release Tests] Add memory monitoring for Serve release test (#25868) 2022-06-17 11:11:56 -07:00			`import requests`
[serve] Multi & single deployment large scale test (#17310) 2021-07-27 08:46:45 -07:00			`from ray import serve`
[Release Tests] Add memory monitoring for Serve release test (#25868) 2022-06-17 11:11:56 -07:00			`from ray._private.test_utils import monitor_memory_usage`
[serve] Multi & single deployment large scale test (#17310) 2021-07-27 08:46:45 -07:00			`from ray.cluster_utils import Cluster`
			`from ray.serve.config import DeploymentMode`
[CI] Format Python code with Black (#21975) See #21316 and #21311 for the motivation behind these changes. 2022-01-29 18:41:57 -08:00
[serve] Add component logger + basic access logging (#23558) Adds a "component logger" to standardize logging across the HTTP proxy, controller, and deployment replicas. 2022-04-12 18:16:58 -05:00			`logger = logging.getLogger(__file__)`

[serve] Multi & single deployment large scale test (#17310) 2021-07-27 08:46:45 -07:00			`# Cluster setup configs`
			`NUM_CPU_PER_NODE = 10`
[serve] Fix single deployment nightly test (#17368) 2021-07-28 09:38:06 -07:00			`NUM_CONNECTIONS = 10`
[serve] Multi & single deployment large scale test (#17310) 2021-07-27 08:46:45 -07:00

[Serve] Add nightly test for Serve failure recovery (#19125) 2021-10-11 18:33:20 -07:00			`def setup_local_single_node_cluster(`
[Deployment Graph] Add release test for long chain & wide fanout pattern (#24246) 2022-04-29 17:03:33 -07:00			`num_nodes: int,`
			`num_cpu_per_node=NUM_CPU_PER_NODE,`
			`namespace="serve",`
[Serve] Add nightly test for Serve failure recovery (#19125) 2021-10-11 18:33:20 -07:00			`):`
[serve] Multi & single deployment large scale test (#17310) 2021-07-27 08:46:45 -07:00			`"""Setup ray cluster locally via ray.init() and Cluster()`

			`Each actor is simulated in local process on single node,`
			`thus smaller scale by default.`
			`"""`
			`cluster = Cluster()`
			`for i in range(num_nodes):`
			`cluster.add_node(`
[Serve] Add nightly test for Serve failure recovery (#19125) 2021-10-11 18:33:20 -07:00			`redis_port=6380 if i == 0 else None,`
[Deployment Graph] Add release test for long chain & wide fanout pattern (#24246) 2022-04-29 17:03:33 -07:00			`num_cpus=num_cpu_per_node,`
[serve] Multi & single deployment large scale test (#17310) 2021-07-27 08:46:45 -07:00			`num_gpus=0,`
			`resources={str(i): 2},`
			`)`
[Serve] Add nightly test for Serve failure recovery (#19125) 2021-10-11 18:33:20 -07:00			`ray.init(address=cluster.address, dashboard_host="0.0.0.0", namespace=namespace)`
[serve] Multi & single deployment large scale test (#17310) 2021-07-27 08:46:45 -07:00			`serve_client = serve.start(`
[Serve] Make the checkpoint and recover only from GCS (#26753) 2022-07-25 14:24:53 -07:00			`detached=True, http_options={"location": DeploymentMode.EveryNode}`
[Serve] Add nightly test for Serve failure recovery (#19125) 2021-10-11 18:33:20 -07:00			`)`
[serve] Multi & single deployment large scale test (#17310) 2021-07-27 08:46:45 -07:00
[Serve] Add nightly test for Serve failure recovery (#19125) 2021-10-11 18:33:20 -07:00			`return serve_client, cluster`
[serve] Multi & single deployment large scale test (#17310) 2021-07-27 08:46:45 -07:00

[Serve] Make the checkpoint and recover only from GCS (#26753) 2022-07-25 14:24:53 -07:00			`def setup_anyscale_cluster():`
[serve] Multi & single deployment large scale test (#17310) 2021-07-27 08:46:45 -07:00			`"""Setup ray cluster at anyscale via ray.client()`

			`Note this is by default large scale and should be kicked off`
			`less frequently.`
			`"""`
			`# TODO: Ray client didn't work with releaser script yet because`
			`# we cannot connect to anyscale cluster from its headnode`
			`# ray.client().env({}).connect()`
[Serve] Add verbose log for nightly test only (#20088) 2021-11-04 16:15:22 -07:00			`ray.init(`
[Deployment Graph] Add release test for long chain & wide fanout pattern (#24246) 2022-04-29 17:03:33 -07:00			`address="auto",`
[Release Tests] Add memory monitoring for Serve release test (#25868) 2022-06-17 11:11:56 -07:00			`# This flag can be enabled to debug node autoscaler events.`
			`# But the cluster scaling has been stable for now, so we turn it off`
			`# to reduce spam.`
			`runtime_env={"env_vars": {"SERVE_ENABLE_SCALING_LOG": "0"}},`
[Serve] Add verbose log for nightly test only (#20088) 2021-11-04 16:15:22 -07:00			`)`
[Serve] Make the checkpoint and recover only from GCS (#26753) 2022-07-25 14:24:53 -07:00			`serve_client = serve.start(http_options={"location": DeploymentMode.EveryNode})`
[serve] Multi & single deployment large scale test (#17310) 2021-07-27 08:46:45 -07:00
[Release Tests] Add memory monitoring for Serve release test (#25868) 2022-06-17 11:11:56 -07:00			`# Print memory usage on the head node to help diagnose/debug memory leaks.`
			`monitor_memory_usage()`

[serve] Multi & single deployment large scale test (#17310) 2021-07-27 08:46:45 -07:00			`return serve_client`


			`@ray.remote`
[Serve] Serve Autoscaling Release tests (#21208) 2022-01-21 12:08:25 -08:00			`def warm_up_one_cluster(`
			`num_warmup_iterations: int,`
			`http_host: str,`
			`http_port: str,`
			`endpoint: str,`
			`nonblocking: bool = False,`
			`) -> None:`
			`# Specifying a low timeout effectively makes requests.get() nonblocking`
			`timeout = 0.0001 if nonblocking else None`
[serve] Multi & single deployment large scale test (#17310) 2021-07-27 08:46:45 -07:00			`logger.info(f"Warming up {endpoint} ..")`
			`for _ in range(num_warmup_iterations):`
[Serve] Serve Autoscaling Release tests (#21208) 2022-01-21 12:08:25 -08:00			`try:`
			`resp = requests.get(`
			`f"http://{http_host}:{http_port}/{endpoint}", timeout=timeout`
			`).text`
			`logger.info(resp)`
			`except requests.exceptions.ReadTimeout:`
			`# This exception only gets raised if a timeout is specified in the`
			`# requests.get() call.`
			`logger.info("Issued nonblocking HTTP request.")`

[serve] Multi & single deployment large scale test (#17310) 2021-07-27 08:46:45 -07:00			`return endpoint`