fix: Tidy up text embedding model tuning demo. (#11426)

lee1premium-2024 · web-flow · commit d34640403d1b · 2024-04-09T11:24:21.000-04:00
* fix: Set better default args suggested by quality engineers.

* fix: Set better default args; tidy up api_endpoint processing.

* tidy up api_endpoint processing.
diff --git a/generative_ai/embedding_model_tuning.py b/generative_ai/embedding_model_tuning.py
@@ -31,10 +31,10 @@ def tune_embedding_model(
     corpus_path: str = "gs://embedding-customization-pipeline/dataset/corpus.jsonl",
     train_label_path: str = "gs://embedding-customization-pipeline/dataset/train.tsv",
     test_label_path: str = "gs://embedding-customization-pipeline/dataset/test.tsv",
-    batch_size: int = 50,
-    iterations: int = 300,
+    batch_size: int = 128,
+    iterations: int = 1000,
 ) -> pipeline_jobs.PipelineJob:
-    match = re.search(r"(.+)(-autopush|-staging)?-aiplatform.+", api_endpoint)
+    match = re.search(r"^(\w+-\w+)", api_endpoint)
     location = match.group(1) if match else "us-central1"
     job = aiplatform.PipelineJob(
         display_name=pipeline_job_display_name,