allow embeddings vector to be used for mmr searching (#2620)

Rishabh Gupta · Rishabh Gupta · commit 2ca002d99a39 · 2024-08-02T23:45:05.000+05:30
diff --git a/elasticsearch/helpers/vectorstore/_async/vectorstore.py b/elasticsearch/helpers/vectorstore/_async/vectorstore.py
@@ -344,8 +344,8 @@ async def _create_index_if_not_exists(self) -> None:
     async def max_marginal_relevance_search(
         self,
         *,
-        embedding_service: AsyncEmbeddingService,
-        query: str,
+        query: Optional[str],
+        query_embedding: Optional[List[float]] = None,
         vector_field: str,
         k: int = 4,
         num_candidates: int = 20,
@@ -361,6 +361,8 @@ async def max_marginal_relevance_search(
             among selected documents.
 
         :param query (str): Text to look up documents similar to.
+        :param query_embedding: Input embedding vector. If given, input query string is
+            ignored.
         :param k (int): Number of Documents to return. Defaults to 4.
         :param fetch_k (int): Number of Documents to fetch to pass to MMR algorithm.
         :param lambda_mult (float): Number between 0 and 1 that determines the degree
@@ -381,7 +383,10 @@ async def max_marginal_relevance_search(
             remove_vector_query_field_from_metadata = False
 
         # Embed the query
-        query_embedding = await embedding_service.embed_query(query)
+        if self.embedding_service and not query_embedding:
+            if not query:
+                raise ValueError("specify a query or a query_embedding to search")
+            query_embedding = await self.embedding_service.embed_query(query)
 
         # Fetch the initial documents
         got_hits = await self.search(
diff --git a/elasticsearch/helpers/vectorstore/_sync/vectorstore.py b/elasticsearch/helpers/vectorstore/_sync/vectorstore.py
@@ -341,8 +341,8 @@ def _create_index_if_not_exists(self) -> None:
     def max_marginal_relevance_search(
         self,
         *,
-        embedding_service: EmbeddingService,
-        query: str,
+        query: Optional[str],
+        query_embedding: Optional[List[float]] = None,
         vector_field: str,
         k: int = 4,
         num_candidates: int = 20,
@@ -358,6 +358,8 @@ def max_marginal_relevance_search(
             among selected documents.
 
         :param query (str): Text to look up documents similar to.
+        :param query_embedding: Input embedding vector. If given, input query string is
+            ignored.
         :param k (int): Number of Documents to return. Defaults to 4.
         :param fetch_k (int): Number of Documents to fetch to pass to MMR algorithm.
         :param lambda_mult (float): Number between 0 and 1 that determines the degree
@@ -378,7 +380,10 @@ def max_marginal_relevance_search(
             remove_vector_query_field_from_metadata = False
 
         # Embed the query
-        query_embedding = embedding_service.embed_query(query)
+        if self.embedding_service and not query_embedding:
+            if not query:
+                raise ValueError("specify a query or a query_embedding to search")
+            query_embedding = self.embedding_service.embed_query(query)
 
         # Fetch the initial documents
         got_hits = self.search(
diff --git a/test_elasticsearch/test_server/test_vectorstore/test_vectorstore.py b/test_elasticsearch/test_server/test_vectorstore/test_vectorstore.py
@@ -834,7 +834,6 @@ def test_max_marginal_relevance_search(
         store.add_texts(texts)
 
         mmr_output = store.max_marginal_relevance_search(
-            embedding_service=embedding_service,
             query=texts[0],
             vector_field=vector_field,
             k=3,
@@ -844,7 +843,6 @@ def test_max_marginal_relevance_search(
         assert mmr_output == sim_output
 
         mmr_output = store.max_marginal_relevance_search(
-            embedding_service=embedding_service,
             query=texts[0],
             vector_field=vector_field,
             k=2,
@@ -855,7 +853,6 @@ def test_max_marginal_relevance_search(
         assert mmr_output[1]["_source"][text_field] == texts[1]
 
         mmr_output = store.max_marginal_relevance_search(
-            embedding_service=embedding_service,
             query=texts[0],
             vector_field=vector_field,
             k=2,
@@ -868,7 +865,6 @@ def test_max_marginal_relevance_search(
 
         # if fetch_k < k, then the output will be less than k
         mmr_output = store.max_marginal_relevance_search(
-            embedding_service=embedding_service,
             query=texts[0],
             vector_field=vector_field,
             k=3,