EmbeddingStoreRetriever

EmbeddingStoreRetriever

Retrieve context from an embedding store

yaml
type: io.kestra.plugin.ai.retriever.EmbeddingStoreRetriever

Examples

yaml
id: embeddingstoreretriever
type: io.kestra.plugin.ai.retriever.EmbeddingStoreRetriever
id: agent_with_rag
namespace: company.ai

tasks:
  - id: ingest
    type: io.kestra.plugin.ai.rag.IngestDocument
    provider:
      type: io.kestra.plugin.ai.provider.GoogleGemini
      modelName: gemini-embedding-exp-03-07
      googleApiKey: "{{ secret('GEMINI_API_KEY') }}"
    embeddings:
      type: io.kestra.plugin.ai.embeddings.KestraKVStore
    drop: true
    fromDocuments:
      - content: Paris is the capital of France with a population of over 2.1 million people
      - content: The Eiffel Tower is the most famous landmark in Paris at 330 meters tall

  - id: agent
    type: io.kestra.plugin.ai.agent.AIAgent
    provider:
      type: io.kestra.plugin.ai.provider.GoogleGemini
      modelName: gemini-2.0-flash
      googleApiKey: "{{ secret('GEMINI_API_KEY') }}"
    contentRetrievers:
      - type: io.kestra.plugin.ai.retriever.EmbeddingStoreRetriever
        embeddings:
          type: io.kestra.plugin.ai.embeddings.KestraKVStore
        embeddingProvider:
          type: io.kestra.plugin.ai.provider.GoogleGemini
          modelName: gemini-embedding-exp-03-07
          googleApiKey: "{{ secret('GEMINI_API_KEY') }}"
        maxResults: 3
        minScore: 0.0
    prompt: What is the capital of France and how many people live there?

yaml
id: embeddingstoreretriever
type: io.kestra.plugin.ai.retriever.EmbeddingStoreRetriever
id: multi_store_rag
namespace: company.ai

tasks:
  - id: agent
    type: io.kestra.plugin.ai.agent.AIAgent
    provider:
      type: io.kestra.plugin.ai.provider.GoogleGemini
      modelName: gemini-2.0-flash
      googleApiKey: "{{ secret('GEMINI_API_KEY') }}"
    contentRetrievers:
      - type: io.kestra.plugin.ai.retriever.EmbeddingStoreRetriever
        embeddings:
          type: io.kestra.plugin.ai.embeddings.Pinecone
          pineconeApiKey: "{{ secret('PINECONE_API_KEY') }}"
          index: technical-docs
        embeddingProvider:
          type: io.kestra.plugin.ai.provider.OpenAI
          googleApiKey: "{{ secret('OPENAI_API_KEY') }}"
          modelName: text-embedding-3-small
      - type: io.kestra.plugin.ai.retriever.EmbeddingStoreRetriever
        embeddings:
          type: io.kestra.plugin.ai.embeddings.Qdrant
          host: localhost
          port: 6333
          collectionName: business-docs
        embeddingProvider:
          type: io.kestra.plugin.ai.provider.GoogleGemini
          modelName: gemini-embedding-exp-03-07
          googleApiKey: "{{ secret('GEMINI_API_KEY') }}"
      - type: io.kestra.plugin.ai.retriever.TavilyWebSearch
        tavilyApiKey: "{{ secret('TAVILY_API_KEY') }}"
    prompt: What are the latest trends in data orchestration?

Properties

embeddingProvider *

Definitions

Use Amazon Bedrock models

accessKeyId*string

modelName*string

secretAccessKey*string

baseUrlstring

caPemstring

clientPemstring

modelTypestring

DefaultCOHERE

Possible Values

COHERETITAN

typeobject

Possible Values

io.kestra.plugin.ai.provider.AmazonBedrockio.kestra.plugin.langchain4j.provider.AmazonBedrock

Use Anthropic Claude models

apiKey*string

modelName*string

baseUrlstring

caPemstring

clientPemstring

maxTokensintegerstring

typeobject

Possible Values

io.kestra.plugin.ai.provider.Anthropicio.kestra.plugin.langchain4j.provider.Anthropic

Use Azure OpenAI deployments

endpoint*string

modelName*string

apiKeystring

baseUrlstring

caPemstring

clientIdstring

clientPemstring

clientSecretstring

serviceVersionstring

tenantIdstring

typeobject

Possible Values

io.kestra.plugin.ai.provider.AzureOpenAIio.kestra.plugin.langchain4j.provider.AzureOpenAI

Use DashScope (Qwen) models

apiKey*string

modelName*string

baseUrlstring

Defaulthttps://dashscope-intl.aliyuncs.com/api/v1

caPemstring

clientPemstring

enableSearchbooleanstring

maxTokensintegerstring

repetitionPenaltynumberstring

typeobject

Use DeepSeek models

apiKey*string

modelName*string

baseUrlstring

Defaulthttps://api.deepseek.com/v1

caPemstring

clientPemstring

typeobject

Possible Values

io.kestra.plugin.ai.provider.DeepSeekio.kestra.plugin.langchain4j.provider.DeepSeek

Use GitHub Models via Azure AI Inference

gitHubToken*string

modelName*string

baseUrlstring

caPemstring

clientPemstring

typeobject

Use Google Gemini models

apiKey*string

modelName*string

baseUrlstring

caPemstring

clientPemstring

embeddingModelConfiguration

io.kestra.plugin.ai.provider.GoogleGemini-EmbeddingModelConfiguration

maxRetriesintegerstring

outputDimensionalityintegerstring

taskTypestring

Possible Values

RETRIEVAL_QUERYRETRIEVAL_DOCUMENTSEMANTIC_SIMILARITYCLASSIFICATIONCLUSTERINGQUESTION_ANSWERINGFACT_VERIFICATION

timeoutstring

titleMetadataKeystring

typeobject

Possible Values

io.kestra.plugin.ai.provider.GoogleGeminiio.kestra.plugin.langchain4j.provider.GoogleGemini

Use Google Vertex AI models

endpoint*string

location*string

modelName*string

project*string

baseUrlstring

caPemstring

clientPemstring

typeobject

Possible Values

io.kestra.plugin.ai.provider.GoogleVertexAIio.kestra.plugin.langchain4j.provider.GoogleVertexAI

Use Hugging Face Inference endpoints

apiKey*string

modelName*string

baseUrlstring

Defaulthttps://router.huggingface.co/v1

caPemstring

clientPemstring

typeobject

Use LocalAI OpenAI-compatible server

baseUrl*string

modelName*string

caPemstring

clientPemstring

typeobject

Possible Values

io.kestra.plugin.ai.provider.LocalAIio.kestra.plugin.langchain4j.provider.LocalAI

Use Mistral models

apiKey*string

modelName*string

baseUrlstring

caPemstring

clientPemstring

typeobject

Possible Values

io.kestra.plugin.ai.provider.MistralAIio.kestra.plugin.langchain4j.provider.MistralAI

Use OCI Generative AI models

compartmentId*string

modelName*string

region*string

authProviderstring

baseUrlstring

caPemstring

clientPemstring

typeobject

Use local Ollama models

endpoint*string

modelName*string

baseUrlstring

caPemstring

clientPemstring

typeobject

Possible Values

io.kestra.plugin.ai.provider.Ollamaio.kestra.plugin.langchain4j.provider.Ollama

Use OpenAI models

apiKey*string

modelName*string

baseUrlstring

Defaulthttps://api.openai.com/v1

caPemstring

clientPemstring

typeobject

Possible Values

io.kestra.plugin.ai.provider.OpenAIio.kestra.plugin.langchain4j.provider.OpenAI

Use OpenRouter models

apiKey*string

modelName*string

baseUrlstring

caPemstring

clientPemstring

typeobject

Possible Values

io.kestra.plugin.ai.provider.OpenRouterio.kestra.plugin.langchain4j.provider.OpenRouter

Use IBM watsonx.ai models

apiKey*string

modelName*string

projectId*string

baseUrlstring

caPemstring

clientPemstring

typeobject

Use Cloudflare Workers AI models

accountId*string

apiKey*string

modelName*string

baseUrlstring

caPemstring

clientPemstring

typeobject

Possible Values

io.kestra.plugin.ai.provider.WorkersAIio.kestra.plugin.langchain4j.provider.WorkersAI

Use ZhiPu AI models

apiKey*string

modelName*string

baseUrlstring

Defaulthttps://open.bigmodel.cn/

caPemstring

clientPemstring

maxRetriesintegerstring

maxTokenintegerstring

stopsarray

SubTypestring

typeobject

embeddings *

Definitions

Store embeddings in Chroma

baseUrl*string

collectionName*string

typeobject

Possible Values

io.kestra.plugin.ai.embeddings.Chromaio.kestra.plugin.langchain4j.embeddings.Chroma

Store embeddings in Elasticsearch

connection*

io.kestra.plugin.ai.embeddings.Elasticsearch-ElasticsearchConnection

hosts*array

SubTypestring

Min items1

basicAuth

io.kestra.plugin.ai.embeddings.Elasticsearch-ElasticsearchConnection-BasicAuth

passwordstring

usernamestring

headersarray

SubTypestring

pathPrefixstring

strictDeprecationModebooleanstring

trustAllSslbooleanstring

indexName*string

typeobject

Possible Values

io.kestra.plugin.ai.embeddings.Elasticsearchio.kestra.plugin.langchain4j.embeddings.Elasticsearch

Prototype embeddings in Kestra KV

kvNamestring

Default{{flow.id}}-embedding-store

typeobject

Possible Values

io.kestra.plugin.ai.embeddings.KestraKVStoreio.kestra.plugin.langchain4j.embeddings.KestraKVStore

Store embeddings in MariaDB

createTable*booleanstring

databaseUrl*string

fieldName*string

password*string

tableName*string

username*string

columnDefinitionsarray

SubTypestring

indexesarray

SubTypestring

metadataStorageModestring

DefaultCOLUMN_PER_KEY

typeobject

Store embeddings in Milvus

token*string

autoFlushOnDeletebooleanstring

autoFlushOnInsertbooleanstring

collectionNamestring

consistencyLevelstring

databaseNamestring

hoststring

idFieldNamestring

indexTypestring

metadataFieldNamestring

metricTypestring

passwordstring

portintegerstring

retrieveEmbeddingsOnSearchbooleanstring

textFieldNamestring

typeobject

Possible Values

io.kestra.plugin.ai.embeddings.Milvusio.kestra.plugin.langchain4j.embeddings.Milvus

uristring

usernamestring

vectorFieldNamestring

Store embeddings in MongoDB Atlas

collectionName*string

host*string

indexName*string

scheme*string

createIndexbooleanstring

databasestring

metadataFieldNamesarray

SubTypestring

optionsobject

passwordstring

typeobject

Possible Values

io.kestra.plugin.ai.embeddings.MongoDBAtlasio.kestra.plugin.langchain4j.embeddings.MongoDBAtlas

usernamestring

Store embeddings with pgvector

database*string

host*string

password*string

port*integerstring

table*string

user*string

typeobject

Possible Values

io.kestra.plugin.ai.embeddings.PGVectorio.kestra.plugin.langchain4j.embeddings.PGVector

useIndexbooleanstring

Defaultfalse

Store embeddings in Pinecone

apiKey*string

cloud*string

index*string

region*string

namespacestring

typeobject

Possible Values

io.kestra.plugin.ai.embeddings.Pineconeio.kestra.plugin.langchain4j.embeddings.Pinecone

Store embeddings in Qdrant

apiKey*string

collectionName*string

host*string

port*integerstring

typeobject

Possible Values

io.kestra.plugin.ai.embeddings.Qdrantio.kestra.plugin.langchain4j.embeddings.Qdrant

Store embeddings in Redis

host*string

port*integerstring

indexNamestring

Defaultembedding-index

typeobject

Store embeddings in Alibaba Tablestore

accessKeyId*string

accessKeySecret*string

endpoint*string

instanceName*string

metadataSchemaListarray

com.alicloud.openservices.tablestore.model.search.FieldSchema

analyzerstring

Possible Values

SingleWordMaxWordMinWordSplitFuzzy

analyzerParameter

com.alicloud.openservices.tablestore.model.search.analysis.AnalyzerParameter

dateFormatsarray

SubTypestring

enableHighlightingboolean

enableSortAndAggboolean

fieldNamestring

fieldTypestring

Possible Values

LONGDOUBLEBOOLEANKEYWORDTEXTNESTEDGEO_POINTDATEVECTORFUZZY_KEYWORDIPJSONUNKNOWN

indexboolean

indexOptionsstring

Possible Values

DOCSFREQSPOSITIONSOFFSETS

isArrayboolean

jsonTypestring

Possible Values

FLATTENNESTED

sourceFieldNamesarray

SubTypestring

storeboolean

subFieldSchemasarray

com.alicloud.openservices.tablestore.model.search.FieldSchema

analyzerstring

Possible Values

SingleWordMaxWordMinWordSplitFuzzy

analyzerParameter

dateFormatsarray

SubTypestring

enableHighlightingboolean

enableSortAndAggboolean

fieldNamestring

fieldTypestring

Possible Values

LONGDOUBLEBOOLEANKEYWORDTEXTNESTEDGEO_POINTDATEVECTORFUZZY_KEYWORDIPJSONUNKNOWN

indexboolean

indexOptionsstring

Possible Values

DOCSFREQSPOSITIONSOFFSETS

isArrayboolean

jsonTypestring

Possible Values

FLATTENNESTED

sourceFieldNamesarray

SubTypestring

storeboolean

subFieldSchemasarray

vectorOptions

com.alicloud.openservices.tablestore.model.search.vector.VectorOptions

dataTypestring

dimensioninteger

metricTypestring

Possible Values

EUCLIDEANCOSINEDOT_PRODUCT

typeobject

Store embeddings in Weaviate

apiKey*string

host*string

avoidDupsbooleanstring

consistencyLevelstring

Possible Values

ONEQUORUMALL

grpcPortintegerstring

metadataFieldNamestring

metadataKeysarray

SubTypestring

objectClassstring

portintegerstring

schemestring

securedGrpcbooleanstring

typeobject

Possible Values

io.kestra.plugin.ai.embeddings.Weaviateio.kestra.plugin.langchain4j.embeddings.Weaviate

useGrpcForInsertsbooleanstring

maxResults integerstring

Default3

minScore numberstring

Default0.0

Weaviate

Tasks that manage and query vectors in Weaviate.

DataAI

Klaviyo

Tasks that interact with Klaviyo campaign APIs.

AIBusiness

Huggingface

Tasks that call Hugging Face Inference APIs.

EmbeddingStoreRetriever

Retrieve context from an embedding store

More Plugins in this Category

Weaviate

Klaviyo

Huggingface

1.7.0

EmbeddingStoreRetriever Retrieve context from an embedding store

More Plugins in this Category

Weaviate

Klaviyo

Huggingface

1.7.0

EmbeddingStoreRetriever

Retrieve context from an embedding store