school-ai.git - Gitblit

Merge pull request #16 from h794629435/main

ageerle

2025-03-17 a63cc487894bb6517b706655dbb2adc1f6f0e002

Merge pull request #16 from h794629435/main

本地向量化

已修改1个文件

已添加9个文件

	ruoyi-common/ruoyi-common-chat/src/main/java/org/ruoyi/common/chat/entity/models/LocalModelsSearchRequest.java	38 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	ruoyi-common/ruoyi-common-chat/src/main/java/org/ruoyi/common/chat/entity/models/LocalModelsSearchResponse.java	20 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	ruoyi-common/ruoyi-common-chat/src/main/java/org/ruoyi/common/chat/localModels/LocalModelsofitClient.java	198 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	ruoyi-common/ruoyi-common-chat/src/main/java/org/ruoyi/common/chat/localModels/SearchService.java	25 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	ruoyi-modules/ruoyi-knowledge/src/main/java/org/ruoyi/knowledge/chain/vectorizer/LocalModelsVectorization.java	92 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	ruoyi-modules/ruoyi-knowledge/src/main/java/org/ruoyi/knowledge/chain/vectorizer/OpenAiVectorization.java	56 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	ruoyi-modules/ruoyi-knowledge/src/main/java/org/ruoyi/knowledge/chain/vectorizer/VectorizationType.java	15 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	script/docker/localModels/Dockerfile	21 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	script/docker/localModels/app.py	116 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史
	script/docker/localModels/requirements.txt	3 ●●●●● 补丁 \| 查看 \| 原始文档 \| blame \| 历史

 ruoyi-common/ruoyi-common-chat/src/main/java/org/ruoyi/common/chat/entity/models/LocalModelsSearchRequest.java

¶Ô±ÈÐÂÎÄ¼þ
@@ -0,0 +1,38 @@
package org.ruoyi.common.chat.entity.models;

import lombok.Data;

import java.util.List;

/**
 * @program: RUOYIAI
 * @ClassName LocalModelsSearchRequest
 * @description:
 * @author: hejh
 * @create: 2025-03-15 17:22
 * @Version 1.0
 **/
@Data
public class LocalModelsSearchRequest {

    private List<String> text;
    private String model_name;
    private String delimiter;
    private int k;
    private int block_size;
    private int overlap_chars;

    // æé å½æ°ãGetter å Setter
    public LocalModelsSearchRequest(List<String> text, String model_name, String delimiter, int k, int block_size, int overlap_chars) {
        this.text = text;
        this.model_name = model_name;
        this.delimiter = delimiter;
        this.k = k;
        this.block_size = block_size;
        this.overlap_chars = overlap_chars;
    }


}



 ruoyi-common/ruoyi-common-chat/src/main/java/org/ruoyi/common/chat/entity/models/LocalModelsSearchResponse.java

¶Ô±ÈÐÂÎÄ¼þ
@@ -0,0 +1,20 @@
package org.ruoyi.common.chat.entity.models;
import com.fasterxml.jackson.annotation.JsonIgnoreProperties;
import com.fasterxml.jackson.annotation.JsonProperty;
import lombok.Data;

import java.util.List;

@Data
@JsonIgnoreProperties(ignoreUnknown = true)
public class LocalModelsSearchResponse {
    @JsonProperty("topKEmbeddings")

    private List<List<List<Double>>> topKEmbeddings;  // å¤çä¸å±åµå¥æ°ç»

    // é»è®¤æé å½æ°
    public LocalModelsSearchResponse() {}



}

 ruoyi-common/ruoyi-common-chat/src/main/java/org/ruoyi/common/chat/localModels/LocalModelsofitClient.java

¶Ô±ÈÐÂÎÄ¼þ
@@ -0,0 +1,198 @@
package org.ruoyi.common.chat.localModels;

import io.micrometer.common.util.StringUtils;
import lombok.extern.slf4j.Slf4j;
import okhttp3.OkHttpClient;
import org.ruoyi.common.chat.entity.models.LocalModelsSearchRequest;
import org.ruoyi.common.chat.entity.models.LocalModelsSearchResponse;
import org.springframework.stereotype.Service;
import retrofit2.Call;
import retrofit2.Callback;
import retrofit2.Response;
import retrofit2.Retrofit;
import retrofit2.converter.jackson.JacksonConverterFactory;

import java.util.List;
import java.util.concurrent.CountDownLatch;

@Slf4j
@Service
public class LocalModelsofitClient {
    private static final String BASE_URL = "http://127.0.0.1:5000"; // Flask æå¡ç URL
    private static Retrofit retrofit = null;

    // è·å Retrofit å®ä¾
    public static Retrofit getRetrofitInstance() {
        if (retrofit == null) {
            OkHttpClient client = new OkHttpClient.Builder()
                    .build();

            retrofit = new Retrofit.Builder()
                    .baseUrl(BASE_URL)
                    .client(client)
                    .addConverterFactory(JacksonConverterFactory.create()) // ä½¿ç¨ Jackson å¤ç JSON è½¬æ¢
                    .build();
        }
        return retrofit;
    }

    /**
     * å Flask æå¡åéææ¬åéåè¯·æ±
     *
     * @param queries æ¥è¯¢ææ¬åè¡¨
     * @param modelName æ¨¡ååç§°
     * @param delimiter ææ¬åéç¬¦
     * @param topK è¿åçç»ææ°
     * @param blockSize ææ¬åå¤§å°
     * @param overlapChars éå åç¬¦æ°
     * @return è¿åè®¡ç®å¾å°ç Top K åµå¥åéåè¡¨
     */

    public static List<List<Double>> getTopKEmbeddings(
            List<String> queries,
            String modelName,
            String delimiter,
            int topK,
            int blockSize,
            int overlapChars) {

        modelName = (!StringUtils.isEmpty(modelName)) ? modelName : "msmarco-distilbert-base-tas-b"; // é»è®¤æ¨¡ååç§°
        delimiter = (!StringUtils.isEmpty(delimiter) ) ? delimiter : ".";                             // é»è®¤åéç¬¦
        topK = (topK > 0) ? topK : 3;                                                  // é»è®¤è¿å 3 ä¸ªç»æ
        blockSize = (blockSize > 0) ? blockSize : 500;                                 // é»è®¤ææ¬åå¤§å°ä¸º 500
        overlapChars = (overlapChars > 0) ? overlapChars : 50;                         // é»è®¤éå åç¬¦æ°ä¸º 50

        // åå»º Retrofit å®ä¾
        Retrofit retrofit = getRetrofitInstance();

        // åå»º SearchService æ¥å£
        SearchService service = retrofit.create(SearchService.class);

        // åå»ºè¯·æ±å¯¹è±¡ LocalModelsSearchRequest
        LocalModelsSearchRequest request = new LocalModelsSearchRequest(
                queries,            // æ¥è¯¢ææ¬åè¡¨
                modelName,          // æ¨¡ååç§°
                delimiter,          // ææ¬åéç¬¦
                topK,               // è¿åçç»ææ°
                blockSize,          // ææ¬åå¤§å°
                overlapChars        // éå åç¬¦æ°
        );

        final CountDownLatch latch = new CountDownLatch(1);  // åå»ºä¸ä¸ª CountDownLatch
        final List<List<Double>>[] topKEmbeddings = new List[]{null}; // ä½¿ç¨æ°ç»æ¥åå¨ç»æï¼å ä¸º Java ä¸æ¯æç´æ¥ä¿®æ¹ Listï¼

        // åèµ·å¼æ¥è¯·æ±
        service.vectorize(request).enqueue(new Callback<LocalModelsSearchResponse>() {
            @Override
            public void onResponse(Call<LocalModelsSearchResponse> call, Response<LocalModelsSearchResponse> response) {
                if (response.isSuccessful()) {
                    LocalModelsSearchResponse searchResponse = response.body();
                    if (searchResponse != null) {
                        topKEmbeddings[0] = searchResponse.getTopKEmbeddings().get(0);  // è·åç»æ
                        log.info("Successfully retrieved embeddings");
                    } else {
                        log.error("Response body is null");
                    }
                } else {
                    log.error("Request failed. HTTP error code: " + response.code());
                }
                latch.countDown();  // è¯·æ±å®æï¼åå°è®¡æ°
            }

            @Override
            public void onFailure(Call<LocalModelsSearchResponse> call, Throwable t) {
                t.printStackTrace();
                log.error("Request failed: ", t);
                latch.countDown();  // è¯·æ±å¤±è´¥ï¼åå°è®¡æ°
            }
        });

        try {
            latch.await();  // çå¾è¯·æ±å®æ
        } catch (InterruptedException e) {
            e.printStackTrace();
        }

        return topKEmbeddings[0];  // è¿åç»æ
    }

//    public static void main(String[] args) {
//        // ç¤ºä¾è°ç¨
//        List<String> queries = Arrays.asList("What is artificial intelligence?", "AI is transforming industries.");
//        String modelName = "msmarco-distilbert-base-tas-b";
//        String delimiter = ".";
//        int topK = 3;
//        int blockSize = 500;
//        int overlapChars = 50;
//
//        List<List<Double>> topKEmbeddings = getTopKEmbeddings(queries, modelName, delimiter, topK, blockSize, overlapChars);
//
//        // æå°ç»æ
//        if (topKEmbeddings != null) {
//            System.out.println("Top K embeddings: ");
//            for (List<Double> embedding : topKEmbeddings) {
//                System.out.println(embedding);
//            }
//        } else {
//            System.out.println("No embeddings returned.");
//        }
//    }


//    public static void main(String[] args) {
//        // åå»º Retrofit å®ä¾
//        Retrofit retrofit = LocalModelsofitClient.getRetrofitInstance();
//
//        // åå»º SearchService æ¥å£
//        SearchService service = retrofit.create(SearchService.class);
//
//        // åå»ºè¯·æ±å¯¹è±¡ LocalModelsSearchRequest
//        LocalModelsSearchRequest request = new LocalModelsSearchRequest(
//                Arrays.asList("What is artificial intelligence?", "AI is transforming industries."), // æ¥è¯¢ææ¬åè¡¨
//                "msmarco-distilbert-base-tas-b",  // æ¨¡ååç§°
//                ".",  // åéç¬¦
//                3,  // è¿åçç»ææ°
//                500,  // ææ¬åå¤§å°
//                50  // éå åç¬¦æ°
//        );
//
//        // åèµ·è¯·æ±
//        service.vectorize(request).enqueue(new Callback<LocalModelsSearchResponse>() {
//            @Override
//            public void onResponse(Call<LocalModelsSearchResponse> call, Response<LocalModelsSearchResponse> response) {
//                if (response.isSuccessful()) {
//                    LocalModelsSearchResponse searchResponse = response.body();
//                    System.out.println("Response Body: " + response.body());  // Print the whole response body for debugging
//
//                    if (searchResponse != null) {
//                        // If the response is not null, process it.
//                        // Example: Extract the embeddings and print them
//                        List<List<List<Double>>> topKEmbeddings = searchResponse.getTopKEmbeddings();
//                        if (topKEmbeddings != null) {
//                            // Print the Top K embeddings
//
//                        } else {
//                            System.err.println("Top K embeddings are null");
//                        }
//
//                        // If there is more information you want to process, handle it here
//
//                    } else {
//                        System.err.println("Response body is null");
//                    }
//                } else {
//                    System.err.println("Request failed. HTTP error code: " + response.code());
//                    log.error("Failed to retrieve data. HTTP error code: " + response.code());
//                }
//            }
//
//            @Override
//            public void onFailure(Call<LocalModelsSearchResponse> call, Throwable t) {
//                // è¯·æ±å¤±è´¥ï¼æå°éè¯¯
//                t.printStackTrace();
//                log.error("Request failed: ", t);
//            }
//        });
//    }

}

 ruoyi-common/ruoyi-common-chat/src/main/java/org/ruoyi/common/chat/localModels/SearchService.java

¶Ô±ÈÐÂÎÄ¼þ
@@ -0,0 +1,25 @@
package org.ruoyi.common.chat.localModels;



import org.ruoyi.common.chat.entity.models.LocalModelsSearchRequest;
import org.ruoyi.common.chat.entity.models.LocalModelsSearchResponse;
import retrofit2.Call;
import retrofit2.http.Body;
import retrofit2.http.POST;
/**
 * @program: RUOYIAI
 * @ClassName SearchService
 * @description: è¯·æ±æ¨¡å
 * @author: hejh
 * @create: 2025-03-15 17:27
 * @Version 1.0
 **/


public interface SearchService {
    @POST("/vectorize") // ä¸ Flask æå¡ä¸çè·¯ç±å¹é
    Call<LocalModelsSearchResponse> vectorize(@Body LocalModelsSearchRequest request);
}



 ruoyi-modules/ruoyi-knowledge/src/main/java/org/ruoyi/knowledge/chain/vectorizer/LocalModelsVectorization.java

¶Ô±ÈÐÂÎÄ¼þ
@@ -0,0 +1,92 @@
package org.ruoyi.knowledge.chain.vectorizer;

import jakarta.annotation.Resource;
import lombok.Getter;
import lombok.RequiredArgsConstructor;
import lombok.extern.slf4j.Slf4j;
import org.ruoyi.common.chat.config.ChatConfig;
import org.ruoyi.common.chat.localModels.LocalModelsofitClient;
import org.ruoyi.common.chat.openai.OpenAiStreamClient;
import org.ruoyi.knowledge.domain.vo.KnowledgeInfoVo;
import org.ruoyi.knowledge.service.IKnowledgeInfoService;
import org.springframework.stereotype.Component;

import java.util.ArrayList;
import java.util.List;

@Component
@Slf4j
@RequiredArgsConstructor
public class LocalModelsVectorization   {
    @Resource
    private IKnowledgeInfoService knowledgeInfoService;

    @Resource
    private LocalModelsofitClient localModelsofitClient;

    @Getter
    private OpenAiStreamClient openAiStreamClient;

    private final ChatConfig chatConfig;

    /**
     * æ¹éåéå
     *
     * @param chunkList ææ¬ååè¡¨
     * @param kid ç¥è¯ ID
     * @return åéåç»æ
     */

    public List<List<Double>> batchVectorization(List<String> chunkList, String kid) {
        logVectorizationRequest(kid, chunkList);  // å¨åéåå¼å§åè®°å½æ¥å¿
        openAiStreamClient = chatConfig.getOpenAiStreamClient(); // è·å OpenAi å®¢æ·ç«¯
        KnowledgeInfoVo knowledgeInfoVo = knowledgeInfoService.queryById(Long.valueOf(kid)); // æ¥è¯¢ç¥è¯ä¿¡æ¯
        // è°ç¨ localModelsofitClient è·å Top K åµå¥åé
        try {
            return localModelsofitClient.getTopKEmbeddings(
                    chunkList,
                    knowledgeInfoVo.getVector(),
                    knowledgeInfoVo.getKnowledgeSeparator(),
                    knowledgeInfoVo.getRetrieveLimit(),
                    knowledgeInfoVo.getTextBlockSize(),
                    knowledgeInfoVo.getOverlapChar()
            );
        } catch (Exception e) {
            log.error("Failed to perform batch vectorization for knowledgeId: {}", kid, e);
            throw new RuntimeException("Batch vectorization failed", e);
        }
    }

    /**
     * åä¸ææ¬ååéå
     *
     * @param chunk åä¸ææ¬å
     * @param kid ç¥è¯ ID
     * @return åéåç»æ
     */

    public List<Double> singleVectorization(String chunk, String kid) {
        List<String> chunkList = new ArrayList<>();
        chunkList.add(chunk);

        // è°ç¨æ¹éåéåæ¹æ³
        List<List<Double>> vectorList = batchVectorization(chunkList, kid);

        if (vectorList.isEmpty()) {
            log.warn("Vectorization returned empty list for chunk: {}", chunk);
            return new ArrayList<>();
        }

        return vectorList.get(0); // è¿åç¬¬ä¸ä¸ªåé
    }

    /**
     * æä¾æ´ç®æ´çæ¥å¿è®°å½æ¹æ³
     *
     * @param kid ç¥è¯ ID
     * @param chunkList ææ¬ååè¡¨
     */
    private void logVectorizationRequest(String kid, List<String> chunkList) {
        log.info("Starting vectorization for Knowledge ID: {} with {} chunks.", kid, chunkList.size());
    }
}

 ruoyi-modules/ruoyi-knowledge/src/main/java/org/ruoyi/knowledge/chain/vectorizer/OpenAiVectorization.java

@@ -18,6 +18,7 @@
import java.math.BigDecimal;
import java.util.ArrayList;
import java.util.List;
import java.util.stream.Collectors;

@Component
@Slf4j
@@ -27,6 +28,9 @@
    @Lazy
    @Resource
    private IKnowledgeInfoService knowledgeInfoService;
    @Lazy
    @Resource
    private LocalModelsVectorization localModelsVectorization;

    @Getter
    private OpenAiStreamClient openAiStreamClient;
@@ -35,25 +39,63 @@

    @Override
    public List<List<Double>> batchVectorization(List<String> chunkList, String kid) {
        openAiStreamClient = chatConfig.getOpenAiStreamClient();
        List<List<Double>> vectorList = new ArrayList<>();

        // è·åç¥è¯åºä¿¡æ¯
        KnowledgeInfoVo knowledgeInfoVo = knowledgeInfoService.queryById(Long.valueOf(kid));
        Embedding embedding = Embedding.builder()

        // å¦æä½¿ç¨æ¬å°æ¨¡å
        try {
            return localModelsVectorization.batchVectorization(chunkList, kid);
        } catch (Exception e) {
            log.error("Local models vectorization failed, falling back to OpenAI embeddings", e);
        }

        // å¦ææ¬å°æ¨¡åå¤±è´¥ï¼åè°ç¨ OpenAI æå¡è¿è¡åéå
        Embedding embedding = buildEmbedding(chunkList, knowledgeInfoVo);
        EmbeddingResponse embeddings = openAiStreamClient.embeddings(embedding);

        // å¤ç OpenAI è¿åçåµå¥æ°æ®
        vectorList = processOpenAiEmbeddings(embeddings);

        return vectorList;
    }

    /**
     * æå»º Embedding å¯¹è±¡
     */
    private Embedding buildEmbedding(List<String> chunkList, KnowledgeInfoVo knowledgeInfoVo) {
        return Embedding.builder()
            .input(chunkList)
            .model(knowledgeInfoVo.getVectorModel())
            .build();
        EmbeddingResponse embeddings = openAiStreamClient.embeddings(embedding);
    }

    /**
     * å¤ç OpenAI è¿åçåµå¥æ°æ®
     */
    private List<List<Double>> processOpenAiEmbeddings(EmbeddingResponse embeddings) {
        List<List<Double>> vectorList = new ArrayList<>();

        embeddings.getData().forEach(data -> {
            List<BigDecimal> vector = data.getEmbedding();
            List<Double> doubleVector = new ArrayList<>();
            for (BigDecimal bd : vector) {
                doubleVector.add(bd.doubleValue());
            }
            List<Double> doubleVector = convertToDoubleList(vector);
            vectorList.add(doubleVector);
        });

        return vectorList;
    }

    /**
     * å° BigDecimal è½¬æ¢ä¸º Double åè¡¨
     */
    private List<Double> convertToDoubleList(List<BigDecimal> vector) {
        return vector.stream()
                .map(BigDecimal::doubleValue)
                .collect(Collectors.toList());
    }


    @Override
    public List<Double> singleVectorization(String chunk, String kid) {
        List<String> chunkList = new ArrayList<>();

 ruoyi-modules/ruoyi-knowledge/src/main/java/org/ruoyi/knowledge/chain/vectorizer/VectorizationType.java

¶Ô±ÈÐÂÎÄ¼þ
@@ -0,0 +1,15 @@
package org.ruoyi.knowledge.chain.vectorizer;

public enum VectorizationType {
    OPENAI,    // OpenAI åéå
    LOCAL;     // æ¬å°æ¨¡ååéå

    public static VectorizationType fromString(String type) {
        for (VectorizationType v : values()) {
            if (v.name().equalsIgnoreCase(type)) {
                return v;
            }
        }
        throw new IllegalArgumentException("Unknown VectorizationType: " + type);
    }
}

 script/docker/localModels/Dockerfile

¶Ô±ÈÐÂÎÄ¼þ
@@ -0,0 +1,21 @@
# ä½¿ç¨å®æ¹ Python ä½ä¸ºåºç¡éå
FROM python:3.8-slim

# è®¾ç½®å·¥ä½ç®å½ä¸º /app
WORKDIR /app

# å¤å¶å½åç®å½ä¸çæææä»¶å° Docker å®¹å¨ç /app ç®å½
COPY . /app

# å®è£åºç¨ä¾èµ
RUN pip install --no-cache-dir -r requirements.txt

# æ´é² Flask åºç¨ä½¿ç¨çç«¯å£
EXPOSE 5000

# è®¾ç½®ç¯å¢åé
ENV FLASK_APP=app.py
ENV FLASK_RUN_HOST=0.0.0.0

# å¯å¨ Flask åºç¨
CMD ["flask", "run", "--host=0.0.0.0"]

 script/docker/localModels/app.py

¶Ô±ÈÐÂÎÄ¼þ
@@ -0,0 +1,116 @@
from flask import Flask, request, jsonify
from sentence_transformers import SentenceTransformer
from sklearn.metrics.pairwise import cosine_similarity
import json

app = Flask(__name__)

# åå»ºä¸ä¸ªå¨å±çæ¨¡åç¼ååå¸
model_cache = {}

# åå²ææ¬å
def split_text(text, block_size, overlap_chars, delimiter):
    chunks = text.split(delimiter)
    text_blocks = []
    current_block = ""

    for chunk in chunks:
        if len(current_block) + len(chunk) + 1 <= block_size:
            if current_block:
                current_block += " " + chunk
            else:
                current_block = chunk
        else:
            text_blocks.append(current_block)
            current_block = chunk
    if current_block:
        text_blocks.append(current_block)

    overlap_blocks = []
    for i in range(len(text_blocks)):
        if i > 0:
            overlap_block = text_blocks[i - 1][-overlap_chars:] + text_blocks[i]
            overlap_blocks.append(overlap_block)
        overlap_blocks.append(text_blocks[i])

    return overlap_blocks

# ææ¬åéå
def vectorize_text_blocks(text_blocks, model):
    return model.encode(text_blocks)

# ææ¬æ£ç´¢
def retrieve_top_k(query, knowledge_base, k, block_size, overlap_chars, delimiter, model):
    # å°ç¥è¯åºæåä¸ºææ¬å
    text_blocks = split_text(knowledge_base, block_size, overlap_chars, delimiter)
    # åéåææ¬å
    knowledge_vectors = vectorize_text_blocks(text_blocks, model)
    # åéåæ¥è¯¢ææ¬
    query_vector = model.encode([query]).reshape(1, -1)
    # è®¡ç®ç¸ä¼¼åº¦
    similarities = cosine_similarity(query_vector, knowledge_vectors)
    # è·åç¸ä¼¼åº¦æé«ç k ä¸ªææ¬åçç´¢å¼
    top_k_indices = similarities[0].argsort()[-k:][::-1]

    # è¿åææ¬ååå®ä»¬çåé
    top_k_texts = [text_blocks[i] for i in top_k_indices]
    top_k_embeddings = [knowledge_vectors[i] for i in top_k_indices]

    return top_k_texts, top_k_embeddings

@app.route('/vectorize', methods=['POST'])
def vectorize_text():
    # ä»è¯·æ±ä¸è·å JSON æ°æ®
    data = request.json
    print(f"Received request data: {data}")  # è°è¯è¾åºè¯·æ±æ°æ®

    text_list = data.get("text", [])
    model_name = data.get("model_name", "msmarco-distilbert-base-tas-b")  # é»è®¤æ¨¡å

    delimiter = data.get("delimiter", "\n")  # é»è®¤åéç¬¦
    k = int(data.get("k", 3))  # é»è®¤æ£ç´¢æ¡æ°
    block_size = int(data.get("block_size", 500))  # é»è®¤ææ¬åå¤§å°
    overlap_chars = int(data.get("overlap_chars", 50))  # é»è®¤éå åç¬¦æ°

    if not text_list:
        return jsonify({"error": "Text is required."}), 400

    # æ£æ¥æ¨¡åæ¯å¦å·²ç»å è½½
    if model_name not in model_cache:
        try:
            model = SentenceTransformer(model_name)
            model_cache[model_name] = model  # ç¼åæ¨¡å
        except Exception as e:
            return jsonify({"error": f"Failed to load model: {e}"}), 500

    model = model_cache[model_name]

    top_k_texts_all = []
    top_k_embeddings_all = []

    # å¦æåªæä¸ä¸ªæ¥è¯¢ææ¬
    if len(text_list) == 1:
        top_k_texts, top_k_embeddings = retrieve_top_k(text_list[0], text_list[0], k, block_size, overlap_chars, delimiter, model)
        top_k_texts_all.append(top_k_texts)
        top_k_embeddings_all.append(top_k_embeddings)
    elif len(text_list) > 1:
        # å¦æå¤ä¸ªæ¥è¯¢ææ¬ï¼ä¾æ¬¡å¤ç
        for query in text_list:
            top_k_texts, top_k_embeddings = retrieve_top_k(query, text_list[0], k, block_size, overlap_chars, delimiter, model)
            top_k_texts_all.append(top_k_texts)
            top_k_embeddings_all.append(top_k_embeddings)

    # å°åµå¥åéï¼ndarrayï¼è½¬æ¢ä¸ºå¯åºååçåè¡¨
    top_k_embeddings_all = [[embedding.tolist() for embedding in embeddings] for embeddings in top_k_embeddings_all]

    print(f"Top K texts: {top_k_texts_all}")  # æå°æ£ç´¢å°çææ¬
    print(f"Top K embeddings: {top_k_embeddings_all}")  # æå°æ£ç´¢å°çåé

    # è¿å JSON æ ¼å¼çæ°æ®
    return jsonify({

        "topKEmbeddings": top_k_embeddings_all  # è¿ååµå¥åé
    })

if __name__ == '__main__':
    app.run(host="0.0.0.0", port=5000, debug=True)

 script/docker/localModels/requirements.txt

¶Ô±ÈÐÂÎÄ¼þ
@@ -0,0 +1,3 @@
Flask==2.0.3
sentence-transformers==2.2.0
scikit-learn==0.24.2

¶Ô±ÈÐÂÎÄ¼þ
			@@ -0,0 +1,38 @@
			package org.ruoyi.common.chat.entity.models;

			import lombok.Data;

			import java.util.List;

			/**
			* @program: RUOYIAI
			* @ClassName LocalModelsSearchRequest
			* @description:
			* @author: hejh
			* @create: 2025-03-15 17:22
			* @Version 1.0
			**/
			@Data
			public class LocalModelsSearchRequest {

			private List<String> text;
			private String model_name;
			private String delimiter;
			private int k;
			private int block_size;
			private int overlap_chars;

			// æé å½æ°ãGetter å Setter
			public LocalModelsSearchRequest(List<String> text, String model_name, String delimiter, int k, int block_size, int overlap_chars) {
			this.text = text;
			this.model_name = model_name;
			this.delimiter = delimiter;
			this.k = k;
			this.block_size = block_size;
			this.overlap_chars = overlap_chars;
			}


			}

¶Ô±ÈÐÂÎÄ¼þ
			@@ -0,0 +1,20 @@
			package org.ruoyi.common.chat.entity.models;
			import com.fasterxml.jackson.annotation.JsonIgnoreProperties;
			import com.fasterxml.jackson.annotation.JsonProperty;
			import lombok.Data;

			import java.util.List;

			@Data
			@JsonIgnoreProperties(ignoreUnknown = true)
			public class LocalModelsSearchResponse {
			@JsonProperty("topKEmbeddings")

			private List<List<List<Double>>> topKEmbeddings; // å¤çä¸å±åµå¥æ°ç»

			// é»è®¤æé å½æ°
			public LocalModelsSearchResponse() {}



			}

¶Ô±ÈÐÂÎÄ¼þ
			@@ -0,0 +1,198 @@
			package org.ruoyi.common.chat.localModels;

			import io.micrometer.common.util.StringUtils;
			import lombok.extern.slf4j.Slf4j;
			import okhttp3.OkHttpClient;
			import org.ruoyi.common.chat.entity.models.LocalModelsSearchRequest;
			import org.ruoyi.common.chat.entity.models.LocalModelsSearchResponse;
			import org.springframework.stereotype.Service;
			import retrofit2.Call;
			import retrofit2.Callback;
			import retrofit2.Response;
			import retrofit2.Retrofit;
			import retrofit2.converter.jackson.JacksonConverterFactory;

			import java.util.List;
			import java.util.concurrent.CountDownLatch;

			@Slf4j
			@Service
			public class LocalModelsofitClient {
			private static final String BASE_URL = "http://127.0.0.1:5000"; // Flask æå¡ç URL
			private static Retrofit retrofit = null;

			// è·å Retrofit å®ä¾
			public static Retrofit getRetrofitInstance() {
			if (retrofit == null) {
			OkHttpClient client = new OkHttpClient.Builder()
			.build();

			retrofit = new Retrofit.Builder()
			.baseUrl(BASE_URL)
			.client(client)
			.addConverterFactory(JacksonConverterFactory.create()) // ä½¿ç¨ Jackson å¤ç JSON è½¬æ¢
			.build();
			}
			return retrofit;
			}

			/**
			* å Flask æå¡åéææ¬åéåè¯·æ±
			*
			* @param queries æ¥è¯¢ææ¬åè¡¨
			* @param modelName æ¨¡ååç§°
			* @param delimiter ææ¬åéç¬¦
			* @param topK è¿åçç»ææ°
			* @param blockSize ææ¬åå¤§å°
			* @param overlapChars éå åç¬¦æ°
			* @return è¿åè®¡ç®å¾å°ç Top K åµå¥åéåè¡¨
			*/

			public static List<List<Double>> getTopKEmbeddings(
			List<String> queries,
			String modelName,
			String delimiter,
			int topK,
			int blockSize,
			int overlapChars) {

			modelName = (!StringUtils.isEmpty(modelName)) ? modelName : "msmarco-distilbert-base-tas-b"; // é»è®¤æ¨¡ååç§°
			delimiter = (!StringUtils.isEmpty(delimiter) ) ? delimiter : "."; // é»è®¤åéç¬¦
			topK = (topK > 0) ? topK : 3; // é»è®¤è¿å 3 ä¸ªç»æ
			blockSize = (blockSize > 0) ? blockSize : 500; // é»è®¤ææ¬åå¤§å°ä¸º 500
			overlapChars = (overlapChars > 0) ? overlapChars : 50; // é»è®¤éå åç¬¦æ°ä¸º 50

			// åå»º Retrofit å®ä¾
			Retrofit retrofit = getRetrofitInstance();

			// åå»º SearchService æ¥å£
			SearchService service = retrofit.create(SearchService.class);

			// åå»ºè¯·æ±å¯¹è±¡ LocalModelsSearchRequest
			LocalModelsSearchRequest request = new LocalModelsSearchRequest(
			queries, // æ¥è¯¢ææ¬åè¡¨
			modelName, // æ¨¡ååç§°
			delimiter, // ææ¬åéç¬¦
			topK, // è¿åçç»ææ°
			blockSize, // ææ¬åå¤§å°
			overlapChars // éå åç¬¦æ°
			);

			final CountDownLatch latch = new CountDownLatch(1); // åå»ºä¸ä¸ª CountDownLatch
			final List<List<Double>>[] topKEmbeddings = new List[]{null}; // ä½¿ç¨æ°ç»æ¥åå¨ç»æï¼å ä¸º Java ä¸æ¯æç´æ¥ä¿®æ¹ Listï¼

			// åèµ·å¼æ¥è¯·æ±
			service.vectorize(request).enqueue(new Callback<LocalModelsSearchResponse>() {
			@Override
			public void onResponse(Call<LocalModelsSearchResponse> call, Response<LocalModelsSearchResponse> response) {
			if (response.isSuccessful()) {
			LocalModelsSearchResponse searchResponse = response.body();
			if (searchResponse != null) {
			topKEmbeddings[0] = searchResponse.getTopKEmbeddings().get(0); // è·åç»æ
			log.info("Successfully retrieved embeddings");
			} else {
			log.error("Response body is null");
			}
			} else {
			log.error("Request failed. HTTP error code: " + response.code());
			}
			latch.countDown(); // è¯·æ±å®æï¼åå°è®¡æ°
			}

			@Override
			public void onFailure(Call<LocalModelsSearchResponse> call, Throwable t) {
			t.printStackTrace();
			log.error("Request failed: ", t);
			latch.countDown(); // è¯·æ±å¤±è´¥ï¼åå°è®¡æ°
			}
			});

			try {
			latch.await(); // çå¾è¯·æ±å®æ
			} catch (InterruptedException e) {
			e.printStackTrace();
			}

			return topKEmbeddings[0]; // è¿åç»æ
			}

			// public static void main(String[] args) {
			// // ç¤ºä¾è°ç¨
			// List<String> queries = Arrays.asList("What is artificial intelligence?", "AI is transforming industries.");
			// String modelName = "msmarco-distilbert-base-tas-b";
			// String delimiter = ".";
			// int topK = 3;
			// int blockSize = 500;
			// int overlapChars = 50;
			//
			// List<List<Double>> topKEmbeddings = getTopKEmbeddings(queries, modelName, delimiter, topK, blockSize, overlapChars);
			//
			// // æå°ç»æ
			// if (topKEmbeddings != null) {
			// System.out.println("Top K embeddings: ");
			// for (List<Double> embedding : topKEmbeddings) {
			// System.out.println(embedding);
			// }
			// } else {
			// System.out.println("No embeddings returned.");
			// }
			// }


			// public static void main(String[] args) {
			// // åå»º Retrofit å®ä¾
			// Retrofit retrofit = LocalModelsofitClient.getRetrofitInstance();
			//
			// // åå»º SearchService æ¥å£
			// SearchService service = retrofit.create(SearchService.class);
			//
			// // åå»ºè¯·æ±å¯¹è±¡ LocalModelsSearchRequest
			// LocalModelsSearchRequest request = new LocalModelsSearchRequest(
			// Arrays.asList("What is artificial intelligence?", "AI is transforming industries."), // æ¥è¯¢ææ¬åè¡¨
			// "msmarco-distilbert-base-tas-b", // æ¨¡ååç§°
			// ".", // åéç¬¦
			// 3, // è¿åçç»ææ°
			// 500, // ææ¬åå¤§å°
			// 50 // éå åç¬¦æ°
			// );
			//
			// // åèµ·è¯·æ±
			// service.vectorize(request).enqueue(new Callback<LocalModelsSearchResponse>() {
			// @Override
			// public void onResponse(Call<LocalModelsSearchResponse> call, Response<LocalModelsSearchResponse> response) {
			// if (response.isSuccessful()) {
			// LocalModelsSearchResponse searchResponse = response.body();
			// System.out.println("Response Body: " + response.body()); // Print the whole response body for debugging
			//
			// if (searchResponse != null) {
			// // If the response is not null, process it.
			// // Example: Extract the embeddings and print them
			// List<List<List<Double>>> topKEmbeddings = searchResponse.getTopKEmbeddings();
			// if (topKEmbeddings != null) {
			// // Print the Top K embeddings
			//
			// } else {
			// System.err.println("Top K embeddings are null");
			// }
			//
			// // If there is more information you want to process, handle it here
			//
			// } else {
			// System.err.println("Response body is null");
			// }
			// } else {
			// System.err.println("Request failed. HTTP error code: " + response.code());
			// log.error("Failed to retrieve data. HTTP error code: " + response.code());
			// }
			// }
			//
			// @Override
			// public void onFailure(Call<LocalModelsSearchResponse> call, Throwable t) {
			// // è¯·æ±å¤±è´¥ï¼æå°éè¯¯
			// t.printStackTrace();
			// log.error("Request failed: ", t);
			// }
			// });
			// }

			}

¶Ô±ÈÐÂÎÄ¼þ
			@@ -0,0 +1,25 @@
			package org.ruoyi.common.chat.localModels;



			import org.ruoyi.common.chat.entity.models.LocalModelsSearchRequest;
			import org.ruoyi.common.chat.entity.models.LocalModelsSearchResponse;
			import retrofit2.Call;
			import retrofit2.http.Body;
			import retrofit2.http.POST;
			/**
			* @program: RUOYIAI
			* @ClassName SearchService
			* @description: è¯·æ±æ¨¡å
			* @author: hejh
			* @create: 2025-03-15 17:27
			* @Version 1.0
			**/


			public interface SearchService {
			@POST("/vectorize") // ä¸ Flask æå¡ä¸çè·¯ç±å¹é
			Call<LocalModelsSearchResponse> vectorize(@Body LocalModelsSearchRequest request);
			}

¶Ô±ÈÐÂÎÄ¼þ
			@@ -0,0 +1,92 @@
			package org.ruoyi.knowledge.chain.vectorizer;

			import jakarta.annotation.Resource;
			import lombok.Getter;
			import lombok.RequiredArgsConstructor;
			import lombok.extern.slf4j.Slf4j;
			import org.ruoyi.common.chat.config.ChatConfig;
			import org.ruoyi.common.chat.localModels.LocalModelsofitClient;
			import org.ruoyi.common.chat.openai.OpenAiStreamClient;
			import org.ruoyi.knowledge.domain.vo.KnowledgeInfoVo;
			import org.ruoyi.knowledge.service.IKnowledgeInfoService;
			import org.springframework.stereotype.Component;

			import java.util.ArrayList;
			import java.util.List;

			@Component
			@Slf4j
			@RequiredArgsConstructor
			public class LocalModelsVectorization {
			@Resource
			private IKnowledgeInfoService knowledgeInfoService;

			@Resource
			private LocalModelsofitClient localModelsofitClient;

			@Getter
			private OpenAiStreamClient openAiStreamClient;

			private final ChatConfig chatConfig;

			/**
			* æ¹éåéå
			*
			* @param chunkList ææ¬ååè¡¨
			* @param kid ç¥è¯ ID
			* @return åéåç»æ
			*/

			public List<List<Double>> batchVectorization(List<String> chunkList, String kid) {
			logVectorizationRequest(kid, chunkList); // å¨åéåå¼å§åè®°å½æ¥å¿
			openAiStreamClient = chatConfig.getOpenAiStreamClient(); // è·å OpenAi å®¢æ·ç«¯
			KnowledgeInfoVo knowledgeInfoVo = knowledgeInfoService.queryById(Long.valueOf(kid)); // æ¥è¯¢ç¥è¯ä¿¡æ¯
			// è°ç¨ localModelsofitClient è·å Top K åµå¥åé
			try {
			return localModelsofitClient.getTopKEmbeddings(
			chunkList,
			knowledgeInfoVo.getVector(),
			knowledgeInfoVo.getKnowledgeSeparator(),
			knowledgeInfoVo.getRetrieveLimit(),
			knowledgeInfoVo.getTextBlockSize(),
			knowledgeInfoVo.getOverlapChar()
			);
			} catch (Exception e) {
			log.error("Failed to perform batch vectorization for knowledgeId: {}", kid, e);
			throw new RuntimeException("Batch vectorization failed", e);
			}
			}

			/**
			* åä¸ææ¬ååéå
			*
			* @param chunk åä¸ææ¬å
			* @param kid ç¥è¯ ID
			* @return åéåç»æ
			*/

			public List<Double> singleVectorization(String chunk, String kid) {
			List<String> chunkList = new ArrayList<>();
			chunkList.add(chunk);

			// è°ç¨æ¹éåéåæ¹æ³
			List<List<Double>> vectorList = batchVectorization(chunkList, kid);

			if (vectorList.isEmpty()) {
			log.warn("Vectorization returned empty list for chunk: {}", chunk);
			return new ArrayList<>();
			}

			return vectorList.get(0); // è¿åç¬¬ä¸ä¸ªåé
			}

			/**
			* æä¾æ´ç®æ´çæ¥å¿è®°å½æ¹æ³
			*
			* @param kid ç¥è¯ ID
			* @param chunkList ææ¬ååè¡¨
			*/
			private void logVectorizationRequest(String kid, List<String> chunkList) {
			log.info("Starting vectorization for Knowledge ID: {} with {} chunks.", kid, chunkList.size());
			}
			}

			@@ -18,6 +18,7 @@
			import java.math.BigDecimal;
			import java.util.ArrayList;
			import java.util.List;
			import java.util.stream.Collectors;

			@Component
			@Slf4j
			@@ -27,6 +28,9 @@
			@Lazy
			@Resource
			private IKnowledgeInfoService knowledgeInfoService;
			@Lazy
			@Resource
			private LocalModelsVectorization localModelsVectorization;

			@Getter
			private OpenAiStreamClient openAiStreamClient;
			@@ -35,25 +39,63 @@

			@Override
			public List<List<Double>> batchVectorization(List<String> chunkList, String kid) {
			openAiStreamClient = chatConfig.getOpenAiStreamClient();
			List<List<Double>> vectorList = new ArrayList<>();

			// è·åç¥è¯åºä¿¡æ¯
			KnowledgeInfoVo knowledgeInfoVo = knowledgeInfoService.queryById(Long.valueOf(kid));
			Embedding embedding = Embedding.builder()

			// å¦æä½¿ç¨æ¬å°æ¨¡å
			try {
			return localModelsVectorization.batchVectorization(chunkList, kid);
			} catch (Exception e) {
			log.error("Local models vectorization failed, falling back to OpenAI embeddings", e);
			}

			// å¦ææ¬å°æ¨¡åå¤±è´¥ï¼åè°ç¨ OpenAI æå¡è¿è¡åéå
			Embedding embedding = buildEmbedding(chunkList, knowledgeInfoVo);
			EmbeddingResponse embeddings = openAiStreamClient.embeddings(embedding);

			// å¤ç OpenAI è¿åçåµå¥æ°æ®
			vectorList = processOpenAiEmbeddings(embeddings);

			return vectorList;
			}

			/**
			* æå»º Embedding å¯¹è±¡
			*/
			private Embedding buildEmbedding(List<String> chunkList, KnowledgeInfoVo knowledgeInfoVo) {
			return Embedding.builder()
			.input(chunkList)
			.model(knowledgeInfoVo.getVectorModel())
			.build();
			EmbeddingResponse embeddings = openAiStreamClient.embeddings(embedding);
			}

			/**
			* å¤ç OpenAI è¿åçåµå¥æ°æ®
			*/
			private List<List<Double>> processOpenAiEmbeddings(EmbeddingResponse embeddings) {
			List<List<Double>> vectorList = new ArrayList<>();

			embeddings.getData().forEach(data -> {
			List<BigDecimal> vector = data.getEmbedding();
			List<Double> doubleVector = new ArrayList<>();
			for (BigDecimal bd : vector) {
			doubleVector.add(bd.doubleValue());
			}
			List<Double> doubleVector = convertToDoubleList(vector);
			vectorList.add(doubleVector);
			});

			return vectorList;
			}

			/**
			* å° BigDecimal è½¬æ¢ä¸º Double åè¡¨
			*/
			private List<Double> convertToDoubleList(List<BigDecimal> vector) {
			return vector.stream()
			.map(BigDecimal::doubleValue)
			.collect(Collectors.toList());
			}


			@Override
			public List<Double> singleVectorization(String chunk, String kid) {
			List<String> chunkList = new ArrayList<>();

¶Ô±ÈÐÂÎÄ¼þ
			@@ -0,0 +1,15 @@
			package org.ruoyi.knowledge.chain.vectorizer;

			public enum VectorizationType {
			OPENAI, // OpenAI åéå
			LOCAL; // æ¬å°æ¨¡ååéå

			public static VectorizationType fromString(String type) {
			for (VectorizationType v : values()) {
			if (v.name().equalsIgnoreCase(type)) {
			return v;
			}
			}
			throw new IllegalArgumentException("Unknown VectorizationType: " + type);
			}
			}

¶Ô±ÈÐÂÎÄ¼þ
			@@ -0,0 +1,21 @@
			# ä½¿ç¨å®æ¹ Python ä½ä¸ºåºç¡éå
			FROM python:3.8-slim

			# è®¾ç½®å·¥ä½ç®å½ä¸º /app
			WORKDIR /app

			# å¤å¶å½åç®å½ä¸çæææä»¶å° Docker å®¹å¨ç /app ç®å½
			COPY . /app

			# å®è£åºç¨ä¾èµ
			RUN pip install --no-cache-dir -r requirements.txt

			# æ´é² Flask åºç¨ä½¿ç¨çç«¯å£
			EXPOSE 5000

			# è®¾ç½®ç¯å¢åé
			ENV FLASK_APP=app.py
			ENV FLASK_RUN_HOST=0.0.0.0

			# å¯å¨ Flask åºç¨
			CMD ["flask", "run", "--host=0.0.0.0"]

¶Ô±ÈÐÂÎÄ¼þ
			@@ -0,0 +1,116 @@
			from flask import Flask, request, jsonify
			from sentence_transformers import SentenceTransformer
			from sklearn.metrics.pairwise import cosine_similarity
			import json

			app = Flask(__name__)

			# åå»ºä¸ä¸ªå¨å±çæ¨¡åç¼ååå¸
			model_cache = {}

			# åå²ææ¬å
			def split_text(text, block_size, overlap_chars, delimiter):
			chunks = text.split(delimiter)
			text_blocks = []
			current_block = ""

			for chunk in chunks:
			if len(current_block) + len(chunk) + 1 <= block_size:
			if current_block:
			current_block += " " + chunk
			else:
			current_block = chunk
			else:
			text_blocks.append(current_block)
			current_block = chunk
			if current_block:
			text_blocks.append(current_block)

			overlap_blocks = []
			for i in range(len(text_blocks)):
			if i > 0:
			overlap_block = text_blocks[i - 1][-overlap_chars:] + text_blocks[i]
			overlap_blocks.append(overlap_block)
			overlap_blocks.append(text_blocks[i])

			return overlap_blocks

			# ææ¬åéå
			def vectorize_text_blocks(text_blocks, model):
			return model.encode(text_blocks)

			# ææ¬æ£ç´¢
			def retrieve_top_k(query, knowledge_base, k, block_size, overlap_chars, delimiter, model):
			# å°ç¥è¯åºæåä¸ºææ¬å
			text_blocks = split_text(knowledge_base, block_size, overlap_chars, delimiter)
			# åéåææ¬å
			knowledge_vectors = vectorize_text_blocks(text_blocks, model)
			# åéåæ¥è¯¢ææ¬
			query_vector = model.encode([query]).reshape(1, -1)
			# è®¡ç®ç¸ä¼¼åº¦
			similarities = cosine_similarity(query_vector, knowledge_vectors)
			# è·åç¸ä¼¼åº¦æé«ç k ä¸ªææ¬åçç´¢å¼
			top_k_indices = similarities[0].argsort()[-k:][::-1]

			# è¿åææ¬ååå®ä»¬çåé
			top_k_texts = [text_blocks[i] for i in top_k_indices]
			top_k_embeddings = [knowledge_vectors[i] for i in top_k_indices]

			return top_k_texts, top_k_embeddings

			@app.route('/vectorize', methods=['POST'])
			def vectorize_text():
			# ä»è¯·æ±ä¸è·å JSON æ°æ®
			data = request.json
			print(f"Received request data: {data}") # è°è¯è¾åºè¯·æ±æ°æ®

			text_list = data.get("text", [])
			model_name = data.get("model_name", "msmarco-distilbert-base-tas-b") # é»è®¤æ¨¡å

			delimiter = data.get("delimiter", "\n") # é»è®¤åéç¬¦
			k = int(data.get("k", 3)) # é»è®¤æ£ç´¢æ¡æ°
			block_size = int(data.get("block_size", 500)) # é»è®¤ææ¬åå¤§å°
			overlap_chars = int(data.get("overlap_chars", 50)) # é»è®¤éå åç¬¦æ°

			if not text_list:
			return jsonify({"error": "Text is required."}), 400

			# æ£æ¥æ¨¡åæ¯å¦å·²ç»å è½½
			if model_name not in model_cache:
			try:
			model = SentenceTransformer(model_name)
			model_cache[model_name] = model # ç¼åæ¨¡å
			except Exception as e:
			return jsonify({"error": f"Failed to load model: {e}"}), 500

			model = model_cache[model_name]

			top_k_texts_all = []
			top_k_embeddings_all = []

			# å¦æåªæä¸ä¸ªæ¥è¯¢ææ¬
			if len(text_list) == 1:
			top_k_texts, top_k_embeddings = retrieve_top_k(text_list[0], text_list[0], k, block_size, overlap_chars, delimiter, model)
			top_k_texts_all.append(top_k_texts)
			top_k_embeddings_all.append(top_k_embeddings)
			elif len(text_list) > 1:
			# å¦æå¤ä¸ªæ¥è¯¢ææ¬ï¼ä¾æ¬¡å¤ç
			for query in text_list:
			top_k_texts, top_k_embeddings = retrieve_top_k(query, text_list[0], k, block_size, overlap_chars, delimiter, model)
			top_k_texts_all.append(top_k_texts)
			top_k_embeddings_all.append(top_k_embeddings)

			# å°åµå¥åéï¼ndarrayï¼è½¬æ¢ä¸ºå¯åºååçåè¡¨
			top_k_embeddings_all = [[embedding.tolist() for embedding in embeddings] for embeddings in top_k_embeddings_all]

			print(f"Top K texts: {top_k_texts_all}") # æå°æ£ç´¢å°çææ¬
			print(f"Top K embeddings: {top_k_embeddings_all}") # æå°æ£ç´¢å°çåé

			# è¿å JSON æ ¼å¼çæ°æ®
			return jsonify({

			"topKEmbeddings": top_k_embeddings_all # è¿ååµå¥åé
			})

			if __name__ == '__main__':
			app.run(host="0.0.0.0", port=5000, debug=True)

¶Ô±ÈÐÂÎÄ¼þ
			@@ -0,0 +1,3 @@
			Flask==2.0.3
			sentence-transformers==2.2.0
			scikit-learn==0.24.2