增加queueing对接

2024-11-21 22:52:02 +08:00 · 2024-11-21 22:52:02 +08:00 · 26ea7e395d
parent 6e66ccffd6
commit 26ea7e395d
8 changed files with 175 additions and 58 deletions
--- a/.gitignore
+++ b/.gitignore
@ -1,2 +1,3 @@
 /venv/
 /__pycache__/
 /logs
--- a/config.json
+++ b/config.json
@ -0,0 +1,22 @@
 {
    "abp": {
      "api_base": "https://stag-abp-api.iconsz.com",
      "tenant": "ics",
      "username": "ics",
      "password": "1qaz@WSX",
      "client_id": "engine_InfoExtractor",
      "client_secret": "7ii7U9AabN2*3000",    
      "scope": "FX"
    },
    "engine": {
    },
    "queue_processor": {
      "get_pending_queue_interval_seconds": 2
    },
    "queue_client": {
      "check_queue_interval_seconds": 1,
      "call_wait_return_default_timeout_seconds": 60
    }
  }
--- a/config.py
+++ b/config.py
@ -1,3 +1,4 @@
-API_KEY = 'ollama'
+API_KEY = "ollama"
-MODEL = 'qwen2.5:32b-instruct-q5_K_M'
+MODEL = "qwen2.5:32b-instruct-q5_K_M"
-LLM_BASE_URL = 'http://localhost:11434/v1'
+# MODEL = "qwen2.5:7b"
 LLM_BASE_URL = "http://localhost:11434/v1"
--- a/entity_extraction_process.py
+++ b/entity_extraction_process.py
@ -0,0 +1,39 @@
 from dotenv import load_dotenv
 load_dotenv()
 import time
 from openai import OpenAI
 from datetime import datetime
 import config, debug, prompt, json
 """
 备注：
    目前使用ollama部署的qwen2.5:32b-instruct-q5_K_M, 
    如果输入字符串过长(大致超过1000个字符或1500token)会因上下文窗口过短导致提示词被遗忘，
    进而输出不合规定的结果！
 """
 llm = OpenAI(base_url=config.LLM_BASE_URL, api_key=config.API_KEY)
 class entityExtractionProcess:
    def entity_extract(input_text):
        messages = [
            {"role": "system", "content": prompt.ENTITY_EXTRACT},
            {"role": "system", "content": f"今天的日期是：{str(datetime.today())}"},
            {"role": "user", "content": f"{input_text}"},
        ]
        timenow = time.time()
        response = (
            llm.chat.completions.create(
                model=config.MODEL, messages=messages, temperature=0, max_tokens=128_000
            )
            .choices[0]
            .message.content
        )
        print(f"本次输出花费时间：{time.time() - timenow} 秒")
        return json.loads(response)
--- a/iCloudEngine.git.bat
+++ b/iCloudEngine.git.bat
@ -0,0 +1,2 @@
 git clone https://gitea.iconsz.com/iCON/iCloudEngine.git
 pause
--- a/main.py
+++ b/main.py
@ -1,70 +1,57 @@
 from dotenv import load_dotenv
 load_dotenv()
 import time
 from openai import OpenAI
 from datetime import datetime
 import config, debug, prompt
 from entity_extraction_process import entityExtractionProcess
 import os, sys, time, json, traceback
 from utils.logger import logger
 DEBUG = True
-'''
+base_dir = os.path.dirname(os.path.abspath(__file__))
-备注：
+relative_path = os.path.join(base_dir, "iCloudEngine/src")
-    目前使用ollama部署的qwen2.5:32b-instruct-q5_K_M, 
+sys.path.append(relative_path)
-    如果输入字符串过长(大致超过1000个字符或1500token)会因上下文窗口过短导致提示词被遗忘，
+from queue_processor import QueueProcessor
    进而输出不合规定的结果！
 '''
-llm = OpenAI(
+DEBUG = False
        base_url=config.LLM_BASE_URL,
        api_key=config.API_KEY
    )
 def get_task() -> str:
    # 从引擎中获取任务的接口
    # 返回的类型应为字符串或None
    raise NotImplementedError
-def push_result(result):
+class Main(QueueProcessor):
-    # 将提取结果返回给引擎的接口
+    def processor_handle(self, input):
-    raise NotImplementedError
+        print("input:", input)
        currentEngineId = input["currentEngineId"]
        inputData = json.loads(input["inputData"])
        match currentEngineId:
            case 3000:  # InfoExtractor 实体信息提取
                input_text = inputData["text"]
                return entityExtractionProcess.entity_extract(input_text)
 def entity_extract(input_text):
    messages = [
        {"role": "system", "content": prompt.ENTITY_EXTRACT},
        {"role": "system", "content": f"今天的日期是：{str(datetime.today())}"},
        {"role": "user", "content": f"{input_text}"}
    ]
    timenow = time.time()
    response = llm.chat.completions.create(
        model=config.MODEL,
        messages=messages,
        temperature=0,
        max_tokens=128_000
    ).choices[0].message.content
    print(f"本次输出花费时间：{time.time() - timenow} 秒")
    return response
 def run():
    if DEBUG:
        input_text = debug.input_text
    else:
        input_text = get_task()
        if not input_text:
            return
    response = entity_extract(input_text)
    if DEBUG:
        print(response)
    else:
        push_result(response)
 if __name__ == "__main__":
    if DEBUG:
-        run()
+        input_text = debug.input_text
        response = entityExtractionProcess.entity_extract(input_text)
        print(response)
        exit()
-    while True:
+    else:
-        run()
+        logger.warning("application start")
-        time.sleep(5)
+        try:
            Main().startV2()
        except Exception as e:
            logger.warning(f"excute exception:{e}")
            exc_type, exc_value, exc_traceback = sys.exc_info()
            traceback_details = traceback.extract_tb(exc_traceback)
            filename, line_number, function_name, text = traceback_details[-1]
            logger.error(f"Exception occurred in {filename} at line {line_number}: {e}")
            logger.error(f"Function name: {function_name}")
            logger.error(f"Text: {text}")
            import traceback
            logger.warning(f"Crawler_NewsCN {traceback.format_exc()}")
        finally:
            logger.warning("application completed")
--- a/submit_test.py
+++ b/submit_test.py
@ -0,0 +1,23 @@
 import os, sys
 base_dir = os.path.dirname(os.path.abspath(__file__))
 relative_path = os.path.join(base_dir, "iCloudEngine/src")
 sys.path.append(relative_path)
 from queue_client import QueueClient
 class submit_test:
    def submit(code, data):
        client = QueueClient()
        returnData = client.call(code, data)
        print(returnData)
 # # 创建一个测试队列：3000 / 实体关系提取。输入一段话，提取人物姓名、性别、出生日期、年龄、职位等信息
 submit_test.submit(
    3000,
    {
        "text": "范九伦简历\n\n范九伦，男，汉族，1964年11月生，研究生，民盟盟员、中共党员，现任民盟中央常委、陕西省委会主委，省政协副主席，西安邮电大学校长"
    },
 )
--- a/utils/logger.py
+++ b/utils/logger.py
@ -0,0 +1,42 @@
 import logging
 import os
 from datetime import datetime
 import requests
 if not os.path.exists("logs"):
    os.makedirs("logs")
 # 配置日志的基本设置
 logging.basicConfig(
    filename=os.path.join("logs", datetime.now().strftime("%Y-%m-%d") + ".log"),
    level=logging.WARNING,
    format="%(asctime)s:%(levelname)s:%(message)s",
    filemode="a",
    encoding="utf-8",
 )
 # 设置requests库的日志级别为WARNING或更高，以确保不记录INFO或DEBUG级别的日志
 logging.getLogger("requests").setLevel(logging.WARNING)
 logging.getLogger("urllib3").setLevel(logging.WARNING)
 logging.getLogger("elasticsearch").setLevel(logging.WARNING)
 class logger:
    # def debug(msg: str):
    #     logging.debug(msg)
    # def info(msg: str):
    # logging.info(msg)
    def warning(msg, printLog=True):
        logging.warning(msg)
        if printLog == True:
            print(msg)
    def error(msg: str, printLog=True):
        logging.error(msg)
        if printLog == True:
            print(msg)
    # def critical(msg: str):
    #     logging.critical(msg)
		`@ -0,0 +1,2 @@`
							`git clone https://gitea.iconsz.com/iCON/iCloudEngine.git`
							`pause`