前言
技术栈是Fastapi。
FastAPI 是一个现代、快速(基于 Starlette 和 Pydantic)、易于使用的 Python web 框架,主要用于构建 RESTful API。以下是 FastAPI 的一些优势:
-
性能卓越: FastAPI 基于 Starlette 框架,并使用 Pydantic 进行数据验证,因此具有出色的性能。它通过异步编程利用 Python 3.7+ 中的
async/await
特性,使其能够处理大量并发请求。 -
自动文档生成: FastAPI 自动生成交互式 API 文档(Swagger UI 和 ReDoc),让开发者能够轻松地查看和测试 API 端点,同时提供即时的反馈和文档。
-
强类型注解: FastAPI 使用 Python 的类型提示来定义 API,同时利用 Pydantic 模型进行请求和响应的验证,这提供了强大的静态类型检查和自动文档的支持。
-
自动验证: 使用 Pydantic 模型,FastAPI 自动验证请求的数据,并在数据不符合预期时返回错误。这有助于提高代码的稳健性和可维护性。
-
异步支持: 支持异步处理请求,可以使用异步函数来处理请求,使得 FastAPI 在处理高并发时表现出色。
-
便捷的依赖注入系统: FastAPI 提供了一个灵活的依赖注入系统,让你能够方便地注入和管理依赖项,使代码更加清晰和可测试。
-
WebSocket 支持: FastAPI 提供了对 WebSocket 的原生支持,能够轻松地实现实时通信。
-
易于学习: FastAPI 的语法和设计理念使其易于学习和使用,特别是对于熟悉 Python 的开发者。
安装modelscope
conda create -n modelscope python=3.8
conda activate modelscope
pip install modelscope
激活虚拟环境
conda activate modelscope
server.py代码
import argparseimport uvicorn
from fastapi import FastAPIfrom modelscope.server.api.routers.router import api_router
from modelscope.server.core.event_handlers import (start_app_handler,stop_app_handler)def get_app(args) -> FastAPI:app = FastAPI(title='modelscope_server',version='0.1',debug=True,swagger_ui_parameters={'tryItOutEnabled': True})app.state.args = argsapp.include_router(api_router)app.add_event_handler('startup', start_app_handler(app))app.add_event_handler('shutdown', stop_app_handler(app))return appdef add_server_args(parser):parser.add_argument('--model_id', required=True, type=str, help='The target model id')parser.add_argument('--revision', required=True, type=str, help='Model revision')parser.add_argument('--host', default='0.0.0.0', help='Host to listen')parser.add_argument('--port', type=int, default=8000, help='Server port')parser.add_argument('--debug', default='debug', help='Set debug level.')parser.add_argument('--llm_first',type=bool,default=True,help='Use LLMPipeline first for llm models.')if __name__ == '__main__':parser = argparse.ArgumentParser('modelscope_server')add_server_args(parser)args = parser.parse_args()app = get_app(args)uvicorn.run(app, host=args.host, port=args.port)
任务一:人脸检测
命令行中虚拟环境中运行脚本
python server.py --model_id damo/cv_resnet50_face-detection_retinaface --revision v2.0.2
访问http://127.0.0.1:8000/docs打开文档
- describe方法描述请求参数和输出形式
{"schema": {"task_name": "face-detection","schema": {"input": {"type": "object","properties": {"image": {"type": "string","description": "Base64 encoded image file or url string."}}},"parameters": {},"output": {"type": "object","properties": {"scores": {"type": "array","items": {"type": "number"}},"boxes": {"type": "array","items": {"type": "number"}},"keypoints": {"type": "array","items": {"type": "number"}}}}}},"sample": null
}
-
call方法(是模型推理的入口)
-
两种请求方式(post)
-
curl方式(encode_base64表示图片转换为base64后的形式)
-
-
图片转换base64的链接可以使用在线转https://tool.jisuapi.com/pic2base64.html
curl -X 'POST' \ 'http://127.0.0.1:8000/call' \ -H 'accept: application/json' \ -H 'Content-Type: application/json' \ -d '{ "input":{"image":"encode_base64"}'
-
face-detection_retinaface请求参数体(界面请求)直接使用fastapi界面请求或者使用apifox等
-
{"input":{"image":"encode_base64"}}
请求结果
返回结果解释
{"scores": [0.9998026490211487],"boxes": [[164.9207000732422,82.86209106445312,353.395263671875,340.145263671875]],"keypoints": [[214.5664520263672,188.255859375,303.5237121582031,190.91671752929688,256.9284362792969,242.95065307617188,223.42758178710938,283.54241943359375,287.28448486328125,286.402587890625]]
}
返回图像中人脸的分数,越大表示有人脸的可能性越大,boxes表示人脸的矩形框,左上角x,y坐标和右下角x,y坐标,keypoints返回左眼、右眼、鼻尖、左嘴角、右嘴角的坐标值x,y。
输入图片
根据boxes和keypoints画图
import cv2# 读取图像
image = cv2.imread('0.png')# 定义矩形框的坐标和大小x, y, x1, y1 = 164,82,353,340
w = 353-164
h = 340-82# 画矩形框
cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2)# 显示结果
# cv2.imshow('Rectangle', image)
# cv2.waitKey(0)
# cv2.destroyAllWindows()
cv2.imwrite('0_rectangle.png', image)
import cv2# 读取图像
image = cv2.imread('0.png')radius = 5 # 点的半径
color = (0, 0, 255) # 点的颜色,通常使用BGR格式
thickness = -1 # 为了画一个实心圆,线条宽度设置为-1
keypoints = [214.5664520263672,
188.255859375,
303.5237121582031,
190.91671752929688,
256.9284362792969,
242.95065307617188,
223.42758178710938,
283.54241943359375,
287.28448486328125,
286.402587890625]
print(len(keypoints))
for i in range(0,len(keypoints),2):cv2.circle(image, (int(keypoints[i]),int(keypoints[i+1])), radius, color, thickness)# 显示结果
# cv2.imshow('Point', image)
# cv2.waitKey(0)
# cv2.destroyAllWindows()
cv2.imwrite('0_keypoints.png', image)
需要注意的是不同的任务请求体的内容不一样,需要明确每个任务的请求参数具体有哪些。
任务二:人脸融合
第二种任务,人脸融合,需要重启服务,将model_id和revision替换。
python server.py --model_id damo/cv_unet-image-face-fusion_damo --revision v1.3
此时访问http://127.0.0.1/docs
执行一下describe方法
{"schema": {"task_name": "image-face-fusion","schema": {"input": {"type": "object","properties": {"template": {"type": "string","description": "Base64 encoded image file or url string."},"user": {"type": "string","description": "Base64 encoded image file or url string."}}},"parameters": {"type": "object","properties": {"user": {"type": "object","default": null}}},"output": {"type": "object","properties": {"output_img": {"type": "string","description": "The base64 encoded image."}}}}},"sample": null
}
input有两个参数,第一个是template,表示模版;第二个参数是user,表示用户的图片,最终的目的就是将用户的图片的脸替换到模版上
parameters参数一般使用默认的就行,不填,如果有特殊需求可自行尝试
output会返回一个换好脸图像的base64编码
请求体
{"input": {"template": "base64_template","user":"bas64_user"}
}
template
User
Ourput
参考链接:
https://github.com/modelscope/modelscope/blob/master/modelscope/server/api_server.py