支持GPT-3.5-Turbo, GPT-4o, GPT-4-Turbo
import json
import openai
from pathlib import Path
import os
client = openai.OpenAI(base_url=base_url, api_key=api_key)
file = client.files.create(
file=open("H3.pdf", "rb"),
purpose='assistants'
)
assistant = client.beta.assistants.create(
name="问答生成",
instructions="你是一个问答生成助手,可以帮助用户去生成问答对。",
model="gpt-4-1106-preview",
tools=[{"type":"retrieval"}],
file_ids= [file.id]
)
print(assistant.id)
thread = client.beta.threads.create(
messages=[
{
"role": "user",
"content": """
这个文档可以分为多个部分,分别输出。针对每个部分生成3个问答对,合并后以中文JSON格式输出。
"""
}
]
)
print(thread.id)
run = client.beta.threads.runs.create(
thread_id=thread.id,
assistant_id=assistant.id
)
print(run.id)
import time
def wait_on_run(run, thread):
while run.status == "queued" or run.status == "in_progress":
run = client.beta.threads.runs.retrieve(
thread_id=thread.id,
run_id=run.id,
)
time.sleep(1)
print("等待响应中...")
return run
run = wait_on_run(run, thread)
print(run.id)
messages = client.beta.threads.messages.list(thread_id=thread.id)
messages = json.loads(messages.model_dump_json())
messages['data'][0]['content'][0]['text']['value']
'接下来,根据您的文档,我将对每个部分生成问答对,并以中文JSON格式输出。\n\n### 第一部分(发展历程、主营业务、财务分析、公司治理)\n\n1. 福昕软件成立于哪一年?\n A: 福昕软件成立于2001年。\n\n2. 福昕软件的主营业务是什么?\n A: 福昕软件的主营业务是聚焦PDF相关解决方案。\n\n3. 福昕软件在员工利益方面采取了哪些措施?\n A: 福昕软件制定了长期持股计划以绑定员工利益。【13†source】\n\n### 第二部分(所处行业分析)\n\n1. 福昕软件公司的产品在哪些方面具有竞争力?\n A: 福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。\n\n2. 福昕软件未来的市场发展潜力如何?\n A: 福昕软件公司后续有望抢占更多市场份额。【14†source】\n\n### 第三部分(订阅+渠道双转型)\n\n1. “订阅+渠道”双转型的核心策略是什么?\n A: 福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。\n\n2. 福昕软件订阅模式为客户提供了哪些增值服务?\n A: 福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。【15†source】\n\n### 第四部分(境外收入占比、境内市场拓展)\n\n1. 福昕软件在境内市场拓展方面的策略是什么?\n A: 福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。【16†source】\n\n### 第五部分(AIGC赋能、产品竞争力)\n\n1. 福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?\n A: 福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。【17†source】\n\n2. 接入ChatGPT后的产品变化有哪些?\n A: 接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。\n\n### 第六部分(盈利预测、估值与投资评级)\n\n1. 福昕软件的投资评级如何?\n A: 福昕软件的投资评级为“买入”。【18†source】\n\n2. 根据估值模型,福昕软件的目标市值是多少?\n A: 根据估值模型,福昕软件的目标市值为117.0亿元。\n\n将以上问答对合并并转换为JSON格式如下:\n```json\n[\n {\n "part": "第一部分",\n "qa_pairs": [\n {\n "question": "福昕软件成立于哪一年?",\n "answer": "福昕软件成立于2001年。"\n },\n {\n "question": "福昕软件的主营业务是什么?",\n "answer": "福昕软件的主营业务是聚焦PDF相关解决方案。"\n },\n {\n "question": "福昕软件在员工利益方面采取了哪些措施?",\n "answer": "福昕软件制定了长期持股计划以绑定员工利益。"\n }\n ]\n },\n {\n "part": "第二部分",\n "qa_pairs": [\n {\n "question": "福昕软件公司的产品在哪些方面具有竞争力?",\n "answer": "福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。"\n },\n {\n "question": "福昕软件未来的市场发展潜力如何?",\n "answer": "福昕软件公司后续有望抢占更多市场份额。"\n }\n ]\n },\n {\n "part": "第三部分",\n "qa_pairs": [\n {\n "question": "“订阅+渠道”双转型的核心策略是什么?",\n "answer": "福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。"\n },\n {\n "question": "福昕软件订阅模式为客户提供了哪些增值服务?",\n "answer": "福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。"\n }\n ]\n },\n {\n "part": "第四部分",\n "qa_pairs": [\n {\n "question": "福昕软件在境内市场拓展方面的策略是什么?",\n "answer": "福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。"\n }\n ]\n },\n {\n "part": "第五部分",\n "qa_pairs": [\n {\n "question": "福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?",\n "answer": "福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。"\n },\n {\n "question": "接入ChatGPT后的产品变化有哪些?",\n "answer": "接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。"\n }\n ]\n },\n {\n "part": "第六部分",\n "qa_pairs": [\n {\n "question": "福昕软件的投资评级如何?",\n "answer": "福昕软件的投资评级为“买入”。"\n },\n {\n "question": "根据估值模型,福昕软件的目标市值是多少?",\n "answer": "根据估值模型,福昕软件的目标市值为117.0亿元。"\n }\n ]\n }\n]\n```'
print(messages['data'][0]['content'][0]['text']['value'])
接下来,根据您的文档,我将对每个部分生成问答对,并以中文JSON格式输出。### 第一部分(发展历程、主营业务、财务分析、公司治理)1. 福昕软件成立于哪一年?A: 福昕软件成立于2001年。2. 福昕软件的主营业务是什么?A: 福昕软件的主营业务是聚焦PDF相关解决方案。3. 福昕软件在员工利益方面采取了哪些措施?A: 福昕软件制定了长期持股计划以绑定员工利益。【13†source】### 第二部分(所处行业分析)1. 福昕软件公司的产品在哪些方面具有竞争力?A: 福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。2. 福昕软件未来的市场发展潜力如何?A: 福昕软件公司后续有望抢占更多市场份额。【14†source】### 第三部分(订阅+渠道双转型)
1. “订阅+渠道”双转型的核心策略是什么?A: 福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。2. 福昕软件订阅模式为客户提供了哪些增值服务?A: 福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。【15†source】### 第四部分(境外收入占比、境内市场拓展)1. 福昕软件在境内市场拓展方面的策略是什么?A: 福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。【16†source】### 第五部分(AIGC赋能、产品竞争力)1. 福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?A: 福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。【17†source】2. 接入ChatGPT后的产品变化有哪些?A: 接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。### 第六部分(盈利预测、估值与投资评级)1. 福昕软件的投资评级如何?A: 福昕软件的投资评级为“买入”。【18†source】2. 根据估值模型,福昕软件的目标市值是多少?A: 根据估值模型,福昕软件的目标市值为117.0亿元。
将以上问答对合并并转换为JSON格式如下: ```json [{"part": "第一部分","qa_pairs": [{"question": "福昕软件成立于哪一年?","answer": "福昕软件成立于2001年。"},{"question": "福昕软件的主营业务是什么?","answer": "福昕软件的主营业务是聚焦PDF相关解决方案。"},{"question": "福昕软件在员工利益方面采取了哪些措施?","answer": "福昕软件制定了长期持股计划以绑定员工利益。"}]},{"part": "第二部分","qa_pairs": [{"question": "福昕软件公司的产品在哪些方面具有竞争力?","answer": "福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。"},{"question": "福昕软件未来的市场发展潜力如何?","answer": "福昕软件公司后续有望抢占更多市场份额。"}]}, {"part": "第三部分","qa_pairs": [{"question": "“订阅+渠道”双转型的核心策略是什么?","answer": "福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。"},{"question": "福昕软件订阅模式为客户提供了哪些增值服务?","answer": "福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。"}]},{"part": "第四部分","qa_pairs": [{"question": "福昕软件在境内市场拓展方面的策略是什么?","answer": "福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。"}]},{"part": "第五部分","qa_pairs": [{"question": "福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?","answer": "福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。"},{"question": "接入ChatGPT后的产品变化有哪些?","answer": "接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。"}]}, {"part": "第六部分","qa_pairs": [{"question": "福昕软件的投资评级如何?","answer": "福昕软件的投资评级为“买入”。"},{"question": "根据估值模型,福昕软件的目标市值是多少?","answer": "根据估值模型,福昕软件的目标市值为117.0亿元。"}]} ] ```
res = messages['data'][0]['content'][0]['text']['value']
json_start = res.find("```json\n")
json_end = res.find("```\n")
if json_start>=0:
if json_end > json_start:
res = res[json_start+8:json_end]
elif json_end ==-1:
res = res[json_start+8:len(res)-3]
data = json.loads(res)
data
[{'part': '第一部分','qa_pairs': [{'question': '福昕软件成立于哪一年?', 'answer': '福昕软件成立于2001年。'},{'question': '福昕软件的主营业务是什么?', 'answer': '福昕软件的主营业务是聚焦PDF相关解决方案。'},{'question': '福昕软件在员工利益方面采取了哪些措施?', 'answer': '福昕软件制定了长期持股计划以绑定员工利益。'}]},{'part': '第二部分','qa_pairs': [{'question': '福昕软件公司的产品在哪些方面具有竞争力?','answer': '福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。'},{'question': '福昕软件未来的市场发展潜力如何?', 'answer': '福昕软件公司后续有望抢占更多市场份额。'}]},{'part': '第三部分','qa_pairs': [{'question': '“订阅+渠道”双转型的核心策略是什么?','answer': '福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。'},{'question': '福昕软件订阅模式为客户提供了哪些增值服务?','answer': '福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。'}]},{'part': '第四部分','qa_pairs': [{'question': '福昕软件在境内市场拓展方面的策略是什么?','answer': '福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。'}]},{'part': '第五部分','qa_pairs': [{'question': '福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?','answer': '福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。'},{'question': '接入ChatGPT后的产品变化有哪些?','answer': '接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。'}]},{'part': '第六部分','qa_pairs': [{'question': '福昕软件的投资评级如何?', 'answer': '福昕软件的投资评级为“买入”。'},{'question': '根据估值模型,福昕软件的目标市值是多少?','answer': '根据估值模型,福昕软件的目标市值为117.0亿元。'}]}]
rows = []
for x in data:
for y in x['qa_pairs']:
rows.append(y)
rows
[{'question': '福昕软件成立于哪一年?', 'answer': '福昕软件成立于2001年。'},{'question': '福昕软件的主营业务是什么?', 'answer': '福昕软件的主营业务是聚焦PDF相关解决方案。'},{'question': '福昕软件在员工利益方面采取了哪些措施?', 'answer': '福昕软件制定了长期持股计划以绑定员工利益。'},{'question': '福昕软件公司的产品在哪些方面具有竞争力?','answer': '福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。'},{'question': '福昕软件未来的市场发展潜力如何?', 'answer': '福昕软件公司后续有望抢占更多市场份额。'},{'question': '“订阅+渠道”双转型的核心策略是什么?','answer': '福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。'},{'question': '福昕软件订阅模式为客户提供了哪些增值服务?','answer': '福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。'},{'question': '福昕软件在境内市场拓展方面的策略是什么?','answer': '福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。'},{'question': '福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?','answer': '福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。'},{'question': '接入ChatGPT后的产品变化有哪些?','answer': '接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。'},{'question': '福昕软件的投资评级如何?', 'answer': '福昕软件的投资评级为“买入”。'},{'question': '根据估值模型,福昕软件的目标市值是多少?', 'answer': '根据估值模型,福昕软件的目标市值为117.0亿元。'}]
import pandas as pd
df = pd.DataFrame(rows)
df
thread_message = client.beta.threads.messages.create(
thread_id=thread.id,
role="user",
content="每个部分可以拆分为几个子部分,分别输出。"
)
print(thread_message)
run = client.beta.threads.runs.create(
thread_id=thread.id,
assistant_id=assistant.id,
model = "gpt-3.5-turbo"
)
print(run)
run = wait_on_run(run, thread)
print(run.id)
messages = client.beta.threads.messages.list(thread_id=thread.id)
messages = json.loads(messages.model_dump_json())
print(messages['data'][0]['content'][0]['text']['value'])
根据文档内容,可以将文档分为以下子部分并逐个输出:### 第一部分(发展历程、主营业务、财务分析、公司治理)1.1 发展历程:公司成立时间较早,聚焦海外市场开拓 - 福昕软件成立于2001年。1.2 主营业务:聚焦PDF相关解决方案 - 福昕软件的主营业务是聚焦PDF相关解决方案。1.3 财务分析:依托优秀的成长性和稳固的行业地位,公司长期财务数据表现亮眼 - 公司长期财务数据表现亮眼,依托优秀的成长性和稳固的行业地位。1.4 公司治理:股权清晰且稳定,长期持股计划绑定员工利益 - 公司股权清晰且稳定,采取长期持股计划绑定员工利益。### 第二部分(所处行业分析)2.1 行业空间:无纸化、电子化办公已成趋势,PDF赛道规模剑指千亿 - 行业天花板高,公司竞争力强。2.2 公司竞争力分析:公司产品在功能、价格、用户评价三个维度均有一定竞争力,后续有望抢占更多市场份额 - 公司产品在功能、价格、用户评价三个维度均有一定竞争力。### 第三部分(订阅+渠道双转型)3.1 订阅转型:订阅模式下可为客户提供丰富的增值服务,并提升客户终生价值 - “订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。3.2 渠道转型:核心在于通过渠道触达海量客户资源,进而抢占更多市场份额 - 通过渠道触达海量客户资源,抢占更多市场份额。### 第四部分(境外收入占比、境内市场拓展)4.1 福昕家装解决方案 - 谈及福昕家装解决方案。4.2 福昕船舶图纸管理系统 - 谈及福昕船舶图纸管理系统。4.3 电子签名解决方案 - 谈及电子签名解决方案。### 第五部分(AIGC赋能、产品竞争力)5.1 AIGC赋能正在进行时,产品竞争力日益凸显 - 福昕的产品具备AIGC赋能,竞争力日益突出。### 第六部分(盈利预测、估值与投资评级)6.1 盈利预测及假设 - 公司的盈利预测及假设。6.2 估值与投资评级 - 估值模型与投资评级。这样,每个部分都被细分并输出了各自的子部分内容。