股票日数据使用_未复权日数据生成前复权日周月季年数据

目录

前置:

准备

代码:数据库交互部分

代码:生成前复权 日、周、月、季、年数据


前置:

1 未复权日数据获取,请查看 https://blog.csdn.net/m0_37967652/article/details/146435589  数据库使用PostgreSQL。更新日数据可以查看 https://blog.csdn.net/m0_37967652/article/details/146988667 将日数据更新到最新 

2 权息数据,下载 t_exdividend.sql 文件

通过网盘分享的文件:t_exdividend.sql
链接: https://pan.baidu.com/s/17B1EiHcEYByfWSICqX1KNQ?pwd=4abg 提取码: 4abg

在命令行 postgresql安装目录的bin目录下执行

psql -U postgres -h 127.0.0.1 -p 5432 -d db_stock -f E:/temp005/t_exdividend.sql 

E:/temp005/t_exdividend.sql  改成自己的文件目录

准备

1 从通达信中获取当前A股股票代码,存储到txt文件,一行一个股票代码

2 准备一个空目录,创建 day  month  quarter  week  year 目录

3 安装包

pip install pandas

pip install psycopg2 

代码:数据库交互部分

这部分代码存储到 utils包目录下的 postgresql_utils01.py文件中

import psycopg2
import pandas as pddef connect_db():try:conn = psycopg2.connect(database='db_stock',user='postgres',password='',host='127.0.0.1',port=5432)except Exception as e:print(f'connection failed。{e}')else:return connpassdef query_multi_stock_daily(ticker_list:list)->list:ticker_list_str = '\',\''.join(ticker_list)ticker_list_str = '\''+ticker_list_str+'\''sql_str = f"select ticker,tradeDate,openPrice,highestPrice,lowestPrice,closePrice,turnoverVol,turnoverValue,dealAmount,turnoverRate,negMarketValue,marketValue,chgPct,PE,PE1,PB,isOpen,vwap from t_stock_daily where ticker in ({ticker_list_str});"conn = connect_db()cur = conn.cursor()cur.execute(sql_str)res = cur.fetchall()cur.close()conn.close()return resdef query_multi_exdiv(ticker_list:list)->list:ticker_list_str = '\',\''.join(ticker_list)ticker_list_str = '\'' + ticker_list_str + '\''sql_str = f"select ticker,exDate,perShareTransRadio,perCashDiv,allotmentRatio,allotmentPrice from t_exdividend where ticker in ({ticker_list_str});"conn = connect_db()cur = conn.cursor()cur.execute(sql_str)res = cur.fetchall()cur.close()conn.close()return res

代码:生成前复权 日、周、月、季、年数据

from concurrent.futures import ThreadPoolExecutor
import os
import pandas as pd
from utils import postgresql_utils01
'''
股票日数据使用
'''
def output_daiy_caculate(thread_num:int,stock_ticker_list:list):pre_dir =r'E:/temp006/'# 每10个处理下print(f'thread {thread_num}, {len(stock_ticker_list)}')try:interval = len(stock_ticker_list) // 10for i in range(0, interval + 1):if (i + 1) * 10 >= len(stock_ticker_list):node_ticker_list = stock_ticker_list[i * 10:]else:node_ticker_list = stock_ticker_list[i * 10:(i + 1) * 10]daily_res = postgresql_utils01.query_multi_stock_daily(node_ticker_list)exdiv_res = postgresql_utils01.query_multi_exdiv(node_ticker_list)df_d_dict = {}df_ex_dict = {}for one in daily_res:ticker = one[0]df = pd.DataFrame(data={'tradeDate': one[1],'openPrice': one[2],'highestPrice': one[3],'lowestPrice': one[4],'closePrice': one[5],'turnoverVol': one[6],'turnoverValue': one[7],'dealAmount': one[8],'turnoverRate': one[9],'negMarketValue': one[10],'marketValue': one[11],'chgPct': one[12],'PE': one[13],'PE1': one[14],'PB': one[15],'isOpen': one[16],'vwap': one[17]})df_d_dict[ticker] = dfpassfor one in exdiv_res:ticker = one[0]df = pd.DataFrame(data={'exDate': one[1],'perShareTransRadio': one[2],'perCashDiv': one[3],'allotmentRatio': one[4],'allotmentPrice': one[5]})df_ex_dict[ticker] = dfpassfin_df_dict = {}for ticker, daily in df_d_dict.items():daily = daily.loc[daily['isOpen'] == 1].copy()daily['o_date'] = pd.to_datetime(daily['tradeDate'])daily.sort_values(by='o_date', ascending=True, inplace=True)if ticker not in df_ex_dict:fin_df_dict[ticker] = dailycontinueex = df_ex_dict[ticker]ex['a'] = 1 / (1 + ex['perShareTransRadio'] + ex['allotmentRatio'])ex['b'] = (ex['allotmentRatio'] * ex['allotmentPrice'] - ex['perCashDiv']) / (1 + ex['perShareTransRadio'] + ex['allotmentRatio'])ex['o_date'] = pd.to_datetime(ex['exDate'])ex.sort_values(by='o_date', ascending=True, inplace=True)for i, row in ex.iterrows():exDate = row['exDate']daily.loc[daily['o_date'] < exDate, 'closePrice'] = daily['closePrice'] * row['a'] + row['b']daily.loc[daily['o_date'] < exDate, 'openPrice'] = daily['openPrice'] * row['a'] + row['b']daily.loc[daily['o_date'] < exDate, 'highestPrice'] = daily['highestPrice'] * row['a'] + row['b']daily.loc[daily['o_date'] < exDate, 'lowestPrice'] = daily['lowestPrice'] * row['a'] + row['b']fin_df_dict[ticker] = dailypassother_cols = ['tradeDate', 'openPrice', 'highestPrice', 'lowestPrice', 'closePrice', 'turnoverVol','turnoverValue', 'dealAmount', 'turnoverRate', 'negMarketValue', 'marketValue']for ticker, df in fin_df_dict.items():d_path = pre_dir + 'day' + os.path.sep + ticker + '.csv'df.to_csv(d_path, encoding='utf-8', index=False)# 开始计算并导出week month quarter year 数据week_group = df.resample('W-FRI', on='o_date')month_group = df.resample('ME', on='o_date')quarter_group = df.resample('QE', on='o_date')year_group = df.resample('YE', on='o_date')w_df = week_group.last()w_df['openPrice'] = week_group.first()['openPrice']w_df['lowestPrice'] = week_group.min()['lowestPrice']w_df['highestPrice'] = week_group.max()['highestPrice']w_df['turnoverVol'] = week_group.sum()['turnoverVol']w_df['turnoverValue'] = week_group.sum()['turnoverValue']w_df['dealAmount'] = week_group.sum()['dealAmount']w_df['turnoverRate'] = week_group.sum()['turnoverRate']m_df = month_group.last()m_df['openPrice'] = month_group.first()['openPrice']m_df['lowestPrice'] = month_group.min()['lowestPrice']m_df['highestPrice'] = month_group.max()['highestPrice']m_df['turnoverVol'] = month_group.sum()['turnoverVol']m_df['turnoverValue'] = month_group.sum()['turnoverValue']m_df['dealAmount'] = month_group.sum()['dealAmount']m_df['turnoverRate'] = month_group.sum()['turnoverRate']q_df = quarter_group.last()q_df['openPrice'] = quarter_group.first()['openPrice']q_df['lowestPrice'] = quarter_group.min()['lowestPrice']q_df['highestPrice'] = quarter_group.max()['highestPrice']q_df['turnoverVol'] = quarter_group.sum()['turnoverVol']q_df['turnoverValue'] = quarter_group.sum()['turnoverValue']q_df['dealAmount'] = quarter_group.sum()['dealAmount']q_df['turnoverRate'] = quarter_group.sum()['turnoverRate']y_df = year_group.last()y_df['openPrice'] = year_group.first()['openPrice']y_df['lowestPrice'] = year_group.min()['lowestPrice']y_df['highestPrice'] = year_group.max()['highestPrice']y_df['turnoverVol'] = year_group.sum()['turnoverVol']y_df['turnoverValue'] = year_group.sum()['turnoverValue']y_df['dealAmount'] = year_group.sum()['dealAmount']y_df['turnoverRate'] = year_group.sum()['turnoverRate']w_df = w_df.loc[:, other_cols].copy()m_df = m_df.loc[:, other_cols].copy()q_df = q_df.loc[:, other_cols].copy()y_df = y_df.loc[:, other_cols].copy()w_df.to_csv(pre_dir + 'week' + os.path.sep + ticker + '.csv', encoding='utf-8')m_df.to_csv(pre_dir + 'month' + os.path.sep + ticker + '.csv', encoding='utf-8')q_df.to_csv(pre_dir + 'quarter' + os.path.sep + ticker + '.csv', encoding='utf-8')y_df.to_csv(pre_dir + 'year' + os.path.sep + ticker + '.csv', encoding='utf-8')passpassexcept Exception as e:print(f"{thread_num}  error {e}")finally:print(f"{thread_num} finished")print(f'{thread_num} ending...')passdef start_execute():with open('./stock_ticker.txt',mode='r',encoding='utf-8') as fr:contents = fr.read()stock_ticker_list = contents.split('\n')print(len(stock_ticker_list))thread_count = 5interval = len(stock_ticker_list)//thread_countif interval == 0:thread_count = 1params_list = []thread_num_list = []for i in range(0,thread_count):if i == thread_count-1:pre_list = stock_ticker_list[i*interval:]else:pre_list = stock_ticker_list[i*interval:i*interval+interval]thread_num_list.append(i)params_list.append(pre_list)with ThreadPoolExecutor() as executor:executor.map(output_daiy_caculate, thread_num_list,params_list)print('线程池任务分配完毕')passif __name__ == '__main__':start_execute()pass

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/76777.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

系统与网络安全------Windows系统安全(6)

资料整理于网络资料、书本资料、AI&#xff0c;仅供个人学习参考。 共享文件夹 发布共享文件夹 Windows共享概述 微软公司推出的网络文件/打印机服务系统 可以将一台主机的资源发布给其他主机共有 共享访问的优点 方便、快捷相比光盘 U盘不易受文件大小限制 可以实现访问…

BN 层的作用, 为什么有这个作用?

BN 层&#xff08;Batch Normalization&#xff09;——这是深度神经网络中非常重要的一环&#xff0c;它大大改善了网络的训练速度、稳定性和收敛效果。 &#x1f9e0; 一句话理解 BN 层的作用&#xff1a; Batch Normalization&#xff08;批归一化&#xff09;通过标准化每一…

判断HiveQL语句为ALTER TABLE语句的识别函数

写一个C#字符串解析程序代码&#xff0c;逻辑是从前到后一个一个读取字符&#xff0c;遇到匹配空格、Tab和换行符就继续读取下一个字符&#xff0c;遇到大写或小写的字符a&#xff0c;就读取后一个字符并匹配是否为大写或小写的字符l&#xff0c;以此类推&#xff0c;匹配任意字…

基于编程的运输设备管理系统设计(vue+springboot+ssm+mysql8.x)

基于编程的运输设备管理系统设计&#xff08;vuespringbootssmmysql8.x&#xff09; 运输设备信息管理系统是一个全面的设备管理平台&#xff0c;旨在优化设备管理流程&#xff0c;提高运输效率。系统提供登录入口&#xff0c;确保只有授权用户可以访问。个人中心让用户可以查…

6.1 python加载win32或者C#的dll的方法

python很方便的可以加载win32的方法以及C#编写的dll中的方法或者变量&#xff0c;大致过程如下。 一.python加载win32的方法&#xff0c;使用win32api 1.安装库win32api pip install win32api 2.加载所需的win32函数并且调用 import win32api win32api.MessageBox(0,"…

前端精度计算:Decimal.js 基本用法与详解

一、Decimal.js 简介 decimal.js 是一个用于任意精度算术运算的 JavaScript 库&#xff0c;它可以完美解决浮点数计算中的精度丢失问题。 官方API文档&#xff1a;Decimal.js 特性&#xff1a; 任意精度计算&#xff1a;支持大数、小数的高精度运算。 链式调用&#xff1a;…

SQL Server 数据库实验报告

​​​​​​​ 1.1 实验题目&#xff1a;索引和数据完整性的使用 1.2 实验目的&#xff1a; &#xff08;1&#xff09;掌握SQL Server的资源管理器界面应用&#xff1b; &#xff08;2&#xff09;掌握索引的使用&#xff1b; &#xff08;3&#xff09;掌握数据完整性的…

AI绘画中的LoRa是什么?

Lora是一个多义词&#xff0c;根据不同的上下文可以指代多种事物。以下将详细介绍几种主要的含义&#xff1a; LoRa技术 LoRa&#xff08;Long Range Radio&#xff09;是一种低功耗广域网&#xff08;LPWAN&#xff09;无线通信技术&#xff0c;以其远距离、低功耗和低成本的特…

哈希表(Hashtable)核心知识点详解

1. 基本概念 定义&#xff1a;通过键&#xff08;Key&#xff09;直接访问值&#xff08;Value&#xff09;的数据结构&#xff0c;基于哈希函数将键映射到存储位置。 核心操作&#xff1a; put(key, value)&#xff1a;插入键值对 get(key)&#xff1a;获取键对应的值 remo…

数据流和重定向

1、数据流 不管正确或错误的数据都是默认输出到屏幕上&#xff0c;所以屏幕是混乱的。所以就需要用数据流重定向将这两 条数据分开。数据流重定向可以将标准输出和标准错误输出分别传送到其他的文件或设备去 标准输入&#xff08;standard input&#xff0c;简称stdin&#xff…

详解 MySQL 索引的最左前缀匹配原则

MySQL 的最左前缀匹配原则主要是针对复合索引&#xff08;也称为联合索引&#xff09;而言的。其核心思想是&#xff1a;只有查询条件中包含索引最左侧&#xff08;第一列&#xff09;开始的连续一段列&#xff0c;才能让 MySQL 有效地利用该索引。 一、 复合索引的结构 复合…

MyBatis注解开发增删改查基础篇

本文是MyBatis注解开发的基础篇&#xff0c;将通过实际场景&#xff0c;详细介绍MyBatis注解式开发的使用&#xff0c;这是MyBatis很强大的一个特性&#xff0c;可以直接在接口方法上定义 SQL 语句&#xff0c;从而实现数据库的增删改查操作。 本文目录 一、环境依赖二、创建对…

周末总结(2024/04/05)

工作 人际关系核心实践&#xff1a; 要学会随时回应别人的善意&#xff0c;执行时间控制在5分钟以内 坚持每天早会打招呼 遇到接不住的话题时拉低自己&#xff0c;抬高别人(无阴阳气息) 朋友圈点赞控制在5min以内&#xff0c;职场社交不要放在5min以外 职场的人际关系在面对利…

【HTML】纯前端网页小游戏-戳破彩泡

分享一个简单有趣的网页小游戏 - 彩色泡泡爆破。玩家需要点击屏幕上随机出现的彩色泡泡来得分。 <!DOCTYPE html> <html lang"zh"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-wi…

如何实现单例模式?

一、模式定义与核心价值 单例模式&#xff08;Singleton Pattern&#xff09;是一种创建型设计模式&#xff0c;保证一个类仅有一个实例&#xff0c;并提供全局访问点。其核心价值在于&#xff1a; ​​资源控制​​&#xff1a;避免重复创建消耗性资源&#xff08;如数据库连…

Three.js 系列专题 1:入门与基础

什么是 Three.js? Three.js 是一个基于 WebGL 的 JavaScript 库,它简化了 3D 图形编程,让开发者无需深入了解底层 WebGL API 就能创建复杂的 3D 场景。它广泛应用于网页游戏、可视化、虚拟现实等领域。 学习目标 理解 Three.js 的核心组件:场景(Scene)、相机(Camera)…

蓝桥云客---蓝桥速算

3.蓝桥速算【算法赛】 - 蓝桥云课 问题描述 蓝桥杯大赛最近新增了一项娱乐比赛——口算大赛&#xff0c;目的是测试选手的口算能力。 比赛规则如下&#xff1a; 初始给定一个长度为 N 的数组 A&#xff0c;其中第 i 个数字为 Ai​。随后数组会被隐藏&#xff0c;并进行 Q 次…

Oracle迁移达梦遇中断?试试SQLark的断点续迁功能!

在企业级数据迁移项目中&#xff0c;如果迁移单表数据量超过亿行、占用空间超过100GB时&#xff0c;一旦遇到网络中断或迁移报错&#xff0c;往往需要整表重新迁移&#xff0c;导致效率低下&#xff0c;严重影响项目进度。针对这一痛点&#xff0c;SQLark 支持对 Oracle→DM 的…

【C/C++算法】蓝桥杯之递归算法(如何编写想出递归写法)

绪论&#xff1a;冲击蓝桥杯一起加油&#xff01;&#xff01; 每日激励&#xff1a;“不设限和自我肯定的心态&#xff1a;I can do all things。 — Stephen Curry” 绪论​&#xff1a; ———————— 早关注不迷路&#xff0c;话不多说安全带系好&#xff0c;发车啦&am…

[ctfshow web入门] web5

前置知识 引用博客&#xff1a;phps的利用 当服务器配置了 .phps 文件类型时&#xff0c;访问 .phps 文件会以语法高亮的形式直接显示 PHP 源代码&#xff0c;而不是执行它。.phps被作为辅助开发者的一种功能&#xff0c;开发者可以通过网站上访问xxx.phps直接获取高亮源代码 …