2023年华数杯全国大学生数学建模
C题 母亲身心健康对婴儿成长的影响
原题再现:
母亲是婴儿生命中最重要的人之一,她不仅为婴儿提供营养物质和身体保护,还为婴儿提供情感支持和安全感。母亲心理健康状态的不良状况,如抑郁、焦虑、压力等,可能会对婴儿的认知、情感、社会行为等方面产生负面影响。压力过大的母亲可能会对婴儿的生理和心理发展产生负面影响,例如影响其睡眠等方面。
附件给出了包括 390名 3 至 12 个月婴儿以及其母亲的相关数据。这些数据涵盖各种主题,母亲的身体指标包括年龄、婚姻状况、教育程度、妊娠时间、分娩方式,以及产妇心理指标CBTS(分娩相关创伤后应激障碍问卷)、EPDS(爱丁堡产后抑郁量表)、HADS(医院焦虑抑郁量表)和婴儿睡眠质量指标包括整晚睡眠时间、睡醒次数和入睡方式。
请查阅相关文献,了解专业背景,根据题目数据建立数学模型,回答下列问题。
1. 许多研究表明,母亲的身体指标和心理指标对婴儿的行为特征和睡眠质量有影响,请问是否存在这样的规律,根据附件中的数据对此进行研究。
2. 婴儿行为问卷是一个用于评估婴儿行为特征的量表,其中包含了一些关于婴儿情绪和反应的问题。我们将婴儿的行为特征分为三种类型:安静型、中等型、矛盾型。请你建立婴儿的行为特征与母亲的身体指标与心理指标的关系模型。数据表中最后有20组(编号391-410号)婴儿的行为特征信息被删除,请你判断他们是属于什么类型。
3. 对母亲焦虑的干预有助于提高母亲的心理健康水平,还可以改善母婴交互质量,促进婴儿的认知、情感和社交发展。CBTS、EPDS、HADS的治疗费用相对于患病程度的变化率均与治疗费用呈正比,经调研,给出了两个分数对应的治疗费用,详见表1。现有一个行为特征为矛盾型的婴儿,编号为238。请你建立模型,分析最少需要花费多少治疗费用,能够使婴儿的行为特征从矛盾型变为中等型?若要使其行为特征变为安静型,治疗方案需要如何调整?
4. 婴儿的睡眠质量指标包含整晚睡眠时间、睡醒次数、入睡方式。请你对婴儿的睡眠质量进行优、良、中、差四分类综合评判,并建立婴儿综合睡眠质量与母亲的身体指标、心理指标的关联模型,预测最后20组(编号391-410号)婴儿的综合睡眠质量。
5. 在问题三的基础上,若需要让238号婴儿的睡眠质量评级为优,请问问题三的治疗策略是否需要调整?如何调整?
整体求解过程概述(摘要)
母亲的身体与心理健唐与新生婴儿的睡眠和行为模式有着深刻的联系。本文主要针对这一主题,对母亲的身体和心理指标与婴儿的行为特征及睡眠质量之间的关系进行了深入的研究和探讨。并对婴儿的行为及综合睡眠质量做出模型并预测,对婴儿要达到对应行为及睡眠质量时母亲所需治疗方案进行了预测。
在问题一中,先分别对母亲的身体心指标以及婴儿的行为特征和睡眠质量做多元线性回归模型,得到母亲不同身心指标对婴儿行为特征和睡眠质量的具体影响关系与规律。随后绘制基于母亲身心指标以及婴儿行为特征与睡眠质量的拟合曲线图,直观反映母亲身心指标对于婴儿行为特征和睡眠质量的影响关系大小并展现出影响关系,基于结果绘制斯皮尔曼相关系数热力分布图。
在问题二中,发现附件数据中存在有部分婴儿的行为特征信息被删除,需进行预测被删除的 20 组婴儿行为特征。进行分析研究婴儿的三种行为特征(安静型、中等型、矛盾型)与母亲的身体和心理指标之间的复杂联系。本文采用一种高斯朴素贝叶斯分类器,结合了先验知识与概率统计来构建模型。通过应用高斯朴素贝叶斯机器学习算法,提炼出母亲身体和心理指标与婴儿行为特征间的影响关系,并成功预测未知的婴儿行为类型。
问题三中,关注如何通过干预母亲的焦虑来改善特定婴儿(编号 238)的矛盾型行为特征,并使之变为中等型。首先,运用 LiahtGBM 分类算法训练模型,通过分析母亲心理指标等指标与治疗费用的关系,成功筛选能准确预测治疗费用的核心特征并建立基于改进谱聚类的亚类划分模型。先采用了熵权法对指标进行初步筛选,并利用卡方距离对其进行改进,从而达到各类型的亚类划分。在这个过程中允许精确地定位治疗策略,达到最小化费用。再探究婴儿行为特征的主要影响因素及降低治疗成本方面之后,先通过绘制不同性别和年龄的婴儿行为特征频次分布统计图,结合问题一得出的母亲身心指标对于婴儿行为特征和睡眠质量影响系数。对特定婴儿的分析,使用熵权法和聚类分析对影响因素进行亚类划分,来进行计算降为安静型时的三个指标。最后,利用线性插值预测出所需的治疗费用 53238 元。
在问题四的探讨中,本文建立一个综合的婴儿睡眠质量评价指标,并进一步探讨其与母亲的身体和心理指标之间的复杂关联。通过数据挖掘和关联分析,对婴儿睡眠时间,睡醒次数,入睡方式进行向量化处理,揭示这些因素之间的深层联系,为提高婴儿的睡眠质量提供了科学依据。
在问题五中,我们特别强调了母亲的心理状态与婴儿的睡眠质量之间的关系。通过关联分析模型和线性费用模型,揭示了这两者之间的紧密联系,还为实现母亲的理想心理状态所需的费用进行了评估。
模型假设:
1. 假设在考察期间,所有参与的母亲的身体指标和心理指标保持稳定,且这些条件对婴儿的行为特征产生一致的影响;
2. 假设所有参与的婴儿都符合同一年龄段相似,且无重大健康问题影响其正常的生理和行为发展;
3. 假设所有参与的婴儿在睡眠状况调查期间的环境因素(如:温度、湿度、噪音等)基本一致,且这些环境因素对婴儿的睡眠质量没有显著影响;
4. 假设母亲的身体指标和心理指标在一定程度上影响婴儿的睡眠质量,但是不考虑其他可能的影响因素,例如家庭环境、父亲的身体和心理状态等。
5. 母亲的身体指标和心理指标与婴儿的行为特征和睡眠质量之间可能存在双向关系,即婴儿的特征和质量也可能反过来影响母亲的状态。
6. 假设婴儿的行为特征和睡眠质量可能随着时间的推移而变化,可能会受到婴儿成长阶段的影响。
问题分析:
问题 1 分析:
为深入探究母亲的身体指标和心理指标对婴儿的行为特征和睡眠质量的影响关系,首先分别对母亲的身体指标和心理指标以及婴儿的行为特征和睡眠质量做多元线性回归模型,得到不同身体指标和心理指标的母亲对婴儿行为特征和睡眠质量的具体影响关系与规律。为更加直观的反映出母亲身体指标和心理指标对于婴儿行为特征和睡眠质量的影响关系大小并清晰展现出影响关系图,绘制基于母亲身体指标和心理指标以及婴儿行为特征与睡眠质量的拟合曲线图。为进一步说明多元线性回归的结果是否正确,以及两者影响关系量化结果展现,也分别以母亲的身体指标与婴儿的行为特征,母亲的心理指标与婴儿的行为特征,母亲的身体指标与婴儿的睡眠质量,母亲的心理指标与婴儿的睡眠质量做皮尔逊相关系数热力分布图。
问题 2 分析:
第二个问题专注于探寻婴儿的三种行为特征(安静型、中等型、矛盾型)与母亲的身体和心理指标之间的复杂联系。这一分析过程涉及数据的预处理、模型的构建与验证为了精准捕捉这些关系,并预测被删除的 20 组婴儿行为特征,我们采用一种高斯朴素贝叶斯分类器,结合了先验知识与概率统计来构建模型。这个过程还涵盖了数据的细致预处理、特征工程、以及模型的选择与验证。通过应用高斯朴素贝叶斯这一出色的机器学习算法,提炼出母亲身体和心理指标与婴儿行为特征间的影响关系,并成功预测未知的婴儿行为类型。
问题三分析:
在第三个问题的分析中,我们关注如何通过干预母亲的焦虑来改善特定婴儿(编号 238)的矛盾型行为特征,并使之变为中等型。首先,运用 LightGBM 分类算法训练模型,通过分析 CBTS、EPDS、HADS 等指标与治疗费用的关系,我们成功地筛选了能够准确预测治疗费用的核心特征。之后,我们建立一种基于改进谱聚类的亚类划分模型。这个阶段采用了熵权法对指标进行初步筛选,并利用卡方距离对其进行进一步改进,以获取各类型的亚类划分。这个复杂的过程允许我们精确地定位治疗策略,从而最小化费用。在探究婴儿行为特征的主要影响因素及降低治疗成本方面,本研究首先通过绘制不同性别和年龄的婴儿行为特征频次分布统计图,并采用肯德尔相关系数来量化影响程度。接着,通过对特定婴儿的分析,使用熵权法和聚类分析对影响因素进行亚类划分,进一步计算了降为安静型时的三个指标。最后,利用线性插值预测了所需的治疗费用。整体而言,本研究结合了统计分析、聚类分析和线性插值等多种方法,为理解婴儿行为特征提供了全面的分析框架。
问题四分析:
首先,对于婴儿睡眠质量的评价,我们需要建立一个综合指标,包括整晚睡眠时间、睡醒次数和入睡方式。这个综合指标必须能准确地反映婴儿的睡眠质量。要进行这样的评判,我们需要首先了解这些指标与睡眠质量之间的关系,之后根据各指标的重要程度来赋予权重,并将它们整合在一起得到婴儿的睡眠质量评价。其次,建立婴儿的综合睡眠质量与母亲的身体和心理指标的关联模型是一个多因素与多变量的复杂问题。我们需要理解这些因素与婴儿的睡眠质量之间的关系,包括母亲的身体状况、心理状况以及它们对婴儿睡眠质量的影响。这也需要我们使用合适的方法和工具进行数据挖掘和关联分析。
问题五分析:
针对母亲的心理指标与婴儿的睡眠质量的紧密联系进行了深入探讨。观察到当婴儿的睡眠质量评为“优”时,其母亲的心理指标往往呈现为安静型,这使我们认识到通过微调母亲的心理状态可以积极地影响婴儿的睡眠质量。为了精确地揭示这一关联性,我们采用了关联分析模型,并通过数值逼近法为母亲的心理状态找到了一个接近最佳的解决方案。最后,通过线性费用模型,我们评估了为达到理想心理状态所需的治疗费用。
模型的建立与求解整体论文缩略图
全部论文请见下方“ 只会建模 QQ名片” 点击QQ名片即可
部分程序代码:(代码和文档not free)
import pandas as pd
df = pd.read_excel("附件.xlsx",sheet_name='Sheet2')
dfcenter=df-df.mean()
dfnorm=(df-df.mean())/df.std()
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import r2_score
from sklearn import metrics
#a=np.loadtxt("Pdata12_1.txt") #加载表中x1,x2,y
x = dfnorm.iloc[:,1:9]
y = dfnorm.iloc[:,9]
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.75,random_state=4)
md=LinearRegression()
md.fit(x_train,y_train) #构建并拟合模型
y_predict=md.predict(x_test) #求预测值
b0=md.intercept_; b12=md.coef_ #输出回归系数
#R2=md.score(x_test,y_predict) #计算R^2
score1=r2_score(y_test,y_predict)
#rmse = np.sqrt(metrics.mean_squared_error(y_test,y_predict))
print(b0)
print(b12)
print(score1)
print(rmse)
df1 = pd.concat([dfnorm.iloc[:,1:6],dfnorm.iloc[:,9]], axis=1)
#df.iloc[:,1:10]
corr = df1.corr(method='spearman')
import seaborn as sns
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']
sns.heatmap(corr, annot = True, linewidths=.5, cmap="YlGnBu",xticklabels=corr.columns.values,yticklabels=corr.columns.values)import pandas as pd
df = pd.read_excel("附件.xlsx",sheet_name='Sheet2')
df[['婴儿身体行为','婴儿行为特征']].groupby('婴儿身体行为').count()
df1 = df[['婴儿身体行为','婴儿行为特征']].groupby('婴儿身体行为').count()
df1.to_excel("婴儿身体行为特征变量统计表.xlsx")
from pyecharts import Bar
# 数据
df1 = pd.read_excel("婴儿身体行为特征变量统计表.xlsx")
goods =df1['婴儿身体行为']
sales1 =df1['婴儿行为特征']# 商家A各个产品对应的销售量bar = Bar('柱形图-婴儿身体行为', '婴儿身体行为统计')
bar.add('统计数count', goods, sales1, is_label_show=True,is_random=True) # is_label_show在柱形图上方显示销售量
bar.render(path='柱形1.html')