🎯要点
🎯模拟肿瘤细胞增生进化轨迹 | 🎯肿瘤生长的随机空间细胞自动机模型 | 🎯模拟穿刺活检的收集空间局部的肿瘤块,模拟针吸活检采集长而薄的组织样本 | 🎯构建不同参数模拟合成肿瘤测试集 | 🎯算法模型计算先验分布、计算概率分布的瓦瑟斯坦距离和欧氏距离 | 🎯细胞进化系统动力学量化分裂差异模型。
📜病理学用例
📜Python和C++骨髓细胞进化解析数学模型
📜Python成像质谱流式细胞术病理生理学
📜Python流感传播感染康复图模型计算和算法
📜Python脑溶质扩散生理几何模型计算
📜Python流感常微分方程房室数学模型
📜Python药物副作用生物图分析算法和矩阵降维算法
🍪语言内容分比
🍇R瓦瑟斯坦距离
两个概率测度 μ \mu μ 和 ν \nu ν 之间的 p th p^{\text {th }} pth 瓦瑟斯坦距离,在有限 p th p^{\text {th }} pth 矩下,可以定义为
W p ( μ , ν ) p = inf E [ d ( X , Y ) p ] W_p(\mu, \nu)^p=\inf E \left[d(X, Y)^p\right] Wp(μ,ν)p=infE[d(X,Y)p]
其中 d d d 是一个度量, E [ Z ] E [Z] E[Z] 表示随机变量 Z Z Z 的期望值,下确界取随机变量 X X X 和 Y Y Y 的所有联合分布,边际为分别为 μ \mu μ 和 ν \nu ν。对于 p = 1 p=1 p=1,表明, R R R 上的两个累积分布函数 F 1 F_1 F1 和 F 2 F_2 F2 之间的一维(一维)瓦瑟斯坦-1 度量可以写为 L 1 L_1 L1距离:
W 1 ( F 1 , F 2 ) = ∫ R ∣ F 1 ( x ) − F 2 ( x ) ∣ d x W_1\left(F_1, F_2\right)=\int_{ R }\left|F_1(x)-F_2(x)\right| d x W1(F1,F2)=∫R∣F1(x)−F2(x)∣dx
因此,对于具有数值可处理的累积分布函数的分布,瓦瑟斯坦-1 度量可以用数值积分来近似。值得注意的是,该距离在单调变换(例如,在尺度变换下)下不是不变的。
接下来,我们展示分布 F ( ⋅ ; θ ) F(\cdot ; \theta) F(⋅;θ) 和嵌套兴趣分布 F ( ⋅ ; θ 0 ) F\left(\cdot ; \theta_0\right) F(⋅;θ0) 之间瓦瑟斯坦-1 度量的数值计算示例,对于 θ 0 \theta_0 θ0 的某个固定值。我们省略了位置和比例参数,但可以轻松调整 R 代码以包含这些参数。我们还展示了该函数的图:
M ( θ ) = W 1 ( F ( ⋅ ; θ ) , F ( ⋅ ; θ 0 ) ) = ∫ R ∣ F ( x ; θ ) − F ( x ; θ 0 ) ∣ d x M(\theta)=W_1\left(F(\cdot ; \theta), F\left(\cdot ; \theta_0\right)\right)=\int_{ R }\left|F(x ; \theta)-F\left(x ; \theta_0\right)\right| d x M(θ)=W1(F(⋅;θ),F(⋅;θ0))=∫R∣F(x;θ)−F(x;θ0)∣dx
可以解释为测量参数 θ \theta θ 效果的函数。
偏斜正态概率密度函数为:
f ( x ; λ ) = 2 ϕ ( x ) Φ ( λ x ) f(x ; \lambda)=2 \phi(x) \Phi(\lambda x) f(x;λ)=2ϕ(x)Φ(λx)
其中 ϕ \phi ϕ 和 Φ \Phi Φ 分别是标准正态概率密度函数和累积分布函数, λ ∈ R \lambda \in R λ∈R。在这里,我们计算 f ( x ; λ ) f(x ; \lambda) f(x;λ) 和 ϕ ( x ) \phi(x) ϕ(x) 之间的瓦瑟斯坦-1 度量。
library(sn)
library(knitr)
MW1 <- Vectorize(function(par){tempf <- Vectorize(function(x) abs(psn(x, alpha=par) - pnorm(x)) )val <- integrate(tempf,-Inf,Inf)$valuereturn(val)
})lambda <- -5:5
W1 <- MW1(lambda)
print(kable(cbind(lambda,W1),digits=4))
##
##
## lambda W1
## ------- -------
## -5 0.7824
## -4 0.7741
## -3 0.7569
## -2 0.7136
## -1 0.5642
## 0 0.0000
## 1 0.5642
## 2 0.7136
## 3 0.7569
## 4 0.7741
## 5 0.7824
结果绘图
curve(MW1,-10,10, xlab = ~lambda, ylab="M", cex.axis=1.5, cex.lab=1.5, lwd=2, n = 250)
两部分正态概率密度函数定义为:
f ( x ; γ ) = ϕ ( x 1 + γ ) I ( x < 0 ) + ϕ ( x 1 − γ ) I ( x ≥ 0 ) f(x ; \gamma)=\phi\left(\frac{x}{1+\gamma}\right) I(x<0)+\phi\left(\frac{x}{1-\gamma}\right) I(x \geq 0) f(x;γ)=ϕ(1+γx)I(x<0)+ϕ(1−γx)I(x≥0)
其中 ϕ \phi ϕ 是标准正态概率密度函数, γ ∈ ( − 1 , 1 ) \gamma \in(-1,1) γ∈(−1,1)。在这里,我们计算 f ( x ; γ ) f(x ; \gamma) f(x;γ) 和 ϕ ( x ) \phi(x) ϕ(x) 之间的瓦瑟斯坦-1度量。
library(twopiece)
library(knitr)MW1 <- Vectorize(function(par){tempf <- Vectorize(function(x) abs(ptp3(x, 0, 1, par, FUN = pnorm, param = "eps") - pnorm(x)) )val <- integrate(tempf,-Inf,Inf)$valuereturn(val)
})gamma <- seq(-0.9,0.9,by=0.1)
W1 <- MW1(gamma)
print(kable(cbind(gamma,W1),digits=4))
##
##
## gamma W1
## ------ -------
## -0.9 1.4362
## -0.8 1.2766
## -0.7 1.1170
## -0.6 0.9575
## -0.5 0.7979
## -0.4 0.6383
## -0.3 0.4787
## -0.2 0.3192
## -0.1 0.1596
## 0.0 0.0000
## 0.1 0.1596
## 0.2 0.3192
## 0.3 0.4787
## 0.4 0.6383
## 0.5 0.7979
## 0.6 0.9575
## 0.7 1.1170
## 0.8 1.2766
## 0.9 1.4362
结果绘图
curve(MW1,-0.99,0.99, xlab = ~gamma, ylab="M", cex.axis=1.5, cex.lab=1.5, lwd=2, n = 250)
指数威布尔分布是一种三参数分布。它包含一个尺度参数、一个形状参数和一个幂(形状)参数 α \alpha α。 指数威布尔分布包含作为特殊情况 ( α = 1 ) (\alpha=1) (α=1) 的威布尔分布。 指数威布尔分布已用于对生存时间进行建模,因为它的风险函数可以捕获基本形状:常数、递增、递减、浴盆和单峰。
如果我们有兴趣比较两条生存曲线 S 1 S_1 S1 和 S 2 S_2 S2,一种可能的方法是计算生存曲线之间的面积,即它们之间的 L 1 L_1 L1 距离。此外,由于 S i ( ⋅ ) = 1 − F i ( ⋅ ) , i = 1 , 2 S_i(\cdot)=1-F_i(\cdot), i=1,2 Si(⋅)=1−Fi(⋅),i=1,2,因此
∫ R + ∣ S 1 ( x ) − S 2 ( x ) ∣ d x = ∫ R + ∣ F 1 ( x ) − F 2 ( x ) ∣ d x = W 1 ( F 1 , F 2 ) \int_{ R _{+}}\left|S_1(x)-S_2(x)\right| d x=\int_{ R _{+}}\left|F_1(x)-F_2(x)\right| d x=W_1\left(F_1, F_2\right) ∫R+∣S1(x)−S2(x)∣dx=∫R+∣F1(x)−F2(x)∣dx=W1(F1,F2)
在这里,我们将测量在尺度和形状参数为 1 的情况下功率参数 α \alpha α 的影响,与具有单位尺度和形状参数的威布尔分布相比。
library(knitr)pexpweibull<- function(t,lambda,kappa,alpha,log.p=FALSE){log.cdf <- alpha*pweibull(t,scale=lambda,shape=kappa,log.p=TRUE)ifelse(log.p, return(log.cdf), return(exp(log.cdf)))
} MW1 <- Vectorize(function(par){tempf <- Vectorize(function(x) abs(pexpweibull(x, 1, 1, par) - pweibull(x,1,1)) )val <- integrate(tempf,0,Inf)$valuereturn(val)
})alpha <- seq( 0.1,5,by=0.1)
W1 <- MW1(alpha)
print(kable(cbind(alpha,W1),digits=4))
##
##
## alpha W1
## ------ -------
## 0.1 0.8465
## 0.2 0.7118
## 0.3 0.5920
## 0.4 0.4842
## 0.5 0.3863
## 0.6 0.2967
## 0.7 0.2142
## 0.8 0.1378
## 0.9 0.0666
## 1.0 0.0000
## 1.1 0.0626
## 1.2 0.1215
## 1.3 0.1773
## 1.4 0.2301
## 1.5 0.2804
## 1.6 0.3283
## 1.7 0.3740
## 1.8 0.4178
## 1.9 0.4597
## 2.0 0.5000
## 2.1 0.5387
## 2.2 0.5761
## 2.3 0.6120
## 2.4 0.6468
## 2.5 0.6804
## 2.6 0.7129
## 2.7 0.7444
## 2.8 0.7749
## 2.9 0.8045
## 3.0 0.8333
## 3.1 0.8613
## 3.2 0.8886
## 3.3 0.9151
## 3.4 0.9409
## 3.5 0.9661
## 3.6 0.9907
## 3.7 1.0146
## 3.8 1.0381
## 3.9 1.0610
## 4.0 1.0833
## 4.1 1.1052
## 4.2 1.1266
## 4.3 1.1476
## 4.4 1.1682
## 4.5 1.1883
## 4.6 1.2080
## 4.7 1.2274
## 4.8 1.2464
## 4.9 1.2650
## 5.0 1.2833
结果绘图
curve(MW1,0.001,5, xlab = ~alpha, ylab="M", cex.axis=1.5, cex.lab=1.5, lwd=2, n = 1000)