本次讨论主要是对方向的修正,以及一些科研素养的补足
一、关于方向
方案
- 波分离开了,可以分别喂给不同的网络,最后将不同的结果融合。
- 观察结果,获得直观的估计,猜测可能的优化方案。
对于第二点的解释,在于先要单独喂出横波和纵波的数据,看看这两者分别在哪些方面处理的比较好,再考虑后续的融合问题。
接下来的工作
- 需要提高数据量
- 数据集优先考虑 Cruve,Flat 数据集参考性较低(太简单了),Flaut 太复杂了
- 优化 separation.py 中对纵波和横波的区分方案
关于效果评价,目前的方式采取如下:
内部比较
- 使用原始数据训练、预测。
- 使用波场分离后的两个数据,分别训练、预测。
影响性能的几个方面:
- 分离的技术;
- 预测的技术(网络);
- 融合的技术
可参考的一个东西,横波数据和纵波数据分别进双编码器(参考论文)。
二、关于科研素养
1、PPT 讲解
回看会议录屏,会发现仍然存在诸如 “啊”,“然后”,“额” 等口头用语;以及吸气声,对于听众而言,体验感不好。
同时,流畅度仍然有提高空间,后续考虑要写一个简单的讲解大纲。
PPT:给听众直观的认识!!!
- 画一个总体流程图(含 input 和 output)。
- 给一个网络架构图。
- 给出原始数据、中间结果、最终结果的图像(例子)。
- 实验的数据集是哪个?Flat, Curve, Fault
对于听众来说,图像会更加直观,保证每一张 PPT 上有至少一张图片,附以少量文字解释,这是最好的。
如何提高讲解的清晰度,要把听众当做什么都不懂的人。从任务说明开始,就要对每个出现的概念进行图文并茂的解释。
同时对于结果的展示,数据是为了科学性,直观性的关键仍然在图像本身上。换言之,可视化是一个非常重要的部分。
说明清楚数据集的来源目的在哪儿?因为大家对约定的数据集都有大概的概念,在这种基础下,一些数据便更容易想象。比如对于 Flat,因为简单,所以千分之一和万分之一实际上没什么差别;而如果是针对 Curve,这时候 0.1 与 0.2 的差距都是很大的了。
做 PPT 尤其要注意主次问题。个人的一些感悟和想法,这些东西更加适合于自己写的博文,这是对自己的主;而图片和更多可视化方面的东西,是对听众的主。
一些细节上的东西:
1. 比如对于横波和纵波,就应该有相应的图像(自己做或者是网上找),变换前是什么样子,经过 Radon 变换后又是什么样子。
2. 对于中间的 .npy 文件,应该补充说明其大小,让听众有个大概的认识水平。
3. 对于 Radon 变换的讲解,去网上或者自己跑,单道数据分离出来是什么样子的,多道数据分离出来又是什么样子的。注意图片!
2、有效使用已有代码
比如对于速度模型的展示,这个代码已经有比较成熟的代码了,要合理运用,而不是再自己去搞一个效果不那么好的。
综合来看,科研素养还是太过于低下了。