【LAMMPS学习】七、加速性能(3)通用技巧

7. 加速性能

7.1.基准测试

7.2.测试性能

7.3.通用技巧

以下是提高模拟性能的通用技巧。它们中的大多数只适用于当前性能中的某些模型和某些瓶颈,因此让您生成的计时数据作为指导。要预测这些选项会产生多大的差异,即使不是不可能,也是很难的,因为这是问题大小、所使用的处理器数量和您的机器的函数。识别性能瓶颈并尝试各种选项是无可替代的。

  • rRESPA

  • Two-FFT PPPM

  • Staggered PPPM

  • single vs double PPPM

  • partial charge PPPM

  • verlet/split run style

  • processor command for proc layout and numa layout

  • load-balancing: balance and fix balance

Two-FFT PPPM,也称为分析微分或 ad PPPM,使用 2 个 FFT,而不是默认 ik 微分 PPPM 使用的 4 个 FFT。然而,2-FFT PPPM 还需要稍大的网格尺寸才能达到与 4-FFT PPPM 相同的精度。对于 FFT 成本成为性能瓶颈的问题(通常是在许多处理器上运行的大问题),2-FFT PPPM 可能比 4-FFT PPPM 更快。

Staggered PPPM 使用两种不同的网格执行计算,其中一个网格相对于另一个网格略有移动。这可以减少力混叠误差并提高方法的准确性,但也会使所需的工作量加倍。为了获得较高的相对精度,与常规 PPPM 相比,使用Staggered PPPM可以在每个维度上实现一到一半的网格大小,这可以在 kspace 时间中提供大约 4 倍的加速。然而,对于相对精度较低的情况,使用Staggered PPPM 几乎没有什么好处,并且 kspace 时间可能会慢 2 倍。例如,视紫红质基准测试在单个处理器上运行,不同方法的 kspace 时间与相对精度的结果如下图所示。对于该系统,当使用略大于 1e-5 及以上的相对精度时,Staggered PPPM(使用 ik 微分)变得有用。

注:使用Staggered PPPM 可能无法像力那样提高能量和压力的准确性,因此如果能量和/或压力是感兴趣的量(例如使用恒压器时),则必须小心谨慎。

7.4.加速器包

7.5.加速器包比较

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/788733.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Pathlib库的有哪些神奇功能在Python中

解锁Python利器pathlib的神奇功能 什么是 pathlib? pathlib 是 Python 中用于处理文件路径的模块,它提供了面向对象的方法来操作文件系统路径。使用 pathlib 可以更加直观和安全地处理文件和目录路径。 功能 一些 pathlib 提供的功能包括:…

Jmeter02-1:参数化组件CVS

目录 1、Jmeter组件:参数化概述 1.1 是什么? 1.2 为什么? 1.3 怎么用? 2、Jmeter组件:参数化实现之CSV Data Set Config(重点中重点) 2.1 是什么? 2.2 为什么? 2.3 怎么用? …

【2024年5月备考新增】《2024高项论文精华版(5)项目工作绩效域和度量绩效域》

3 项目工作绩效域 预期目标绩效指标检查方法①高效且有效的项目绩效状态报告:通过状态报告可以表明项目工作有效率且有效果②适合项目和环境的项目过程▲过程的适宜性:证据表明,项目过程是为满足项目和环境的需要而裁剪▲过程相关性和有效性:过程审计和质量保证活动表明,过…

Golang | Leetcode Golang题解之第5题最长回文子串

题目&#xff1a; 题解&#xff1a; func longestPalindrome(s string) string {if s "" {return ""}start, end : 0, 0for i : 0; i < len(s); i {left1, right1 : expandAroundCenter(s, i, i)left2, right2 : expandAroundCenter(s, i, i 1)if ri…

「PHP系列」PHP数组排序及运用场景

文章目录 一、PHP 数组排序二、PHP 数组排序使用场景数据排序介绍数据排序案例 三、相关链接 一、PHP 数组排序 PHP 提供了多种数组排序函数&#xff0c;允许你根据数组元素的值或键进行排序。 sort() sort() 函数用于对数组的元素按升序进行排序。它会修改原始数组&#xf…

把本地项目上传到gitee上

要把本地项目上传到 Gitee&#xff0c;你需要先在 Gitee 上创建一个仓库&#xff0c;然后在本地使用 Git 将项目推送到 Gitee。以下是简要步骤和示例代码&#xff1a; 1、在 Gitee 上创建一个新的仓库。 2、在本地项目目录中初始化 Git&#xff08;如果尚未初始化&#xff09…

python实现全排列(递归和循环)

递归实现全排列可以使用回溯法。具体步骤如下&#xff1a; 将待排列的元素分为两部分&#xff1a;第一个元素&#xff08;固定元素&#xff09;和其余元素。对于固定元素后面的每一个元素&#xff0c;将其与固定元素交换位置&#xff0c;然后递归地对剩余元素进行全排列。递归…

Mysql数据库getshell方法

今天摸鱼时候&#xff0c;突然有人问我不同的数据库getshell的方式&#xff0c;一时间我想到了mysql还有redis未授权访问到getshell的方式&#xff0c;但是仅仅第一时间只想到了这两种&#xff0c;我有查了查资料&#xff0c;找到了上面两种数据库getshell的补充&#xff0c;以…

【面试八股总结】传输控制协议TCP(三)

参考资料 &#xff1a;小林Coding、阿秀、代码随想录 一、TCP拥塞控制⭐ 1. 慢启动 – Slow Start 慢启动是指TCP连接刚建立&#xff0c;一点一点地提速&#xff0c;试探一下网络的承受能力&#xff0c;以免直接扰乱了网络通道的秩序。 慢启动算法&#xff1a; 初始拥塞窗口…

电商技术揭秘五:电商平台的个性化营销与数据分析

文章目录 引言1. 个性化营销的概念与价值1.1 个性化营销的定义1.1.1 个性化营销的基本概念1.1.2 个性化营销在电商领域的重要性 1.2 个性化营销的核心价值1.2.1 提升用户体验1.2.2 增加转化率和客户忠诚度1.2.3 优化营销资源配置 2. 用户画像与行为分析2.1 用户画像的构建2.1.1…

SpringBoot+thymeleaf完成视频记忆播放功能

一、背景 1)客户要做一个视频播放功能,要求是系统能够记录观看人员在看视频时能够记录看到了哪个位置,在下次观看视频的时候能够从该位置进行播放。 2)同时,也要能够记录是谁看了视频,看了百分之多少。 说明:由于时间关系和篇幅原因,我们这里只先讨论第一个要求,第…

智能小车测速(3.26)

模块介绍&#xff1a; 接线&#xff1a; VCC -- 3.3V 不能接5V&#xff0c;否则遮挡一次会触发3次中断 OUT -- PB14 测速原理&#xff1a; cubeMX设置&#xff1a; PB14设置为gpio中断 打开定时器2&#xff0c;时钟来源设置为内部时钟&#xff0c;设置溢出时间1s&#xff0c…

OpenEuler虚拟机配置网络连接

花了一晚上踩坑...... 1.进入下面这个网卡的配置 vi /etc/sysconfig/network-scripts/ifcfg-ens33 把ONBOOT改成yes 解释&#xff1a;ONBOOT是指明在系统启动时是否激活网卡&#xff0c;只有在激活状态的网卡才能去连接网络&#xff0c;进行网络通讯。 重启一下登录的时候…

视频监控/云存储/AI智能分析平台EasyCVR集成时调用接口报跨域错误的原因

EasyCVR视频融合平台基于云边端架构&#xff0c;可支持海量视频汇聚管理&#xff0c;能提供视频监控直播、云端录像、云存储、录像检索与回看、智能告警、平台级联、智能分析等视频服务。平台兼容性强&#xff0c;支持多协议、多类型设备接入&#xff0c;包括&#xff1a;国标G…

【已解决】Error: error:0308010C:digital envelope routines::unsupported

前言 场景&#x1f3ac; 使用 Ant Design &#xff0c; 执行 npm run dev 出现异常。 文章目录 前言场景&#x1f3ac; 异常信息解决方案方案一(推荐)MAC | Linux 电脑成功⬇️ Windows 电脑 方案2&#xff1a; 不懂留言 JavaPub 异常信息 我直接异常信息&#xff0c;你可以…

Tomcat部署flowable出现consider increasing the maximum size of the cache

使用Apache Tomcat/8.5.32部署运行flowable-6.5.0时发现控制台有警告 问题原因&#xff1a;解决方法: 使用Apache Tomcat/8.5.32部署运行flowable-6.5.0时发现控制台有警告 01-Apr-2024 20:55:08.877 警告 [localhost-startStop-1] org.apache.catalina.webresources.Cache.ge…

拥塞控制算法系列之:Swift-谷歌2020年SIGCOM-包级别端到端TIMELY拥塞控制算法

核心要点&#xff1a; 谷歌 2020 SIGCOM基于delay的AIMD拥塞拆分EC和FC&#xff0c;时延敏感场景优势分别计算EC和FC的wnd&#xff08;最核心&#xff09;保障吞吐和低延迟。Swift 因利用延迟的简单性和有效性而闻名包级别的论文&#xff1a;https://dl.acm.org/doi/pdf/10.11…

基于 Erlang 的随机账户分配机制

当你在网上注册新账户时&#xff0c;平台如何为你生成一个独特的用户名或编号呢&#xff1f;这背后其实有一套精心设计的系统。本文将带你了解一种使用 Erlang 语言开发的随机账户分配系统&#xff0c;它既快速又可靠。 ## 随机分配的简单步骤 我们可以将这个过程想象成一个装…

C刊级 | Matlab实现GWO-BiTCN-BiGRU-Attention灰狼算法优化双向时间卷积双向门控循环单元融合注意力机制多变量回归预测

C刊级 | Matlab实现GWO-BiTCN-BiGRU-Attention灰狼算法优化双向时间卷积双向门控循环单元融合注意力机制多变量回归预测 目录 C刊级 | Matlab实现GWO-BiTCN-BiGRU-Attention灰狼算法优化双向时间卷积双向门控循环单元融合注意力机制多变量回归预测效果一览基本介绍程序设计参考…

stream使用

stream流式计算 在Java1.8之前还没有stream流式算法的时候&#xff0c;我们要是在一个放有多个User对象的list集合中&#xff0c;将每个User对象的主键ID取出&#xff0c;组合成一个新的集合&#xff0c;首先想到的肯定是遍历&#xff0c;如下&#xff1a; List<Long> u…