4月20日,华锐技术A+CLUB联合AMD在上海举办了“春起潮涌——硬件驱动的量化交易与AI”沙龙活动,会议围绕FPGA硬件加速、CPU&网卡调优、AI技术应用等展开,近50位量化IT与分享嘉宾一起探讨硬件技术在量化交易和AI领域的应用和创新。
FPGA在交易和行情链路中的提速实践
周小鹏 华锐技术FPGA技术专家
得益于FPGA的脉动式流水计算和多条流水并行计算原理,FPGA可实现硬件加速计算,近些年在量化投资领域应用日趋加深,华锐技术最新的行情和交易系统也深度引入了FPGA技术,实现软硬融合,让行情和交易稳定得快!上游(券商)系统性能升级便捷,插卡改造,下游客户(私募)行情无需改造,交易以QuantAPI接入,性能更进一步。目前华锐行情FPGA系统已上线券商约10家,接入机构15+,稳定上线运行近2年。
AMD EPYC 调优经验分享
梁朝军 AMD解决方案高级架构师
AMD EPYC CPU在高负载场景下如何达到最佳性能,AMD解决方案高级架构师梁朝军深入讨论了DDR5内存的性能权衡,NUMA设置对性能的影响,以及如何通过BIOS和操作系统层面的设置来优化功率。例如NPS4配置能够最大化地达到低延迟和高内存带宽;将CPU设置为P0状态以获得最佳性能;使用Cpupower工具确保CPU处于Performance模式;调整内存管理和网络缓冲区大小,以适应特定的工作负载需求等。此外,本次研讨还提供了性能测试的命令示例、网络调优的推荐配置、以及AVT(AMD验证工具包)的使用。最后,还介绍了ACPI电源管理规范和多种性能分析工具,旨在帮助用户优化系统性能和能效。
AMD Solarflare 低延迟以太网适配器
赵春晓 AMD资深技术专家
AMD Solarflare 提供了X2、X3和X4系列低延时以太网适配器,为金融科技领域的高频交易、市场数据传输和复杂计算任务提供了强大的支持,其通过内核旁路技术和OpenOnload TCP/IP协议栈降低延时,提升数据处理效率,还拥有智能自动协商、无状态卸载、特定于BSD的API兼容内核旁路等特性。同时,赵春晓还强调了Onload技术家族,包括OpenOnload、TCPDirect和ef_vi,它们通过不同的API提供灵活且符合标准的低延时解决方案。性能方面,OpenOnload展示了比Linux内核TCP更高的吞吐量和更低的延迟,特别是在小数据包传输时。AMD还提供了企业服务和支持(ESS),包括年度商业服务、错误修复、维护发布等,分为标准和高级两个支持级别,后者提供更快的响应时间和对EnterpriseOnload的访问权限。
AI时代的量化投资如何基于CPU提速
Alan Tian AMD解决方案高级架构师
随着国内量化投资的快速迭代和发展,人工智能技术在量化中的应用受到了越来越多的关注。从算力应用层来说,AI模型底层分为CPU和GPU两个方向,AMD则是一家在两个方向都达到了行业领先地位的企业。在大数据应用场景中,AMD EPYC CPU具有高灵活、高性能与高成本效益的特点。1台AMD双路服务器可以当2台传统服务器使用,AVX512在性能、内核、缓存及内存带宽方面具有相当优势。在AI性能相近的情况下,AMD Genoa的成本更低。值得一提的是,AMD即将发布的新产品SP5 Turin进一步优化了CPU上的AI工作负载,尤其在机器学习和推荐系统等方面,拥有更高的性能和成本效益,为大数据和AI模型提供强大的处理能力,详情敬请期待AMD官网!
国内量化交易从自由生长到现在发展得日趋成熟规范,最近迎来了程序化交易的新规,监管也就量化交易发表了一系列言论,但春天的到来,意味着新的生机和希望。监管在春天播下的种子,它承载着量化人的梦,想必未来在量化行业的发展中会见证种子开花结果的时刻!其中,硬件技术也将在合规下持续助力量化交易创新与发展。