Apache Cassandra和低延迟应用程序

介绍

多年来, Grid Dynamics拥有许多与NoSQL相关的项目,尤其是Apache Cassandra。 在这篇文章中,我们要讨论一个给我们带来挑战的项目,而我们在该项目中试图回答的问题今天也仍然适用。

数字营销和在线广告在2012年很受欢迎,并且对它们的需求仅在增加。 实时出价(RTB)是领域的组成部分。 实时出价工具假设通过数字广告的实时拍卖来放置(购买和出售)广告。 如果中标,则买方的广告会立即显示在发布商的网站上。 实时出价需要服务器端的低延迟响应(<100ms),否则出价将丢失。 我们的客户之一,一家美国媒体公司,对实时出价和用户跟踪(即对网站访问者的行为及其偏好的分析)感兴趣。

最初,客户用于处理RTB请求的基础结构包括安装Kyoto Cabinet 。 在下图(图片1)上,您可以看到RTB和第三方请求的来源。 所有请求都发送到实时应用程序,该应用程序在数据库中执行查找和更新请求。 Kyoto Cabinet会将整个数据集保存在内存中,而自定义附件提供了保留管理和持久性功能。

图1.以前的体系结构。

图1.以前的体系结构。

从延迟的角度来看,上述架构足够好,但是它有几个缺点:

  1. 可扩展性。 该架构假定仅在安装京都内阁的情况下对服务器进行垂直扩展。 当时,每台服务器都配备了约50GB的内存。 众所周知,增加内存量可以长期解决该问题。
  2. 坚固性。 如果发生故障,仅安装京都橱柜可能会导致非常严重的后果。
  3. 跨数据中心复制。 该体系结构在数据中心之间没有自动同步。 手动同步确实令人头疼,因为它需要大量其他操作。

我们的任务是为系统创建一个新的体系结构,该体系结构不具有上述缺点,同时使我们能够在响应延迟方面获得良好的结果。 换句话说,我们需要一个数据存储区,该数据存储区将允许我们保留用户个人资料以及对其进行查找和更新,并且所有操作都将在特定时间间隔内执行。 该体系结构应该围绕这样的数据存储构建。

要求

新的体系结构旨在解决所有这些问题。 对新体系结构的要求如下:

  • 持久性(一个或两个数据中心停电时,任何数据都不应丢失)
  • 高可用性(应该没有单点故障)
  • 可伸缩性(通过添加更多节点,数据库量应该相对容易增加)
  • 跨数据中心复制(两个数据中心之间的数据应同步)
  • 数据的TTL(过期的用户配置文件应自动清除)
  • 数据量(约10亿个具有多个属性的同类记录,其中一个记录约为400字节)
  • 吞吐量(每个数据中心每秒5000次随机读取+每秒5000次随机写入)
  • 响应延迟(平均3毫秒,对于99%的请求,处理时间不应超过10毫秒)

另外,我们还有一些与基础架构有关的限制。 限制之一是每个数据中心最多只能为每个数据库安装八台服务器。 同时,我们可以选择某些服务器硬件,例如内存量,存储类型和大小。 客户的其他要求之一是使用复制因子TWO,由于数据的统计性质,该因子是可以接受的。 这样可以降低硬件成本。

我们研究了几种可能满足我们要求的解决方案,最后选择了Cassandra。 Cassandra的新体系结构成为一种更为优雅的解决方案。 它只是两个数据中心之间同步的Cassandra集群。 但是,有关其硬件规格的问题仍然没有答案。 最初,我们有两种选择:

  • SDD,但内存较少(少于整个数据集)
  • HDD和更多内存(足以保留整个数据集)

实际上,还有一个选项暗示使用硬盘驱动器和更少的内存,但是这种配置不能提供我们要求的可接受的读取延迟,因为从HDD随机读取甚至需要10ms RPM的硬盘也需要8毫秒。 结果,它从一开始就被拒绝了。

因此,我们有两种配置。 经过一些调整(调整本身将在下一节中讨论),它们都满足了我们的需求。 他们每个人都有自己的优点和缺点。 SSD配置的主要缺点之一是成本。 当时,企业级SDD相当昂贵。 此外,一些数据中心提供商对使用SSD维护服务器收取额外费用。

使用HDD的方法意味着从磁盘缓存中读取数据。 该配置的大多数缺点与高速缓存有关,例如,冷启动问题。 这是由于在系统重新引导后清除了缓存而造成的。 结果,从HDD读取未缓存的数据会导致额外的超时。 实际上,超时是在10毫秒内没有响应的请求。 此外,由于在启动时从Cassandra服务器复制了大量数据,可能会意外清理磁盘缓存。 最后一个问题与内存大小有关,而不是与缓存有关。 增加单个节点的数据量非常困难。 可以添加一个额外的HDD或几个HDD,但是单台计算机的内存大小是有限的,并且不是很大。

最后,我们设法解决了大多数上述HDD配置问题。 通过使用cat实用程序读取数据并将其输出重定向到启动时的/ dev / null,解决了冷启动问题。 修补了用于创建备份的rsync之后,与磁盘缓存清理相关的问题就消失了。 但是内存限制问题仍然存在,并在以后引起了一些麻烦。

最后,客户端选择了HDD + RAM配置。 每个节点在RAID 5 + 0中配备了96GB内存和8个HDD。

调整卡桑德拉

我们开始使用的Cassandra版本是1.1.4。 进一步,在开发过程中我们尝试了不同的版本。 最后,我们决定批准使用1.2.2版,因为它包含我们已承诺对Cassandra存储库进行的更改。 例如,我们添加了一项改进 ,使我们可以为每个列族分别指定populate_io_cache_on_flush选项(它将在内存表刷新和压缩时填充磁盘缓存)。

我们必须测试其余两种配置,以选择一种更好的配置。 在我们的测试中,我们使用了一个Cassandra群集,该群集包含3个节点,每个节点具有64GB内存和8个内核。 我们从写操作开始测试。 在测试期间,我们以每秒7000次写入的速度将数据写入Cassandra。 选择的速度与群集大小和所需的吞吐量成正比(将写入速度加倍,以考虑跨数据中心复制的开销)。 该方法已应用于所有测试。 值得一提的是,我们使用了以下首选项:

  • 复制因子= 2
  • write_consistency_level =两个
  • 分层压缩策略

之所以使用LeveledCompactionStrategy(LCS),是因为客户端的工作流应该具有大量的更新操作。 使用LCS的另一个原因是整体数据集大小和读取延迟减小。 两种配置的测试结果均相同:

  • 平均延迟时间:〜1ms
  • 超时:0.01%
  • CPU使用率:<5%

两种配置都满足了我们的需求,尽管在此阶段我们没有花时间调查超时的性质。 超时将在后面讨论。 据推测,大多数响应时间是由网络传输占用的。 另外,我们尝试增加每秒的写查询次数,并产生了良好的结果。 没有明显的性能下降。

之后,我们进入下一步,即测试读取操作。 我们使用了相同的集群。 所有读取请求均以read_consistency_level = ONE发送。 写入速度设置为每秒3500个查询。 每个服务器上大约有40GB的数据,单个记录大小约为400字节。 因此,整个数据集适合内存大小。 测试结果如下:

表1.读取操作的初始测试结果

表1.读取操作的初始测试结果

查看两种配置的测试结果,我们发现超时值的百分比不令人满意,它们是所需值的2-3倍(2-3%对1%)。 此外,我们还担心CPU负载过高(约20%)。 至此,我们得出的结论是我们的配置有问题。

找到与超时相关的问题的根源并不是一件容易的事。 最终,我们修改了Cassandra的源代码,并为所有读取请求返回一个固定值(跳过从SSTables,memtables等中进行的任何查找)。 之后,再次对读取操作执行相同的测试。 结果是完美的:GC活动和CPU使用率显着降低,并且几乎没有检测到超时。 我们还原了更改,并尝试为GC找到最佳配置。 在尝试了其选项之后,我们确定了以下配置:

  • -XX:+ UseParallelGC
  • -XX:+ UseParallelOldGC
  • -XX:MaxTenuringThreshold = 3
  • -Xmn1500M
  • -Xmx3500M
  • -Xms3500M

我们设法减少了GC对Cassandra性能的影响。 值得注意的是,读取操作的超时次数超过了写入操作的超时次数,因为Cassandra在读取过程中在堆中创建了许多对象,这又导致大量的CPU使用率。 至于等待时间,它足够低,可以很大程度上归因于数据传输时间。 与更密集的读取一起执行相同的测试表明,与写入操作相比,增加读取操作的数量会显着影响超时的数量。 据推测,这一事实与GC的生长活性有关。

众所周知的事实是,应针对每种情况分别配置GC。 在这种情况下,并发标记扫描(CMS)效果不如Parallel Old GC。 将堆大小减小到相对较小的值也很有帮助。 尽管上面的配置可能不是最好的配置,但它是满足我们需求的一种。 另外,我们尝试了不同版本的Java。 Java 1.7使我们相对于Java 1.6有了一些性能改进。 相对超时数减少了。 我们尝试的另一件事是在Cassandra中启用/禁用行/键缓存。 禁用缓存会稍微降低GC活动。

下一个产生令人惊讶结果的选项是池中处理Cassandra中的读/写请求的线程数。 由于我们的基准测试模拟了多个客户端(最多500个线程),因此将该值从32增加到128会对性能产生重大影响。 另外,我们尝试了不同版本的CentOS和SELinux的各种配置。 切换到更高的6.3版本后,我们发现Java期货在较短的时间内通过超时返回了控制权。 SELinux的配置更改对性能没有影响。

解决读取性能问题后,我们便以混合模式(读取+写入)进行了测试。 在这里,我们观察到一种情况,如下图所示(图2)。 在每次刷新到SSTable之后,Cassandra开始从磁盘读取数据,这又导致客户端超时增加。 此问题与HDD + RAM配置有关,因为从SSD读取不会导致其他超时。

图2.改进之前混合模式(读+写)中的磁盘使用情况。

图2.改进之前混合模式(读+写)中的磁盘使用情况。

我们尝试修改Cassandra配置选项,即populate_io_cache_on_flush(如上所述)。 默认情况下,此选项是关闭的,这意味着文件系统缓存未填充新的SSTables。 因此,当访问来自新SSTable的数据时,将从HDD中读取数据。 将其值设置为true可解决此问题。 下图(图3)显示了改进后的磁盘读取数。

图3.改进后,混合模式下磁盘的使用情况(读+写)。

图3.改进后,混合模式下磁盘的使用情况(读+写)。

换句话说,在整个数据集缓存在内存中后,即使在混合模式下,Cassandra也停止了从磁盘读取数据。 值得注意的是,虽然从配置文件中排除了该选项,但从2.1版开始,默认情况下在Cassandra中populate_io_cache_on_flush选项处于打开状态。 下面的摘要(表2)描述了我们尝试的更改及其影响。

表2.对Cassandra和系统本身的更改及其对延迟的影响。

表2.对Cassandra和系统本身的更改及其对延迟的影响。

最后,应用了本文中描述的更改之后,我们在SSD和HDD + RAM配置上均取得了可接受的结果。 在调整Cassandra客户端(我们使用Astyanax)以使其在复制因子为2的情况下正常运行并在超时的情况下可靠地按时返回控制方面也付出了很多努力。 我们还希望分享一些有关操作自动化,监控以及确保跨数据中心复制正常工作的细节,但是很难在一个帖子中涵盖所有方面。 如上所述,我们已经开始使用HDD + RAM配置进行生产,并且可以毫无意外地可靠地工作,包括在不停机的情况下在活动集群上进行Cassandra升级。

结论

卡桑德拉(Cassandra)在引入该项目时对我们来说是新手。 我们不得不花费大量时间来探索其功能和配置选项。 它使我们能够实现所需的体系结构并按时交付系统。 同时,我们获得了丰富的经验。 我们进行了大量工作,将Cassandra集成到我们的工作流程中。 我们对Cassandra源代码的所有更改都已反馈给社区。 我们的数字营销客户受益于拥有更稳定,可扩展的基础架构以及自动同步功能,从而减少了他们维护系统所需的时间。

关于网格动力学

Grid Dynamics是为Tier 1零售提供开放,可扩展的下一代商务技术解决方案的领先提供商。 Grid Dynamics在商务技术方面拥有深厚的专业知识,并广泛参与开源社区。 伟大的公司与Grid Dynamics合作,通过在全渠道平台,产品搜索和个性化以及持续交付方面实施和管理解决方案,获得了可持续的业务优势。 要了解更多关于网格动态,找到我们在www.griddynamics.com或者按照我们的Twitter @GridDynamics。

翻译自: https://www.javacodegeeks.com/2015/02/apache-cassandra-low-latency-applications.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/360501.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java十大简单性能优化

关于“ web scale ”这个流行词有很多炒作&#xff0c;人们花了很多时间来重新组织他们的应用程序体系结构&#xff0c;以使其系统“规模化”。 但是什么是扩展&#xff0c;我们如何确保可以扩展&#xff1f; 缩放的不同方面 上面提到的炒作主要是关于扩展负载 &#xff0c;即…

php在苹果手机上传不了图片大小,ThinkPHP后台上传图片无默认尺寸解决方法

原标题&#xff1a;ThinkPHP后台上传图片无默认尺寸解决方法随着网站移动端的日益普及&#xff0c;对后台数据的兼容性要求也越来越高。后台数据涵盖范围不断扩大的同时&#xff0c;使得程序处理能力也必须逐步提高。使用ThinkPHP进行长沙网站开发时&#xff0c;后台kindeditor…

宝塔php gd库,宝塔面板安装 EasyImag – 一款最简单图床的安装体验

近日闲逛&#xff0c;发现了一款图床&#xff0c;一款开箱即食的简单图床程序。因为没有数据库所以安装起来也是异常简单&#xff0c;我们看看功能&#xff1a;支持设置图片质量支持仅登录后上传支持QQ截图&#xff0c;剪切板上传支持在线管理(增删改查)支持上传图片转换为指定…

批准Oracle IDM中的特定Web服务

关于Web服务端点的快速发布&#xff0c;OIM和SOA在与批准有关的场景中使用了Web服务端点- 基本内容&#xff0c;但对于初学者可能有用 。 Oracle IDM与SOA套件集成并利用其提供与批准相关的功能&#xff08;说实话&#xff0c;SOA相当丰富&#xff0c;并且也被用作Web服务连接…

Oracle15001,Oracle11gR2RAC环境DBCA创建数据库报错ORA-15055ORA-15001

在Oracle 11gR2 GridInfrastructure和Database软件安装完成之后&#xff0c;执行DBCA创建数据库到30%的时候报如下错误&#xff0c;点击OK后提示忽略并问题现象:在Oracle 11gR2 GridInfrastructure和Database软件安装完成之后&#xff0c;执行DBCA创建数据库到30%的时候报如下错…

针对新手的Java EE7和Maven项目–第8部分

第1部分 &#xff0c; 第2部分 &#xff0c; 第3部分 &#xff0c; 第4部分 &#xff0c; 第5部分 &#xff0c; 第6部分 &#xff0c; 第7部分 第8部分 自上一篇文章以来&#xff0c;这一系列教程已经有很长时间了。 是时候恢复并在我们的简单项目中添加新功能了。 正…

玩Weld-Probe –一站式查看CDI的所有方面

焊接3.0.0.Alpha4被释放 &#xff0c;而我一直坐在在DevConf.CZ一间会议室。 Jozef Hartinger&#xff08; jozefhartinger &#xff09;或多或少地在几分钟前告诉我有关此最新版本的新功能的信息。 有一个特别的功能真正引起了我的注意&#xff0c;它是新的焊接探针机制。 什…

linux cmake装在自己目录下,如何在Linux下安装cmake

全部展开OpenCV 2.2和更高版本需要使用Cmake生成生成文件&#xff0c;因此需要先安装cmake. 还有其他需要先安装cmake的软件1. 在Linux环境中打开Web浏览器&#xff0c;输入URL:mac cmake gui&#xff0c;找到最新版本的位置. 通常&#xff0c;发布了两个版本的开源软件: “源分…

Java Bootstrap:Dropwizard与Spring Boot

如何在尽可能短的时间内使准备就绪的Java应用程序投入生产&#xff1f; 我不是一个早起的人&#xff0c;所以有时需要一些时间才能启动“所有系统”提示。直到不久之前&#xff0c;这对于Java应用程序来说都是正确的&#xff0c;但是与发明贪睡功能不同闹钟&#xff0c;我们将在…

物理数据模型(PDM)-概念数据模型 (CDM)-面向对象模型 (OOM):适用于已经设计好数据库表结构了。...

步骤如下&#xff1a; 一、反向生成物理数据模型PDM 开发环境 PowerDesigner 15 ,SQL Server2005 &#xff08;1&#xff09;在开始逆向生成PDM图之前&#xff0c;需要为指定的数据库创建ODBC数据源。以Windows xp操作系统为例&#xff0c;选择“开始”/“运行”命令&#xff0…

MySQL作为Kubernetes服务,可从WildFly Pod访问

Kubernetes上使用Vagrant的Java EE 7和WildFly&#xff08;技术提示&#xff03;71&#xff09;介绍了如何在使用Kubernetes和Docker托管的WildFly上运行琐碎的Java EE 7应用程序。 Java EE 7应用程序是在世界范围内交付的动手实验室 。 它使用与WildFly捆绑在一起的内存数据库…

麒麟Linux启动目录,优麒麟目录结构介绍 系统入门必备

对于Linux爱好者来说&#xff0c;深入了解Linux文件目录结构的标准和每个目录的详细功能&#xff0c;对于我们用好Linux系统至关重要&#xff0c;下面就由小编给大家介绍下优麒麟系统的目录结构&#xff0c;PS: 同样适用于其他Linux发行版。查看系统的全部目录&#xff1a;* 在…

java课堂作业(一)

1、环境变量配置参见&#xff1a;http://www.cnblogs.com/dongwenbo/p/3282014.html window ---> preference ---> java ---> installed jres ---> add jres tomcat 配置&#xff1a;myeclipse ---> preferences ---> myeclipse enterprise workbench --->…

为什么我的JVM访问的内存少于通过-Xmx指定的内存?

“嘿&#xff0c;你能来看看奇怪的东西吗&#xff1f;” 这就是我开始研究一个支持案例的方式&#xff0c;该案例将我引向了这篇博客文章。 当前的特殊问题与不同的工具报告了有关可用内存的不同数字有关。 简而言之&#xff0c;一位工程师正在研究特定应用程序的过多内存使用…

linux怎么安装高德导航软件,高德地图车机版如何安装?高德地图车机版安装教程...

高德地图车机版是高德为汽车车载机提供的一个专用版本&#xff0c;对于车主们来说有时候用手机导航实在是非常不方便&#xff0c;不仅屏幕小而且还可能中途来个电话什么的。高德地图车机版可以帮你的车载机装上导航地图&#xff0c;就算你不想买导航设备也能让你的车子为你导航…

Dropwizard,MongoDB和Gradle实验

介绍 我使用Dropwizard&#xff0c;MongoDB和Gradle创建了一个小项目。 它实际上是从一个实验性的Guava缓存开始的&#xff0c;作为将计数器发送到MongoDB&#xff08;或任何其他DB&#xff09;的缓冲区。 我也想尝试MondleDB插件的Gradle。 接下来&#xff0c;我想创建某种接口…

在wp中,使用NavigationService.Navigate导航页面出现错误

我们在WP项目中采用页面导航时候&#xff0c;经常会使用以下代码 NavigationService.Navigate(new Uri("/Page1.xaml",UriKind.Relative));但是&#xff0c;有的时候会出现错误&#xff1a; "Error 1 An object reference is required for the non-static field…

SSDT – Error SQL70001 This statement is not recognized in this context-摘自网络

March 28, 2013 — arcanecode One of the most common errors I get asked about when using SQL Server Data Tools (SSDT) Database Projects is the error “This statement is not recognized in this context”. This is actually a pretty simple error to fix. Envisi…

带有JAX-RS和PrimeFaces的RESTful图表

通常&#xff0c;利用图表提供数据的可视表示很有用。 PrimeFaces提供制图解决方案&#xff0c;可轻松将数据的可视表示形式添加到Web和移动应用程序中。 如果将PrimeFaces图表组件与RESTful Web服务数据结合使用&#xff0c;我们可以创建自定义图表&#xff0c;以适合桌面和移…

UVAlive 6131 dp+斜率优化

这道题和06年论文《从一类单调性问题看算法的优化》第一道例题很相似。 题意&#xff1a;给出n个矿的重量和位置&#xff0c;这些矿石只能从上往下运送&#xff0c;现在要在这些地方建造m个heap&#xff0c;要使得&#xff0c;sigma距离*重量最小。 思路&#xff1a;O(n ^ 3)的…