Intel PAUSE指令变化影响到MySQL的性能,该如何解决?

MySQL得益于其开源属性、成熟的商业运作、良好的社区运营以及功能的不断迭代与完善,已经成为互联网关系型数据库的标配。可以说,X86服务器、Linux作为基础设施,跟MySQL一起构建了互联网数据存储服务的基石,三者相辅相成。本文将分享一个工作中的实践案例:因Intel PAUSE指令周期的迭代,引发了MySQL的性能瓶颈,美团MySQL DBA团队如何基于这三者来一步步进行分析、定位和优化。希望这些思路能对大家有所启发。

1.背景

在2017年,Intel发布了新一代的服务器平台Purley,并将Intel Xeon Scalable Processor(至强可扩展处理器)重新划分为:Platinum(铂金)、Gold(金)、Silver(银)、Broze(铜)等四个等级。产品定位和框架也变得更加清晰。

因美团线上海量数据交易和存储等后端服务依赖大量高性能服务器的支撑。随着线上部分Grantly平台E系列服务器生命周期的临近,以及产品本身的发展和迭代。从2019年开始,RDS(关系型数据库服务)后端存储(MySQL)开始大量上线Purley平台的Skylake CPU服务器,其中包含Silver 4110等。

Silver 4110相比上一代E5-2620 V4,支持更高的内存频率、更多的内存通道、更大的L2 Cache、更快的总线传输速率等。Intel官方数据显示Silver 4110的性能比上一代E5-2620 V4提升了10%。

然而,随着线上Skylake服务器数量的增加,以及越来越多的业务接入。美团MySQL DBA团队发现部分MySQL实例性能与预期并不相符,有时甚至出现较大程度的下降。经过持续的性能问题分析,我们定位到Skylake服务器存在性能瓶颈:

  • CPU负载相对较高。
  • TPS等吞吐量下降。

接下来,我们将从Intel CPU、ut_delay函数、PAUSE指令三方面入手,进行剖析定位,并探索相关优化方案。

2.性能问题分析

2.1 Grantly与Purley CPU性能差异

首先,基于上述两代平台的CPU(Grantly和Purley),通过基准测试,横向对比在不同OS下的性能表现。

通过基准测试数据,总结如下:

1.在oltp_write_only(只写)的场景下Purley 4110的性能下降较为明显。 2.同为Purley 4110,CentOS 7比CentOS 6 oltp_write_only(只写)性能有提升。

我们通过二维折线图,来展示性能之间的差异:

在上图中,同为Purley 4110,CentOS 7比CentOS 6性能有提升。具体提升原因,因不涉及本文重点内容,所以不在这里详细展开了。

New MCS-based Locking Mechanism

Red Hat Enterprise Linux 7.1 introduces a new locking mechanism, MCS locks. This new locking mechanism significantly reduces spinlock overhead in large systems, which makes spinlocks generally more efficient in Red Hat Enterprise Linux 7.1.

红帽官网Release Notes显示,从内核3.10.0-229开始,引入了新的加锁机制,MCS锁。可以降低spinlock的开销,从而更高效地运行。普通spinlock在多CPU Core下,同时只能有一个CPU获取变量,并自旋,而缓存一致性协议为了保证数据的正确,会对所有CPU Cache Line状态、数据,同步、失效等操作,导致性能下降。而MSC锁实现每个CPU都有自己的“spinlock”本地变量,只在本地自旋。避免Cache Line同步等,从而提升了相关性能。不过,社区对于spinlock的优化争议还是比较大的,后续又有大牛基于MSC实现了qspinlock,并在4.x的版本上patch了。具体实现可以参看:MCS locks and qspinlocks。

在大致了解CentOS 7性能的迭代后,接下来我们深入分析一下Skylake CPU 4110导致性能下降的缘由。

3.CPU性能跟踪

3.1 定位热点函数

具体定位4110性能瓶颈,分如下几步:

  1. 首先,通过perf top来跟踪一下Linux CPU性能开销。
  2. 然后,通过perf record记录函数CPU周期的消耗占比。
  3. 最后,通过火焰图来验证定位热点函数。

可以看到,其中占CPU消耗占比较大为:ut_delay函数。

我们继续深挖一下函数链调用关系:

# Children      Self  Command  Shared Object        Symbol                                                                                                                                                                            
# ........  ........  .......  ...................  ..................................................................................................................................................................................
#93.54%     0.00%  mysqld   libpthread-2.17.so   [.] start_thread|---start_thread|          |--77.07%--pfs_spawn_thread|          |          |           --77.05%--handle_connection|                     |          |                      --76.97%--do_command|                                |          |                                |--74.30%--dispatch_command|                                |          |          |                                |          |--71.16%--mysqld_stmt_execute|                                |          |          |          |                                |          |           --70.74%--Prepared_statement::execute_loop|                                |          |                     |          |                                |          |                     |--69.53%--Prepared_statement::execute|                                |          |                     |          |          |                                |          |                     |          |--67.90%--mysql_execute_command|                                |          |                     |          |          |          |                                |          |                     |          |          |--23.43%--trans_commit_stmt|                                |          |                     |          |          |          |          |                                |          |                     |          |          |           --23.30%--ha_commit_trans|                                |          |                     |          |          |                     |          |                                |          |                     |          |          |                     |--18.86%--MYSQL_BIN_LOG::commit|                                |          |                     |          |          |                     |          |          |                                |          |                     |          |          |                     |           --18.18%--MYSQL_BIN_LOG::ordered_commit|                                |          |                     |          |          |                     |                     |          |                                |          |                     |          |          |                     |                     |--8.02%--MYSQL_BIN_LOG::change_stage|                                |          |                     |          |          |                     |                     |          |          |                                |          |                     |          |          |                     |                     |          |--2.35%--__lll_unlock_wake|                                |          |                     |          |          |                     |                     |          |          |          |                                |          |                     |          |          |                     |                     |          |           --2.24%--system_call_fastpath|                                |          |                     |          |          |                     |                     |          |                     |          |                                |          |                     |          |          |                     |                     |          |                      --2.24%--sys_futex|                                |          |                     |          |          |                     |                     |          |                                |          |                                |          |                     |          |          |                     |                     |          |                                 --2.23%--do_futex|                                |          |                     |          |          |                     |                     |          |                                           |          |                                |          |                     |          |          |                     |                     |          |                                            --2.14%--futex_wake|                                |          |                     |          |          |                     |                     |          |                                                      |          |                                |          |                     |          |          |                     |                     |          |                                                       --1.38%--wake_up_q|                                |          |                     |          |          |                     |                     |          |                                                                 |          |                                |          |                     |          |          |                     |                     |          |                                                                  --1.33%--try_to_wake_up...

将上述调用通过火焰图进行直观展示:

现在基本可以确定,所有的函数调用,最后大部分的消耗都在ut_delay上。

3.2 ut_delay和PAUSE之间的关联与性能影响

3.2.1 MySQL ut_delay实现

接下来,我们继续看一下MySQL源码中ut_delay函数的功能:

/*************************************************************//**
Runs an idle loop on CPU. The argument gives the desired delay
in microseconds on 100 MHz Pentium + Visual C++.
@return dummy value */
ulint
ut_delay(
/*=====*/ulint delay)  /*!< in: delay in microseconds on 100 MHz Pentium */
{ulint i, j;
​UT_LOW_PRIORITY_CPU();
​j = 0;
​for (i = 0; i < delay * 50; i++) {j += i;UT_RELAX_CPU();}
​UT_RESUME_PRIORITY_CPU();
​return(j);
}
...
​
#   define UT_RELAX_CPU() asm ("pause" )
#   define UT_RELAX_CPU() __asm__ __volatile__ ("pause")

可以了解到,MySQL自旋会调用PAUSE指令,从而提升spin-wait loop的性能。

3.2.2 PAUSE指令周期的演变

我们可以看下Intel官网,也描述了在新平台架构PAUSE的改动:

Pause Latency in Skylake Microarchitecture

The PAUSE instruction is typically used with software threads executing on two logical processors located in the same processor core, waiting for a lock to be released. Such short wait loops tend to last between tens and a few hundreds of cycles, so performance-wise it is better to wait while occupying the CPU than yielding to the OS. When the wait loop is expected to last for thousands of cycles or more, it is preferable to yield to the operating system by calling an OS synchronization API function, such as WaitForSingleObject on Windows* OS or futex on Linux.

The latency of the PAUSE instruction in prior generation microarchitectures is about 10 cycles, whereas in Skylake microarchitecture it has been extended to as many as 140 cycles.

The increased latency (allowing more effective utilization of competitively-shared microarchitectural resources to the logical processor ready to make forward progress) has a small positive performance impact of 1-2% on highly threaded applications. It is expected to have negligible impact on less threaded applications if forward progress is not blocked executing a fixed number of looped PAUSE instructions. There’s also a small power benefit in 2-core and 4-core systems.

As the PAUSE latency has been increased significantly, workloads that are sensitive to PAUSE latency will suffer some performance loss.

  • 上一代架构中(Grantly平台E系列)PAUSE的周期时长为10 cycles,新一代的Skylake架构中则为140 cycles。
  • 如果程序中使用固定次数的PAUSE循环来实现一段时间的延迟,以此阻塞程序执行,可能引发非预期的延迟。
  • 由于PAUSE周期增加,对于PAUSE敏感的应用会有一定的性能损失。

衡量程序执行性能的简化公式:

ExecutionTime(T)=InstructionCount∗TimePerCycle∗CPI

即:程序执行时间 = 程序总指令数 x 每CPU时钟周期时间 x 每指令执行所需平均时钟周期数。

MySQL内部自旋,就是通过固定次数的PAUSE循环实现。可知,PAUSE指令周期的增加,那么执行自旋的时间也会增加,即程序执行的时间也会相对增加,对系统整体的吞吐量就会有影响。

显然,Intel文档已说明不同平台、不同架构CPU PAUSE定义的周期是不一样的。

下面,我们通过一个测试用例来大致验证、对比一下新老架构CPU执行PAUSE的cycles:

 #include <stdio.h>
#define TIMES 5
​
static inline unsigned long long rdtsc(void)
{unsigned long low, high;asm volatile("rdtsc" : "=a" (low), "=d" (high) );return ((low) | (high) << 32);
}
​
void pause_test()
{int i = 0;for (i = 0; i < TIMES; i++) {asm("pause\n"\"pause\n"\"pause\n"\"pause\n"\"pause\n"\"pause\n"\"pause\n"\"pause\n"\"pause\n"\"pause\n"\"pause\n"\"pause\n"\"pause\n"\"pause\n"\"pause\n"\"pause\n"\"pause\n"\"pause\n"\"pause\n"\"pause\n":::);}
}
​
unsigned long pause_cycle()
{unsigned long start, finish, elapsed;start = rdtsc();pause_test();finish = rdtsc();elapsed = finish - start;printf("Pause的cycles约为:%ld\n", elapsed / 100);return 0;
}
​
int main()
{pause_cycle();return 0;
}

其运行结果统计如下:

  • 4110和5118 PAUSE周期较大,均为100多,它们属于Purley第一代架构:Skylake。
  • 4210和5218 PAUSE相比前一代有提升,是因为它们同属Purley第二代架构:Cascadelake,该代CPU PAUSE指令有优化。

3.2.3 Intel 提升PAUSE猜想

Intel提高PAUSE指令周期的原因,推测可能是减少自旋锁冲突的概率,以及降低功耗;但反而导致PAUSE执行时间变长,降低了整体的吞吐量。

The increased latency (allowing more effective utilization of competitively-shared microarchitectural resources to the logical processor read to make forward progress) has a small positive performance impact of 1-2% on highly threaded applications. It is expected to have negligible impact on less threaded applications if forward progress is not blocked executing a fixed number of looped PAUSE instructions.

3.3 PAUSE导致写瓶颈分析

接下来,我们深入分析一下PAUSE指令导致MySQL写瓶颈的原因。

首先,通过MySQL 内部统计信息,查看一下InnoDB信号量监控数据:

SEMAPHORES
----------
OS WAIT ARRAY INFO: reservation count 153720
--Thread 139868617205504 has waited at row0row.cc line 1075 for 0.00 seconds the semaphore:
X-lock on RW-latch at 0x7f4298084250 created in file buf0buf.cc line 1425
a writer (thread id 139869284108032) has reserved it in mode  SX
number of readers 0, waiters flag 1, lock_word: 10000000
Last time read locked in file not yet reserved line 0
Last time write locked in file /mnt/workspace/percona-server-5.7-redhat-binary-rocks-new/label_exp/min-centos-7-x64/test/rpmbuild/BUILD/percona-server-5.7.26-29/percona-server-5.7.26-29/storage/innobase/buf/buf0flu.cc line 1216
OS WAIT ARRAY INFO: signal count 441329
RW-shared spins 0, rounds 1498677, OS waits 111991
RW-excl spins 0, rounds 717200, OS waits 9012
RW-sx spins 47596, rounds 366136, OS waits 4100
Spin rounds per wait: 1498677.00 RW-shared, 717200.00 RW-excl, 7.69 RW-sx

可见写操作并阻塞在:storage/innobase/buf/buf0flu.cc第1216行调用上。

跟踪一下发生等待的源码:buf0flu.cc line 1216:

    if (flush_type == BUF_FLUSH_LIST&& is_uncompressed&& !rw_lock_sx_lock_nowait(rw_lock, BUF_IO_WRITE)) {    // 加锁前,判断锁冲突if (!fsp_is_system_temporary(bpage->id.space())) {/* avoiding deadlock possibility involvesdoublewrite buffer, should flush it, becauseit might hold the another block->lock. */buf_dblwr_flush_buffered_writes(buf_parallel_dblwr_partition(bpage,flush_type));} else {buf_dblwr_sync_datafiles();}rw_lock_sx_lock_gen(rw_lock, BUF_IO_WRITE);        //  加sx锁}
... #define rw_lock_sx_lock_nowait(M, P)       \rw_lock_sx_lock_low((M), (P), __FILE__, __LINE__)
...
​
rw_lock_sx_lock_func(                                       // 加sx锁函数            
/*=================*/rw_lock_t*  lock, /*!< in: pointer to rw-lock */ulint   pass, /*!< in: pass value; != 0, if the lock willbe passed to another thread to unlock */const char* file_name,/*!< in: file name where lock requested */ulint   line) /*!< in: line where requested */
​
{ulint   i = 0;sync_array_t* sync_arr;ulint   spin_count = 0;uint64_t  count_os_wait = 0;ulint   spin_wait_count = 0;
​ut_ad(rw_lock_validate(lock));ut_ad(!rw_lock_own(lock, RW_LOCK_S));
​
lock_loop:
​if (rw_lock_sx_lock_low(lock, pass, file_name, line)) {
​if (count_os_wait > 0) {lock->count_os_wait +=static_cast<uint32_t>(count_os_wait);rw_lock_stats.rw_sx_os_wait_count.add(count_os_wait);}
​rw_lock_stats.rw_sx_spin_round_count.add(spin_count);rw_lock_stats.rw_sx_spin_wait_count.add(spin_wait_count);
​/* Locking succeeded */return;
​} else {
​++spin_wait_count;
​/* Spin waiting for the lock_word to become free */os_rmb;while (i < srv_n_spin_wait_rounds&& lock->lock_word <= X_LOCK_HALF_DECR) {
​if (srv_spin_wait_delay) {ut_delay(ut_rnd_interval(0, srv_spin_wait_delay));                         // 加锁失败,调用ut_delay}
​i++;}                             
​spin_count += i;
​if (i >= srv_n_spin_wait_rounds) {
​os_thread_yield();
​} else {
​goto lock_loop;}
...
ulong srv_n_spin_wait_rounds  = 30;
ulong srv_spin_wait_delay = 6;

上述源码可知,MySQL锁等待是通过调用ut_delay做空循环实现的。

InnoDB层有三种锁:S(共享锁)、X(排他锁)和SX(共享排他锁)。 SX与SX、X是互斥锁。加SX不会影响读,只会阻塞写。所以在大量写入操作时,会造成大量的锁等待,即大量的PAUSE指令。

分析到这里,我们总结一下影响吞吐量的两个因素:

  • 自旋的时长,在MySQL5.7以及之前版本的源码定位为:spin_wait_delay * 50。
  • Intel CPU PAUSE的指令周期。

接下来,我们就从这两方面入手,评估优化空间以及效果。

4. 针对PAUSE指令和spin参数优化与探索

4.1 MySQL spin参数优化

4.1.1 MySQL 5.7 spin参数优化

我们可以基于现有MySQL版本、硬件等方面,来寻找优化点。

MySQL针对spin控制这块有个参数可以调整,根据参数特点进行相关优化:

innodb_spin_wait_delay

innodb_spin_wait_delay的单位,是100MHZ的奔腾处理器处理1毫秒的时间,默认innodb_spin_wait_delay配置成6,表示最多在100MHZ的奔腾处理器上自旋6毫秒。

innodb_sync_spin_loops

当 innodb 线程获取 mutex 资源而得不到满足时,会最多进行 innodb_sync_spin_loops次尝试获取mutex资源。

其中innodb_spin_wait_delay参数对PAUSE运行时长是有影响的。针对此参数,我们进行调优测试。

同样,针对上述参数优化,我们通过基准测试来对比性能和效果:

可以总结为:

  • innodb_spin_wait_delay的调整对TPS、QPS 一定影响,其值趋于小,则MySQL性能有提升。反之,下降。
  • innodb_spin_wait_delay参数调整性能优化效果有限,性能提升的幅度还是无法满足线上业务需求。

4.2 MySQL8.0 spin新特性移植

4.2.1 spin_wait_pause_multiplier移植

针对Skylake CPU,PAUSE造成的吞吐量下降,我们对MySQL 5.7 spin控制参数innodb_spin_wait_delay的调优并未取得明显效果。

于是,我们将目光投向了MySQL 8.0的新特性:MySQL 8.0 针对PAUSE,源码中新增了spin_wait_pause_multiplier参数,来替换之前写死的循环次数。

4.2.2 spin_wait_pause_multiplier实现

MySQL 8.0源码中,之前循环50次的逻辑修改成了可以调整循环次数的参数:spin_wait_pause_multiplier。

ulint ut_delay(ulint delay) {ulint i, j;/* We don't expect overflow here, as ut::spin_wait_pause_multiplier is limitedto 100, and values of delay are not larger than @@innodb_spin_wait_delaywhich is limited by 1 000. Anyway, in case an overflow happened, the programwould still work (as iterations is unsigned). */const ulint iterations = delay * ut::spin_wait_pause_multiplier;UT_LOW_PRIORITY_CPU();
​j = 0;
​for (i = 0; i < iterations; i++) {j += i;UT_RELAX_CPU();}
​UT_RESUME_PRIORITY_CPU();
​return (j);
}
...
namespace ut {
ulong spin_wait_pause_multiplier = 50;
}

4.2.3 移植spin_wait_pause_multiplier patch优化

既然MySQL 8.0参数spin_wait_pause_multiplier可以控制PAUSE执行的时长,那么就可以减少该值,从而降低整体PAUSE影响。

了解MySQL 8.0相关代码后,我们将该patch移植到线上的稳定版本:

MySQ >select version();
+------------------+
| version()        |
+------------------+
| 5.7.26-29-mt-log |
+------------------+
1 row in set (0.00 sec)
​
MySQL>show global variables like '%spin%';  
+-----------------------------------+-------+
| Variable_name                     | Value |
+-----------------------------------+-------+
| innodb_spin_wait_delay            | 6     |
| innodb_spin_wait_pause_multiplier | 5     |
| innodb_sync_spin_loops            | 30    |
+-----------------------------------+-------+
3 rows in set (0.00 sec)

由上述可知,Silver 4110的PAUSE cycles是E5-2620 v4的14倍左右。基于此,将innodb_spin_wait_pause_multiplier值调整为默认值的1/14,取稍大值:5。即将该参数由原默认的50调整为5。

最后,还是通过二维折线图来对比该patch调优后的基准测试数据:

  • Silver 4110移植spin_wait_pause_multiplier patch,并调整优化后,4110(patch)性能有了较大的提升。
  • Silver 4110(patch) 相对调优innodb_spin_wait_delay性能上更优。
  • Silver 4110(patch)并发线程大于64的只写场景,性能略低于E5-2620 V4 ,其他均优。
  • 按照真实的线上读写比例,4110(patch)可以将吞吐量恢复到原先的性能水平。

4.3 PAUSE指令周期优化

上述章节中,我们测出Cascadelake CPU PAUSE周期下降了。在跟Intel技术专家确认后得知:从Purley的第二代产品Cascadelake开始,Intel将PAUSE的指令周期降低到了44。(估计Intel也发现了第一代增加PAUSE周期后的性能瓶颈问题。)

我们针对第二代CPU产品继续做基准测试,来看一下性能表现:

接着用perf diff来对比一下4110和4210在ut_delay上的开销:

  • 可以看到4210比4110占比下降了8%。
  • 由于PAUSE指令周期还是数倍于E5系列CPU,4210在高负载下,PAUSE的开销对MySQL吞吐量还是有较大的影响。而在128并发线程以下,性能相比4110有了较大的提升。按理,可以满足线上业务需求(该测试结果跟移植spin_wait_pause_multiplier patch性能测试数据曲线一致)。

5. 总结

最后针对本篇内容,我们可以做个简单的总结:

Intel在新平台CPU产品调大了PAUSE指令周期,在高并发spinlock竞争激烈场景下,可能会造成程序性能较大损耗(特别是执行固定PAUSE次数的程序)。 针对Skylake架构CPU(比如:4110等)PAUSE指令周期较长引起性能问题的优化方法如下:

将MySQL 8.0 innodb_spin_wait_pause_multiplier patch移植到线上稳定版本(或升级到MySQL 8.0),通过降低PAUSE执行时长,来提升吞吐量。 如果是OS为CentOS 6,可以升级到CentOS 7,CentOS 7本身spinlock优化,对MySQL性能也有一定提升。 最简单、直接的方法可以替换为Cascadelake架构CPU。

针对Cascadelake架构CPU,由于Intel本身在PAUSE周期已经优化,性能上已经做了修复。当然也可以采用上述优化方案,让性能提升一个台阶。

6. 作者简介

春林,2017年加入美团,主要负责MySQL运维开发和优化工作。

招聘信息

美团DBA团队招聘各类人才,Base北京、上海均可。我们致力于为公司提供稳定、可靠、高效的在线存储服务,打造业界领先的数据库团队。这里有数万各类架构的MySQL实例,每天提供万亿级的OLTP访问请求。真正的海量、分布式、高并发环境。欢迎感兴趣的同学发送简历至:tech@meituan.com(邮件标题注明:美团DBA团队)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479608.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

会议 | CCKS 2019 全国知识图谱与语义计算大会在杭州隆重召开

本文转载自公众号&#xff1a;中国中文信息学会。2019 年全国知识图谱与语义计算大会(CCKS 2019)于 8 月 24 日至 27 日在杭州召开&#xff0c;由中国中文信息学会语言与知识计算专业委员会主办&#xff0c;浙江大学承办。本次会议主题是“知识智能”。大会吸引了来自海内外的八…

Hystrix 简介和使用

Hystrix一、概念二、使用1. 环境搭建2. 服务降级3. 异常熔断4. 自定义异常熔断器5.Hystrix仪表盘监控三、测试1. 异常熔断2. 超时熔断3. 熔断器获得异常4. 异常忽略5. 自定义异常熔断器一、概念 故障蔓延&#xff1a;由于一个服务变慢或没有响应导致大量请求堆积&#xff0c;进…

android中如何使用一张图片适配不同尺寸的APP引导页

在我们平常开发的过程中在做引导页适配的时候&#xff0c;有时候会犯难&#xff0c;怎么样作图可以将各种不同尺寸分辨率的手机都适配好也就是不变形不拉伸&#xff0c;官方给的说法也只是做多套图去适配不同的分辨率&#xff0c;遇到全屏展示引导这种问题的时候就有些力不从心…

还在用Tensorboard?机器学习实验管理平台大盘点

文 | SisyphusBJ源 | Pytorch Lightningwandb.aicomet.mlneptune.aiallegro trainsmlflowguild.aisacredtest-tubetensorboard相信很多同学看到上面这个列表的第一印象是懵的。我们先看下机器学习实验管理平台 到底是做神马滴&#xff1a;一句话概括就是&#xff1a;&#xff0…

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

论文笔记整理&#xff1a;谭亦鸣&#xff0c;东南大学博士生&#xff0c;研究方向为跨语言知识图谱问答。来源&#xff1a;NAACL2019链接&#xff1a;https://arxiv.org/pdf/1904.02342.pdf本文关注如何从信息抽取结果&#xff08;特别是知识图谱&#xff09;出发&#xff0c;生…

LeetCode 230. 二叉搜索树中第K小的元素(中序遍历)

文章目录1. 题目信息2. 解题2.1 中序递归2.2 中序循环写法1. 题目信息 给定一个二叉搜索树&#xff0c;编写一个函数 kthSmallest 来查找其中第 k 个最小的元素。 说明&#xff1a; 你可以假设 k 总是有效的&#xff0c;1 ≤ k ≤ 二叉搜索树元素个数。 示例 1:输入: root …

Apache Doris在美团外卖数仓中的应用实践

序言 美团外卖数据仓库技术团队负责支撑日常业务运营及分析师的日常分析&#xff0c;由于外卖业务特点带来的数据生产成本较高和查询效率偏低的问题&#xff0c;他们通过引入Apache Doris引擎优化生产方案&#xff0c;实现了低成本生产与高效查询的平衡。并以此分析不同业务场景…

Feign 简介和使用

声明式服务消费Feign一、简介二、使用Feign实现服务消费者三、实现普通的服务提供者四、Feign服务调用测试五、Feign消费者测试负载均衡服务熔断一、简介 Feign是Netflix公司开发的一个声明式的REST调用客户端&#xff1b; Ribbon负载均衡、Hystrix服务熔断是我们Spring Cloud…

论文浅尝 | 面向自动问题生成的跨语言训练

论文笔记整理&#xff1a;谭亦鸣&#xff0c;东南大学博士生&#xff0c;研究方向为跨语言知识图谱问答。来源&#xff1a;ACL 2019链接&#xff1a;https://128.84.21.199/pdf/1906.02525.pdf动机现有问题生成方法需要大量的“文本-问题”有标注数据对作为训练数据集&#xff…

再见,Spark!Flink已成气候!

身为大数据工程师&#xff0c;你还在苦学Spark、Hadoop、Storm&#xff0c;却还没搞过Flink&#xff1f;醒醒吧&#xff01;刚过去的2020双11&#xff0c;阿里在Flink实时计算技术的驱动下全程保持了“如丝般顺滑”&#xff0c;基于Flink的阿里巴巴实时计算平台简直强无敌。最恐…

Java线程池实现原理及其在美团业务中的实践

随着计算机行业的飞速发展&#xff0c;摩尔定律逐渐失效&#xff0c;多核CPU成为主流。使用多线程并行计算逐渐成为开发人员提升服务器性能的基本武器。J.U.C提供的线程池&#xff1a;ThreadPoolExecutor类&#xff0c;帮助开发人员管理线程并方便地执行并行任务。了解并合理使…

Zuul 简介和使用

Zuul背景Zuul的作用Zuul API网关Zuul请求过滤Zuul路由规则Zuul异常处理背景 通过之前的学习&#xff0c;我们知道注册中心Eureka&#xff0c;可以讲服务注册到该注册中心&#xff0c;Ribbon和Feign可以实现服务负载均衡地调用&#xff0c;Hystrix可以实现服务熔断&#xff0c;…

技术动态 | 知识图谱上的实体链接

本文转载自公众号&#xff1a;知识工场 1、什么是实体链接实体链接&#xff08;entity linking&#xff09;就是将一段文本中的某些字符串映射到知识库中对应的实体上。比如对于文本“郑雯出任复旦大学新闻学院副院长”&#xff0c;就应当将字符串“郑雯”、“复旦大学…

卖萌屋学术站开放注册啦!寻募种子用户,超多特权放出!

文&#xff1a;夕小瑶消失一个多月的小夕又突然出现啦&#xff01;要问小夕最近业余时间在做什么&#xff0c;那就是跟小伙伴们开发学术站啦~&#xff08;等...等再肝一版&#xff0c;小夕就继续给大家写文章(&#xff61; ́︿ ̀&#xff61;)众所周知&#xff0c;卖萌屋学术…

LeetCode 11. 盛最多水的容器(双指针)

文章目录1. 题目信息2. 解题1. 题目信息 给定 n 个非负整数 a1&#xff0c;a2&#xff0c;…&#xff0c;an&#xff0c;每个数代表坐标中的一个点 (i, ai) 。 在坐标内画 n 条垂直线&#xff0c;垂直线 i 的两个端点分别为 (i, ai) 和 (i, 0)。 找出其中的两条线&#xff0c;…

WSDM Cup 2020检索排序评测任务第一名经验总结

1.背景 第13届“国际网络搜索与数据挖掘会议”(WSDM 2020)于2月3日在美国休斯敦召开&#xff0c;该会议由SIGIR、SIGKDD、SIGMOD和SIGWEB四个专委会共同协调筹办&#xff0c;在互联网搜索、数据挖掘领域享有很高学术声誉。本届会议论文录用率仅约15%&#xff0c;并且WSDM历来注…

ltp︱基于ltp的无监督信息抽取模块

ltp︱基于ltp的无监督信息抽取模块&#xff1a;https://zhuanlan.zhihu.com/p/44890664 &#xfeff;无监督信息抽取较多都是使用哈工大的ltp作为底层框架。那么基于ltp其实有了非常多的小伙伴进行了尝试&#xff0c;笔者私自将其归纳为&#xff1a;事件抽取&#xff08;三元组…

Eureka 简介和使用

Eureka 服务注册与发现服务注册与发现Eureka与Zookeeper的比较ZooKeeper保证CPEureka保证APEureka是什么&#xff1f;Eureka原理SpringBoot、Spring Cloud 和 Eureka 版本选择Eureka单机搭建搭建Eureka服务端搭建Eureka客户端的服务提供者搭建Eureka客户端的服务消费者Eureka集…

论文浅尝 | XQA:一个跨语言开放域问答数据集

论文笔记整理&#xff1a;刘晓臻&#xff0c;东南大学计算机科学与工程学院本科生。Citation: Liu, J., Lin, Y., Liu, Z., & Sun, M. (2019,July). XQA: A Cross-lingual Open-domain Question Answering Dataset. InProceedings of the 57th Conference of the Associati…

深度CTR预估模型中的特征自动组合机制演化简史

文 | 杨旭东源 | 知乎众所周知&#xff0c;深度学习在计算机视觉、语音识别、自然语言处理等领域最先取得突破并成为主流方法。但是&#xff0c;深度学习为什么是在这些领域而不是其他领域最先成功呢&#xff1f;我想一个原因就是图像、语音、文本数据在空间和时间上具有一定的…