海量数据处理面试题集锦

十七道海量数据处理面试题与Bit-map具体解释

作者:小桥流水,redfox66,July。


前言

    本博客内以前整理过有关海量数据处理的10道面试题(十道海量数据处理面试题与十个方法大总结),此次除了反复了之前的10道面试题之后,又一次多整理了7道。仅作各位參考,不作它用。

    同一时候,程序猿编程艺术系列将又一次開始创作,第十一章以后的部分题目来源将取自下文中的17道海量数据处理的面试题。由于,我们觉得,下文的每一道面试题都值得又一次思考,又一次深究与学习。再者,编程艺术系列的前十章也是这么来的。若您有不论什么问题或建议,欢迎不吝指正。谢谢。

第一部分、十五道海量数据处理面试题

1. 给定a、b两个文件,各存放50亿个url,每一个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?

    方案1:能够预计每一个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其全然载入到内存中处理。考虑採取分而治之的方法。

  1. 遍历文件a,对每一个url求取,然后依据所取得的值将url分别存储到1000个小文件(记为,这里漏写个了a1)中。这样每一个小文件的大约为300M。
  2. 遍历文件b,採取和a同样的方式将url分别存储到1000小文件里(记为)。这样处理后,全部可能同样的url都在相应的小文件()中,不正确应的小文件不可能有同样的url。然后我们仅仅要求出1000对小文件里同样的url就可以。
  3. 求每对小文件里同样的url时,能够把当中一个小文件的url存储到hash_set中。然后遍历还有一个小文件的每一个url,看其是否在刚才构建的hash_set中,假设是,那么就是共同的url,存到文件里面就能够了。

    方案2:假设同意有一定的错误率,能够使用Bloom filter,4G内存大概能够表示340亿bit。将当中一个文件里的url使用Bloom filter映射为这340亿bit,然后挨个读取另外一个文件的url,检查是否与Bloom filter,假设是,那么该url应该是共同的url(注意会有一定的错误率)。

    读者反馈@crowgns:

  1. hash后要推断每一个文件大小,假设hash分的不均衡有文件较大,还应继续hash分文件,换个hash算法第二次再分较大的文件,一直分到没有较大的文件为止。这样文件标号能够用A1-2表示(第一次hash编号为1,文件较大所以參加第二次hash,编号为2)
  2. 由于1存在,第一次hash假设有大文件,不能用直接set的方法。建议对每一个文件都先用字符串自然顺序排序,然后具有同样hash编号的(如都是1-3,而不能a编号是1,b编号是1-1和1-2),能够直接从头到尾比較一遍。对于层级不一致的,如a1,b有1-1,1-2-1,1-2-2,层级浅的要和层级深的每一个文件都比較一次,才干确认每一个同样的uri。

2. 有10个文件,每一个文件1G,每一个文件的每一行存放的都是用户的query,每一个文件的query都可能反复。要求你依照query的频度排序。

方案1:

  1. 顺序读取10个文件,依照hash(query)%10的结果将query写入到另外10个文件(记为)中。这样新生成的文件每一个的大小大约也1G(假设hash函数是随机的)。
  2. 找一台内存在2G左右的机器,依次对用hash_map(query, query_count)来统计每一个query出现的次数。利用高速/堆/归并排序依照出现次数进行排序。将排序好的query和相应的query_cout输出到文件里。这样得到了10个排好序的文件(,此处有误,更正为b0,b1,b2,b9)。
  3. 这10个文件进行归并排序(内排序与外排序相结合)。

方案2:

    一般query的总量是有限的,仅仅是反复的次数比較多而已,可能对于全部的query,一次性就能够增加到内存了。这样,我们就能够採用trie树/hash_map等直接来统计每一个query出现的次数,然后按出现次数做高速/堆/归并排序就能够了

    (读者反馈@店小二:原文第二个样例中:“找一台内存在2G左右的机器,依次对用hash_map(query, query_count)来统计每一个query出现的次数。”由于query会反复,作为key的话,应该使用hash_multimap 。hash_map 不同意key反复。@hywangw:店小二所述的肯定是错的,hash_map(query,query_count)是用来统计每一个query的出现次数 又不是存储他们的值 出现一次 把count+1 就可以了 用multimap干什么?多谢hywangw)。

方案3:

    与方案1相似,但在做完hash,分成多个文件后,能够交给多个文件来处理,採用分布式的架构来处理(比方MapReduce),最后再进行合并。

3. 有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16字节,内存大小限制是1M。返回频数最高的100个词。

    方案1:顺序读文件里,对于每一个词x,取,然后依照该值存到5000个小文件(记为)中。这样每一个文件大概是200k左右。假设当中的有的文件超过了1M大小,还能够依照相似的方法继续往下分,直到分解得到的小文件的大小都不超过1M。对每一个小文件,统计每一个文件里出现的词以及相应的频率(能够採用trie树/hash_map等),并取出出现频率最大的100个词(能够用含100个结点的最小堆),并把100词及相应的频率存入文件,这样又得到了5000个文件。下一步就是把这5000个文件进行归并(相似与归并排序)的过程了。

4. 海量日志数据,提取出某日訪问百度次数最多的那个IP。

    方案1:首先是这一天,而且是訪问百度的日志中的IP取出来,逐个写入到一个大文件里。注意到IP是32位的,最多有2^32个IP。同样能够採用映射的方法,比方模1000,把整个大文件映射为1000个小文件,再找出每一个小文中出现频率最大的IP(能够採用hash_map进行频率统计,然后再找出频率最大的几个)及相应的频率。然后再在这1000个最大的IP中,找出那个频率最大的IP,即为所求。

5. 在2.5亿个整数中找出不反复的整数,内存不足以容纳这2.5亿个整数。

    方案1:採用2-Bitmap(每一个数分配2bit,00表示不存在,01表示出现一次,10表示多次,11无意义)进行,共需内存2^32*2bit=1GB内存,还能够接受。然后扫描这2.5亿个整数,查看Bitmap中相相应位,假设是00变01,01变10,10保持不变。所描完事后,查看bitmap,把相应位是01的整数输出就可以。

    方案2:也可採用上题相似的方法,进行划分小文件的方法。然后在小文件里找出不反复的整数,并排序。然后再进行归并,注意去除反复的元素。

6. 海量数据分布在100台电脑中,想个办法高效统计出这批数据的TOP10。

方案1:

  1. 在每台电脑上求出TOP10,能够採用包括10个元素的堆完毕(TOP10小,用最大堆,TOP10大,用最小堆)。比方求TOP10大,我们首先取前10个元素调整成最小堆,假设发现,然后扫描后面的数据,并与堆顶元素比較,假设比堆顶元素大,那么用该元素替换堆顶,然后再调整为最小堆。最后堆中的元素就是TOP10大。
  2. 求出每台电脑上的TOP10后,然后把这100台电脑上的TOP10组合起来,共1000个数据,再利用上面相似的方法求出TOP10就能够了。

(很多其它能够參考:第三章、寻找最小的k个数,以及第三章续、Top K算法问题的实现)

    读者反馈@QinLeopard

第6题的方法中,是不是不能保证每一个电脑上的前十条,肯定包括最后频率最高的前十条呢?
比方说第一个文件里:A(4), B(5), C(6), D(3)
第二个文件里:A(4),B(5),C(3),D(6)
第三个文件里: A(6), B(5), C(4), D(3)
假设要选Top(1), 选出来的结果是A,但结果应该是B。

    @July:我想,这位读者可能没有明白提议。本题目中的TOP10是指最大的10个数,而不是指出现频率最多的10个数。但假设说,如今有另外一提,要你求频率最多的 10个,相当于求訪问次数最多的10个IP地址那道题,即是本文中上面的第4题。特此说明。

7. 怎么在海量数据中找出反复次数最多的一个?

    方案1:先做hash,然后求模映射为小文件,求出每一个小文件里反复次数最多的一个,并记录反复次数。然后找出上一步求出的数据中反复次数最多的一个就是所求(具体參考前面的题)。

8. 上千万或上亿数据(有反复),统计当中出现次数最多的钱N个数据。

    方案1:上千万或上亿的数据,如今的机器的内存应该能存下。所以考虑採用hash_map/搜索二叉树/红黑树等来进行统计次数。然后就是取出前N个出现次数最多的数据了,能够用第6题提到的堆机制完毕。

9. 1000万字符串,当中有些是反复的,须要把反复的全部去掉,保留没有反复的字符串。请怎么设计和实现?

    方案1:这题用trie树比較合适,hash_map也应该能行。

10. 一个文本文件,大约有一万行,每行一个词,要求统计出当中最频繁出现的前10个词,请给出思想,给出时间复杂度分析。

    方案1:这题是考虑时间效率。用trie树统计每一个词出现的次数,时间复杂度是O(n*le)(le表示单词的平准长度)。然后是找出出现最频繁的前10个词,能够用堆来实现,前面的题中已经讲到了,时间复杂度是O(n*lg10)。所以总的时间复杂度,是O(n*le)与O(n*lg10)中较大的哪一个。

11. 一个文本文件,找出前10个常常出现的词,但这次文件比較长,说是上亿行或十亿行,总之无法一次读入内存,问最优解。

    方案1:首先依据用hash并求模,将文件分解为多个小文件,对于单个文件利用上题的方法求出每一个文件件中10个最常出现的词。然后再进行归并处理,找出终于的10个最常出现的词。

12. 100w个数中找出最大的100个数。

  •     方案1:採用局部淘汰法。选取前100个元素,并排序,记为序列L。然后一次扫描剩余的元素x,与排好序的100个元素中最小的元素比,假设比这个最小的要大,那么把这个最小的元素删除,并把x利用插入排序的思想,插入到序列L中。依次循环,知道扫描了全部的元素。复杂度为O(100w*100)。
  •     方案2:採用高速排序的思想,每次切割之后仅仅考虑比轴大的一部分,知道比轴大的一部分在比100多的时候,採用传统排序算法排序,取前100个。复杂度为O(100w*100)。
  •     方案3:在前面的题中,我们已经提到了,用一个含100个元素的最小堆完毕。复杂度为O(100w*lg100)。

13. 寻找热门查询:

搜索引擎会通过日志文件把用户每次检索使用的全部检索串都记录下来,每一个查询串的长度为1-255字节。假设眼下有一千万个记录,这些查询串的反复读比較高,尽管总数是1千万,可是假设去除反复和,不超过3百万个。一个查询串的反复度越高,说明查询它的用户越多,也就越热门。请你统计最热门的10个查询串,要求使用的内存不能超过1G。

(1) 请描写叙述你解决问题的思路;

(2) 请给出基本的处理流程,算法,以及算法的复杂度。

    方案1:採用trie树,keyword域存该查询串出现的次数,没有出现为0。最后用10个元素的最小推来对出现频率进行排序。

    关于此问题的具体解答,请參考此文的第3.1节:第三章续、Top K算法问题的实现

14. 一共同拥有N个机器,每一个机器上有N个数。每一个机器最多存O(N)个数并对它们操作。怎样找到N^2个数中的中数?

    方案1:先大体预计一下这些数的范围,比方这里假设这些数都是32位无符号整数(共同拥有2^32个)。我们把0到2^32-1的整数划分为N个范围段,每一个段包括(2^32)/N个整数。比方,第一个段位0到2^32/N-1,第二段为(2^32)/N到(2^32)/N-1,…,第N个段为(2^32)(N-1)/N到2^32-1。然后,扫描每一个机器上的N个数,把属于第一个区段的数放到第一个机器上,属于第二个区段的数放到第二个机器上,…,属于第N个区段的数放到第N个机器上。注意这个过程每一个机器上存储的数应该是O(N)的。以下我们依次统计每一个机器上数的个数,一次累加,直到找到第k个机器,在该机器上累加的数大于或等于(N^2)/2,而在第k-1个机器上的累加数小于(N^2)/2,并把这个数记为x。那么我们要找的中位数在第k个机器中,排在第(N^2)/2-x位。然后我们对第k个机器的数排序,并找出第(N^2)/2-x个数,即为所求的中位数的复杂度是O(N^2)的。

    方案2:先对每台机器上的数进行排序。排好序后,我们採用归并排序的思想,将这N个机器上的数归并起来得到终于的排序。找到第(N^2)/2个便是所求。复杂度是O(N^2*lgN^2)的。

15. 最大间隙问题

给定n个实数,求着n个实数在实轴上向量2个数之间的最大差值,要求线性的时间算法。

方案1:最先想到的方法就是先对这n个数据进行排序,然后一遍扫描就可以确定相邻的最大间隙。但该方法不能满足线性时间的要求。故採取例如以下方法:

  1. 找到n个数据中最大和最小数据max和min。
  2. 用n-2个点等分区间[min, max],即将[min, max]等分为n-1个区间(前闭后开区间),将这些区间看作桶,编号为,且桶i 的上界和桶i+1的下届同样,即每一个桶的大小同样。每一个桶的大小为:。实际上,这些桶的边界构成了一个等差数列(首项为min,公差为),且觉得将min放入第一个桶,将max放入第n-1个桶。
  3. 将n个数放入n-1个桶中:将每一个元素x[i] 分配到某个桶(编号为index),当中(这括号中多了个“+”),并求出分到每一个桶的最大最小数据。
  4. 最大间隙:除最大最小数据max和min以外的n-2个数据放入n-1个桶中,由抽屉原理可知至少有一个桶是空的,又由于每一个桶的大小同样,所以最大间隙不会在同一桶中出现,一定是某个桶的上界和气候某个桶的下界之间隙,且该量筒之间的桶(即便好在该连个便好之间的桶)一定是空桶。也就是说,最大间隙在桶i的上界和桶j的下界之间产生j>=i+1。一遍扫描就可以完毕。

16. 将多个集合合并成没有交集的集合

    给定一个字符串的集合,格式如:。要求将当中交集不为空的集合合并,要求合并完毕的集合之间无交集,比如上例应输出

(1) 请描写叙述你解决问题的思路;

(2) 给出基本的处理流程,算法,以及算法的复杂度;

(3) 请描写叙述可能的改进。

    方案1:採用并查集。首先全部的字符串都在单独的并查集中。然后依扫描每一个集合,顺序合并将两个相邻元素合并。比如,对于,首先查看aaa和bbb是否在同一个并查集中,假设不在,那么把它们所在的并查集合并,然后再看bbb和ccc是否在同一个并查集中,假设不在,那么也把它们所在的并查集合并。接下来再扫描其它的集合,当全部的集合都扫描完了,并查集代表的集合便是所求。复杂度应该是O(NlgN)的。改进的话,首先能够记录每一个节点的根结点,改进查询。合并的时候,能够把大的和小的进行合,这样也降低复杂度。

17. 最大子序列与最大子矩阵问题

数组的最大子序列问题:给定一个数组,当中元素有正,也有负,找出当中一个连续子序列,使和最大。

    方案1:这个问题能够动态规划的思想解决。设b[i]表示以第i个元素a[i]结尾的最大子序列,那么显然。基于这一点能够非常快用代码实现。

最大子矩阵问题:给定一个矩阵(二维数组),当中数据有大有小,请找一个子矩阵,使得子矩阵的和最大,并输出这个和。

    方案2:能够採用与最大子序列相似的思想来解决。假设我们确定了选择第i列和第j列之间的元素,那么在这个范围内,事实上就是一个最大子序列问题。怎样确定第i列和第j列能够词用暴搜的方法进行。

 

第二部分、海量数据处理之Bti-map具体解释

    Bloom Filter已在上一篇文章海量数据处理之Bloom Filter具体解释中予以具体阐述,本文接下来着重阐述Bit-map。有不论什么问题,欢迎不吝指正。

什么是Bit-map

    所谓的Bit-map就是用一个bit位来标记某个元素相应的Value, 而Key即是该元素。由于採用了Bit为单位来存储数据,因此在存储空间方面,能够大大节省。

    假设说了这么多还没明白什么是Bit-map,那么我们来看一个具体的样例,假设我们要对0-7内的5个元素(4,7,2,5,3)排序(这里假设这些元素没有反复)。那么我们就能够採用Bit-map的方法来达到排序的目的。要表示8个数,我们就仅仅须要8个Bit(1Bytes),首先我们开辟1Byte的空间,将这些空间的全部Bit位都置为0(例如以下图:)

    然后遍历这5个元素,首先第一个元素是4,那么就把4相应的位置为1(能够这样操作 p+(i/8)|(0×01<<(i%8)) 当然了这里的操作涉及到Big-ending和Little-ending的情况,这里默觉得Big-ending),由于是从零開始的,所以要把第五位置为一(例如以下图):

     

然后再处理第二个元素7,将第八位置为1,,接着再处理第三个元素,一直到最后处理全然部的元素,将相应的位置为1,这时候的内存的Bit位的状态例如以下:

然后我们如今遍历一遍Bit区域,将该位是一的位的编号输出(2,3,4,5,7),这样就达到了排序的目的。以下的代码给出了一个BitMap的使用方法:排序。

//定义每一个Byte中有8个Bit位
#include <memory.h>
#define BYTESIZE 8
void SetBit(char *p, int posi)
{for(int i=0; i < (posi/BYTESIZE); i++){p++;}*p = *p|(0x01<<(posi%BYTESIZE));//将该Bit位赋值1return;
}void BitMapSortDemo()
{//为了简单起见,我们不考虑负数int num[] = {3,5,2,10,6,12,8,14,9};//BufferLen这个值是依据待排序的数据中最大值确定的//待排序中的最大值是14,因此仅仅须要2个Bytes(16个Bit)//就能够了。const int BufferLen = 2;char *pBuffer = new char[BufferLen];//要将全部的Bit位置为0,否则结果不可预知。memset(pBuffer,0,BufferLen);for(int i=0;i<9;i++){//首先将相应Bit位上置为1SetBit(pBuffer,num[i]);}//输出排序结果for(int i=0;i<BufferLen;i++)//每次处理一个字节(Byte){for(int j=0;j<BYTESIZE;j++)//处理该字节中的每一个Bit位{//推断该位上是否是1,进行输出,这里的推断比較笨。//首先得到该第j位的掩码(0x01<<j),将内存区中的//位和此掩码作与操作。最后推断掩码是否和处理后的//结果同样if((*pBuffer&(0x01<<j)) == (0x01<<j)){printf("%d ",i*BYTESIZE + j);}}pBuffer++;}
}int _tmain(int argc, _TCHAR* argv[])
{BitMapSortDemo();return 0;
}

可进行数据的高速查找,判重,删除,一般来说数据范围是int的10倍以下

基本原理及要点

使用bit数组来表示某些元素是否存在,比方8位电话号码

扩展

Bloom filter能够看做是对bit-map的扩展(关于Bloom filter,请參见:海量数据处理之Bloom filter具体解释)。

问题实例

1)已知某个文件内包括一些电话号码,每一个号码为8位数字,统计不同号码的个数。

    8位最多99 999 999,大概须要99m个bit,大概10几m字节的内存就可以。 (能够理解为从0-99 999 999的数字,每一个数字相应一个Bit位,所以仅仅须要99M个Bit==1.2MBytes,这样,就用了小小的1.2M左右的内存表示了全部的8位数的电话)

2)2.5亿个整数中找出不反复的整数的个数,内存空间不足以容纳这2.5亿个整数。

    将bit-map扩展一下,用2bit表示一个数就可以,0表示未出现,1表示出现一次,2表示出现2次及以上,在遍历这些数的时候,假设相应位置的值是0,则将其置为1;假设是1,将其置为2;假设是2,则保持不变。或者我们不用2bit来进行表示,我们用两个bit-map就可以模拟实现这个2bit-map,都是一样的道理。

參考:

  1. http://www.cnblogs.com/youwang/archive/2010/07/20/1781431.html。
  2. http://blog.redfox66.com/post/2010/09/26/mass-data-4-bitmap.aspx。

完。

转载于:https://www.cnblogs.com/mfrbuaa/p/4304023.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/291790.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java的linux执行的shell

2019独角兽企业重金招聘Python工程师标准>>> #!/bin/sh #该脚本为Linux下启动java程序的通用脚本。即可以作为开机自启动service脚本被调用&#xff0c; #也可以作为启动java程序的独立脚本来使用。 # # #警告!!!&#xff1a;该脚本stop部分使用系统kill命…

统计 Github 2021 贡献过的开源项目

统计一下 2021 贡献过的开源项目Intro新的一年的开始了&#xff0c;有很多总结和回顾还没有做&#xff0c;今天就盘点一下贡献过的开源项目吧~起初想着手动地通过 Github Dashboard 来统计但是感觉有些麻烦&#xff0c;还得一个个地复制标题链接等&#xff0c;好麻烦&#xff0…

IntentService使用

说实话&#xff0c;对于这个类在我实际工作中并没有用到过&#xff0c;通常也只是用了它的父类Service&#xff0c;通过官方文档可以看出类的层次结构: 而在今年的一次面试当中&#xff0c;有个面试官提起了它&#xff0c;所以虽说目前还没有真实在项目中用它&#xff0c;但是有…

如何使用 Barracuda 防火墙设置/保护 Azure 应用程序

&#xfeff;&#xfeff;如果某企业在 Windows Azure 上托管某个应用程序&#xff0c;该应用程序会在某个特定时间暴露到 Internet&#xff0c;以用于商业用途。公共 Internet 带来客户的同时也带来了攻击者。 Tim Omta 发表的新博客文章中介绍了如何使用 PaaS 应用程序之前的…

Git 简单命令行指令

为什么80%的码农都做不了架构师&#xff1f;>>> 这些git命令来自gitlab的简单提示&#xff0c;挺人性化&#xff0c;记录下。 Git 全局设置 git config --global user.name "yourname" git config --global user.email "yournamemail.com" 创…

第4章 字符串和格式化输入/输出

学习笔记——《C Primer Plus》 第4章 字符串和格式化输入/输出4.1 前导程序4.2 字符串简介4.2.1 char 类型数组和 null 字符4.2.2 使用字符串4.2.3 strlen() 函数4.3 常量和 C 预处理器4.3.1 符号常量1. 使用**符号常量**的好处:2. 创建符号常量4.3.2 const 限定符4.3.3 转换说…

ios之第一个程序Hello word, I am chenyu !

1、下载Xcode 个人建议网上下载Xcode&#xff0c;快些&#xff0c;特么再应用商店下载像日了狗一样&#xff0c;还要填写资料&#xff0c; 最后资料没有写好&#xff0c;无效字符。2、新建项目 下载好了Xcode&#xff0c;一步一步往下点就行&#xff0c;然后create 项目然后找m…

小博老师解析Java核心技术 ——JSwing绘图技术

2019独角兽企业重金招聘Python工程师标准>>> [引言] 我们在学习Java编程的时候&#xff0c;如果需要开发客户端窗体类型的程序&#xff0c;可以使用JDK中的awt和swing库。本文开始小博老师就继续为大家演示Java窗体编程中的绘图技术&#xff0c;今天主要讲解绘图技术…

.NET6之MiniAPI(十三):健康检查

程序员开发程序&#xff0c;是“生”的过程&#xff0c;运维人员负责日常运维&#xff0c;是“养”的过程&#xff0c;在养的过程&#xff0c;运维人员希望在第一时间了解程序的状况&#xff0c;健康检查&#xff0c;是最基础的手段。var builder WebApplication.CreateBuilde…

linux之用 grep -r 关键字 快速搜索在目录下面的含有关键字的文件

前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到教程 1、快速搜索在目录下面的含有关键字的文件 我们采用下面命令cd directoriesgrep -r 关键字2、搜索结果

python 抓包基于pypcap

2019独角兽企业重金招聘Python工程师标准>>> 1、查询python和python-dev是否安装 dpkg-query -l python dpkg-query -l python-dev #没安装就先安装 sudo apt-get install python python-dev 2、安装flex和bison sudo apt-get install flex bison3、下载libpcap并安…

推荐一个基于Dapr的 Red Dog 的完整微服务应用程序

微服务尽管构建起来非常困难&#xff0c;但它们已成为一种越来越流行的架构模式。随着开发人员开始将他们现有的单体代码库迁移到微服务系统&#xff0c;他们花费大量时间来处理分布式应用程序带来的固有挑战&#xff0c;例如状态管理和服务调用。通过引入Dapr 通过以 http/gRP…

基于事件的 NIO 多线程服务器

2019独角兽企业重金招聘Python工程师标准>>> JDK1.4 的 NIO 有效解决了原有流式 IO 存在的线程开销的问题&#xff0c;在 NIO 中使用多线程&#xff0c;主要目的已不是为了应对每个客户端请求而分配独立的服务线程&#xff0c;而是通过多线程充分使用用多个 CPU 的处…

第6章 C控制语句:循环

学习笔记——《C Prime Plus》 第6章 C控制语句&#xff1a;循环6.1 再探 while 循环6.1.1 程序注释6.1.2 C风格读取循环6.2 while 语句6.2.1 终止 while 循环6.2.2 何时终止循环6.2.3 while&#xff1a;入口循环条件6.2.4 语法要点6.3 _Bool 类型6.4 不确定循环和计数循环6.5 …

openresty 前端开发进阶一之http后端

2019独角兽企业重金招聘Python工程师标准>>> 做前端开发&#xff0c;大多数情况下&#xff0c;都需要跟后端打交道&#xff0c;而最常见的方式则是通过http请求&#xff0c;进行通信。 在openresty中&#xff0c;通过http跟后端整合通信的方式又很多种&#xff0c;各…

第7章 C控制语句:分支和跳转

学习笔记——《C Prime Plus》 第7章 C控制语句&#xff1a;分支和跳转7.1 if 语句7.2 if else 语句7.2.1 介绍 getchar() 和 putchar()7.4 一个统计单词的程序7.1 if 语句 下程序读取一列数据&#xff0c;每个数据都表示每日的最低温度&#xff08;℃&#xff09;&#xff0c…

【Blog.Core开源】网关统一集成下游服务文档

一般看到公众号更新&#xff0c;就是大概率要开始上班了&#x1f602;上回书咱们说到了《【Blog.Core开源】快速预览Admin界面效果》&#xff0c;这样我们就可以专注于后端开发&#xff0c;而且也能快速的实现效果的预览。那今天我们继续来往下走&#xff0c;说一说网关相关的内…

android4.3 截屏功能的尝试与失败分析

1.背景 上一篇讲了在源码中捕获到了android手机的截屏函数&#xff08;同时按下电源键与音量减&#xff0c;详情http://blog.csdn.net/buptgshengod/article/details/19911909&#xff09;&#xff0c;经过一周的研究还是没有在手机上实现系统截屏功能&#xff0c;总结下尝试的…

numpy方法总结

2019独角兽企业重金招聘Python工程师标准>>> 一、数组方法 创建数组&#xff1a;arange()创建一维数组&#xff1b;array()创建一维或多维数组&#xff0c;其参数是类似于数组的对象&#xff0c;如列表等 反过来转换则可以使用numpy.ndarray.tolist()函数&#xff0…

阿里云离线数据仓库

阿里云离线数据仓库第1章 数据仓库概念第2章 项目需求及架构设计2.1 项目需求分析2.2 阿里云技术框架2.2.1 技术选型2.2.2 系统数据流程设计第3章 数据生成模块3.1 埋点数据基本格式3.2 事件日志数据3.2.1 商品列表页&#xff08;loading&#xff09;3.2.2 商品曝光&#xff08…