文章目录
- [705. 设计哈希集合](https://leetcode.cn/problems/design-hashset/)
- 实现一:纯数组实现
- 实现二:数组+链表
- 实现三:位运算
- [A + B Problem II ](https://vjudge.net.cn/problem/HDU-1002)
- [DNA sequence](https://vjudge.net.cn/problem/HDU-1560#author=GPT_zh)
705. 设计哈希集合
实现一:纯数组实现
由于key最大为 1 0 6 10^6 106,所以开辟一个 1 0 6 + 1 10^6+1 106+1长度的布尔数组,来判断key是否存在。
class MyHashSet {private static int MAX = (int)1e6 + 1;public boolean[] flag;public MyHashSet() {flag = new boolean[MAX];}public void add(int key) {flag[key] = true;}public void remove(int key) {flag[key] = false;}public boolean contains(int key) {return flag[key];}
}
实现二:数组+链表
java中的HshSet的实现原理:
使用HashMap当作数组,其中元素存放在key中。
当添加元素key时,首先计算key在数组中的位置,计算过程如下:
int hash = (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
return hash & (数组长度 - 1)
如果key是空,直接返回0
否则,key的哈希值与右移后的哈希值做异或,结果就是key的新哈希值
然后将新哈希值与长度-1做与,结果就是key在数组中的位置。
添加元素key的流程:
首先计算出key对应的索引index;
如果index位置没有元素,直接放入;否则判断链表里有没有重复元素,若有,则直接返回;
否则将key插入到链表里。
我们仿照这个来实现
class MyHashSet {static class Node {int val;Node next;public Node(int val) {this.val = val;}}// 为了便于计算索引的位置,将数组长度定为2的整数次方 (int)Math.pow(2, 14);// 这个数组的长度可以很小private static final int N = (int)Math.pow(2, 14);Node[] table = new Node[N];public MyHashSet() {//table = new Node[N];}// 获取key在哈希表中的索引private int getIndex(Integer key) {// 为了让 key 对应的 hash 高位也参与运算,这里对 hashCode 进行无符号右移异或// 如果hash小于等于2^16 - 1(65535),则无符号右移后变为0// 通过将高16位与低16位异或,从而使得 hashCode 的高位随机性和低位随机性都能体现在低 16 位中int hashCode = Integer.hashCode(key);hashCode ^= (hashCode >>> 16);return (N - 1) & hashCode;}public void add(int key) {int index = getIndex(key);if (table[index] == null) {// index位置没元素,直接放table[index] = new Node(key);} else {// index位置有元素了,把key插入到table[index]链表里// 在插入之前,先判断链表里是否存在keyNode pre = null;Node cur = table[index];while (cur != null) {if (cur.val == key) {// key重复了,添加失败return;}pre = cur;cur = cur.next;}// 此时pre是链表的尾节点// 两种插入方式(头插法,尾插法),这里使用尾插法Node node = new Node(key);pre.next = node;}}public void remove(int key) {int index = getIndex(key);Node cur = table[index];if (cur != null) {Node pre = null;while (cur != null) {if (cur.val == key) {if (pre == null) {// 删除链表的头节点table[index] = cur.next;} else {// 删除链表的中间节点pre.next = cur.next;}return;}pre = cur;cur = cur.next; }}}public boolean contains(int key) {int index = getIndex(key);Node cur = table[index];while (cur != null) {if (cur.val == key) {return true;}cur = cur.next;}return false;}
}
实现三:位运算
int类型有32位,可以表示32个数,那么31250个int,可以表示1000000个数(0~999999),所以数组长度定为31251
每一个int代表一个块,一共312501个块,每一块里能代表32个数
那如何找到key对应的块呢?
通过key / 32
操作
如何找到key在块中的索引呢?
通过key % 32
,更高效的做法是key & 31
(31的二进制是5个1)
初始时,数组元素置为0,表示一个元素也没有
添加元素:将对应块的位置为1
移除元素:将对应块的位置为0
class MyHashSet {// int类型有32位,可以表示32个数,那么31250个int,可以表示1000000个数(0~999999)// 所以数组长度定为31251public int[] table = new int[31251];public MyHashSet() {}public void add(int key) {int index = key >> 5; // 相当于除以32int bitIndex = key & 31; // 相当于key % 32table[index] |= (1 << bitIndex); // 将table[index]的bitIndex位置1}public void remove(int key) {int index = key >> 5; // 相当于除以32 (块索引)int bitIndex = key & 31; // 相当于key % 32 (位索引)table[index] &= (~(1 << bitIndex)); // 将table[index]的bitIndex位置0}public boolean contains(int key) {int index = key >> 5; // 相当于除以32int bitIndex = key & 31; // 相当于key % 32return ((table[index] >> bitIndex) & 1) == 1;}
}
A + B Problem II
手动实现大整数加
import java.util.Scanner;public class Main{public static String add(String a, String b) {String res = "";int i = a.length() - 1;int j = b.length() - 1;int c = 0; // 进位while (i >= 0 || j >= 0 || c > 0) {// 从低位到高位,一位一位的算char aChar = i >=0 ? a.charAt(i) : '0';char bChar = j >= 0 ? b.charAt(j) : '0';int ans = 0;ans += c;ans += aChar - '0' + bChar - '0';c = ans / 10;res = String.valueOf(ans % 10) + res;i--;j--;} return res;}public static void main(String[] args) {// TODO Auto-generated method stubScanner sc = new Scanner(System.in);int t = sc.nextInt();for (int i = 0; i < t; ++i) {String a = sc.next();String b = sc.next();String ans = add(a, b);System.out.println("Case " + String.valueOf(i + 1) + ":");System.out.println(a + " + " + b + " = " + ans);System.out.println();}}
}
DNA sequence
迭代加深搜索
目标字符串的长度是未知的,所以应该从所有序列的最大长度开始搜索
通过剪枝限制递归的深度
剪枝策略:如果已经匹配的字符个数+最长待匹配字符数 > 目标字符串的长度,则直接返回false,表示之前的匹配方案无效。
对于最长待匹配字符数,有两种计算方法:
方法一:统计所有序列中最长的待匹配字符数
int ans = 0;
for(int i = 1; i <= n; ++i) {ans = max(len[i] - pos[i] + 1, ans); //最大待匹配长度
return ans;
方法二:统计所有序列的待匹配部分中A出现的最多次数+C出现的最多次数+G出现的最多次数+T出现的最多次数,并返回
int ans = 0;
// 计算A,C,G,T最多出现次数的累加和
for (int i = 1; i <= 4; ++i) {int maxCnt = 0;// 计算dic[i]最多出现次数for (int j = 1; j <= n; ++j) {// 计算s[j]中 dic[i] 出现的次数int t = 0;for (int k = pos[j]; k <= len[j]; ++k) {t += s[j][k] == dic[i] ? 1 : 0;}maxCnt = max(maxCnt, t);}ans += maxCnt;
}return ans;
显然方法二剪枝策略更高效
#include<iostream>
#include<cmath>
#include<algorithm>
#include<vector>
using namespace std;
const int MAX_N = 10, MAX_L = 10;char s[MAX_N][MAX_L]; // s[i]:表示第i个序列
int pos[MAX_N]; // pos[i]: 表示第i个序列的第一个待匹配位置
int len[MAX_N]; // len[i]:表示第i个序列的长度
int n, t, res;char dic[5] = { 0, 'A', 'C', 'G', 'T' };int wrong() {int ans = 0;// 计算A,C,G,T最多出现次数的累加和for (int i = 1; i <= 4; ++i) {int maxCnt = 0;// 计算dic[i]最多出现次数for (int j = 1; j <= n; ++j) {// 计算s[j]中 dic[i] 出现的次数int t = 0;for (int k = pos[j]; k <= len[j]; ++k) {t += s[j][k] == dic[i] ? 1 : 0;}maxCnt = max(maxCnt, t);}ans += maxCnt;}return ans;
}// dep表示已经匹配的字符数
bool dfs(int dep) {int temp = wrong();if (temp == 0) {// 待匹配字符数为0return true;}if (dep + temp > res) {// dep + temp 大于序列长度,说明之前的匹配方案无效return false;}vector<int> v;for (int i = 1; i <= 4; ++i) {for (int j = 1; j <= n; ++j) {if (s[j][pos[j]] == dic[i]) {// s[j]序列成功匹配到一个字符pos[j]++;v.push_back(j); // 记录一下,再结束递归时,再恢复现场}}if (v.size() > 0) {// 有序列成功匹配到,才进行递归// 继续匹配if (dfs(dep + 1)) {return true;}else {// 恢复现场while (v.size() > 0) {int tail = v[v.size() - 1];v.pop_back();pos[tail]--;}}}}return false;
}int main() {scanf("%d", &t);while (t--) {scanf("%d", &n);res = 0;for (int i = 1; i <= n; ++i) {memset(s[i], '\0', sizeof(s[i]));scanf("%s", s[i] + 1);pos[i] = 1;len[i] = strlen(s[i] + 1);//printf("s[i]=%s, len[i]=%d\n", s[i], len[i]);res = max(res, len[i]);}while (!dfs(0)) {res++;}printf("%d\n", res);}return 0;
}