题目
DNA序列 由一系列核苷酸组成,缩写为 'A', 'C', 'G' 和 'T'.。
例如,"ACGAATTCCG" 是一个 DNA序列 。
在研究 DNA 时,识别 DNA 中的重复序列非常有用。给定一个表示 DNA序列 的字符串 s ,返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列(子字符串)。你可以按 任意顺序 返回答案。
解题思路
- 遍历将字符串每十个字符分割成一个字符串存储到Map中进行统计出现次数;
- 将出现次数超过1次的存储到list当中输出。
代码展示
class Solution {public List<String> findRepeatedDnaSequences(String s) {Map<String,Integer> data = new HashMap<>();for (int i = 0; i <= s.length() - 10; i++){String str = s.substring(i, i + 10);Integer temp = data.getOrDefault(str, 0);data.put(str, temp + 1);}List<String> ans = new ArrayList<>();for (String str : data.keySet()){if(data.get(str) > 1){ans.add(str);}}return ans;}
}