题目:
DNA序列 由一系列核苷酸组成,缩写为
'A'
,'C'
,'G'
和'T'
.。
- 例如,
"ACGAATTCCG"
是一个 DNA序列 。在研究 DNA 时,识别 DNA 中的重复序列非常有用。
给定一个表示 DNA序列 的字符串
s
,返回所有在 DNA 分子中出现不止一次的 长度为10
的序列(子字符串)。你可以按 任意顺序 返回答案。来源:力扣(LeetCode)
链接:力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台
示例:
示例 1:
输入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出:["AAAAACCCCC","CCCCCAAAAA"]
示例 2:输入:s = "AAAAAAAAAAAAA"
输出:["AAAAAAAAAA"]
解法:
使用滑动窗口记录每个子串出现的次数。
代码:
class Solution:def findRepeatedDnaSequences(self, s: str) -> List[str]:dic = defaultdict(int)result = []if len(s) >= 10:for index in range(len(s) - 9):dic[s[index: index + 10]] += 1result = [k for k, v in dic.items() if v > 1]return result