1.分析网页,获取代码,提取时间
想要提取出弹幕所在的节点,我们要使用 Beautiful Soup 解析模块,需要从 bs4 中导入 BeautifulSoup 模块
创建一个 BeautifulSoup 对象,传入变量 xml 和解析器 lxml,将该对象赋值给变量 soup。
接着使用 find_all() 函数中,传入 name 参数,其参数值为 d 。将返回的由所有 d 节点组成的列表,赋值给变量 content_all。
2.弹幕的发送时间进行统计,绘制折线图
我们可使用 for 循环遍历 range() 函数生成的 0-24 的数字。
将 30*x+1 赋值给变量 start, 30*(x+1) 赋值给变量 end;
使用 格式化 start 和 end,用 短横线相连 并赋值给 segment_range。
把 segment_range 作为字典 subtitlesDict 的键,添加进字典中,再将字典中键所对应的值设置为 0。
在 add_xaxis() 函数中传入一个参数,这个参数的类型是列表,列表中的元素顺序表示折线图 x 轴从左到右的刻度。
在这里我们要传入所有的月份,可以使用 keys() 函数获取字典中所有的键,再使用 list() 函数将格式转换成列表。