BS4
Beautiful Soup,Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式。
安装
pip3 install beautifulsoup4
使用
from bs4 import BeautifulSoup#html_doc为网页内容
soup = BeautifulSoup(html_doc, 'html.parser')tags=soup.find_all()
#获取所有标签
for tag in tags:print(tag.name)#针对 scriptif tag.name='script'#删除标签tag.decompose()#过滤后的soup
content=str(soup)# 截取文本内容前150字符 .text表示文本
desc=soup.text[0:150]
note:
其实还是需要解析器的,但是这里用自带的。如下:
pip install html5lib
解析器对比:
官方文档
编辑器kindeditor
官方查看资料:http://kindeditor.net/docs/option.html#extrafileuploadparams
编辑器上传图片
1.网页
<script charset="utf-8" src="/static/kindeditor/kindeditor.js"></script><script>KindEditor.ready(function (K) {window.editor = K.create('#id_content',{width : '100%',height : '700px',resizeType: '1',uploadJson : '/upload_image/',extraFileUploadParams : {'csrfmiddlewaretoken':'{{ csrf_token }}'}});});</script>
uploadJson :设置图片url,图片往url发送,所以增加路由url处理 extraFileUploadParams : 额外参数,这里是post发送,所以需要发送校验。
2.url.py
# 编辑器上传图片借口re_path(r'^upload_image/',views.upload_image),
3.视图层views.py
# 上传图片
import os
from BBS_Virtualenvs import settings
def upload_image(request):"""//成功时{"error" : 0,"url" : "http://www.example.com/path/to/file.ext"}//失败时{"error" : 1,"message" : "错误信息"}:param request::return:"""back_dic = {'error': 0, } # 先定义返回给编辑器的数据形式# 用户上传图片 也算是静态资源 应该放在防盗media文件夹下if request.method == 'POST':# 获取用户上传图片对象print(request.FILES) #打印查看键名字 imgFilefile_obj =request.FILES.get('imgFile')# 手动拼接存储文件的路径file_dir=os.path.join(settings.BASE_DIR,'media','article_img')# 优化操作 先判断当前文件是否存在 如果不存在 自动创建if not os.path.isdir(file_dir):os.mkdir(file_dir) #创建目录 article_imgfile_path=os.path.join(file_dir,file_obj.name)with open(file_path,'wb') as f:for line in file_obj:f.write(line)# 返回文件路径名字 也需要手动拼接# 为什么不用file_path? /BBS_Virtualenvs/media 不能作为网页连接,没有暴露资源back_dic['url']='/media/article_img/%s'%file_obj.namereturn JsonResponse(back_dic)
参考:https://www.cnblogs.com/Dominic-Ji/p/9637705.html