haystack是全文搜索的框架,支持whoosh、solr、Xapian、Elasticsearc四种全文检索引擎,点击查看官方网站。
whoosh是用纯Python编写的全文搜索引擎,虽然性能比不上sphinx、xapian、Elasticsearc等,但是无二进制包,程序不会莫名其妙的崩溃,对于小型的站点,whoosh已经足够使用,点击查看whoosh文档。
jieba是一款免费的中文分词包,如果觉得不好用可以使用一些收费产品。
一、全文搜索配置
1)在环境中安装依赖包
pip install django-haystack pip install whoosh pip install jieba
2)在项目配置文件settings.py中注册应用
INSTALLED_APPS = (...'haystack', )
3)在项目配置文件settings.py中指定搜索引擎
# haystack全文搜索配置 HAYSTACK_CONNECTIONS = {'default': {# 使用whoosh引擎'ENGINE': 'haystack.backends.whoosh_backend.WhooshEngine',# 索引文件存储路径'PATH': os.path.join(BASE_DIR, 'whoosh_index'),} }# 当添加、修改、删除数据时,自动生成索引 HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor' # 修改haystack 默认返回数据量。默认20 HAYSTACK_SEARCH_RESULTS_PER_PAGE = 1
4)在项目的urls.py中添加路由
path('search/', include('haystack.urls'))
5)在haystack中使用jieba分词包
修改haystack源码包目录下的 ./backends/whoosh_backend.py文件
from jieba.analyse import ChineseAnalyzer #将StemmingAnalyzer()替换为 ChineseAnalyzer() schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=StemmingAnalyzer()), field_boost=field_class.boost, sortable=True)
二、生成索引文件
1)在需要进行全文搜索的模型类同目录下,新建一个search_indexes.py文件(注:文件名称不能自定义)
在文件中写入下面代码:
from haystack import indexes# 导入需要创建索引的模型类 from apps.goods.models import GoodsSKUclass GoodsSKUIndex(indexes.SearchIndex, indexes.Indexable):# 索引字段 use_template=True指定根据表中的哪些字段建立索引文件的说明放在一个文件中text = indexes.CharField(document=True, use_template=True)def get_model(self):# 返回创建索引模型类return GoodsSKU# 建立索引的数据def index_queryset(self, using=None):return self.get_model().objects.all()
2)在templates下面新建目录search/indexes/goods,其中search/indexes/为固定名称,goods为创建索引模型类对应的应用名称。
并在目录下新建一个文件goodssku_text.txt,goodssku为模型类小写,后面部分为固定名称。
3)在goodssku_text.txt文件中指定索引字段
# 指定索引的字段
{{ object.name }} # object为固定值,可以看成是模型类的实例
{{ object.desc }}
{{ object.goods.detail }}
4)使用命令生成索引文件
python manage.py rebuild_index
索引文件存储在settings中配置的目录下,即whoosh_index
注:如果新增、修改、删除了商品需要重新生成索引文件
三、使用全文搜索
1)在使用全文搜索html中设置如下表单内容
点击搜索就会通过haystack搜索数据
2)定义搜索结果模板
上面的搜索结果会传递给templates/search目录下的search.html,传递的上下文包括:
- query:搜索关键字
- page:当前页的page对象,遍历page对象获取到的是SearchResult类的实例对象,对象的object属性才是模型类的对象
- paginator:分页paginator对象
界面搜索结果
源码等资料获取方法
各位想获取源码的朋友请点赞 + 评论 + 收藏,三连!
三连之后我会在评论区挨个私信发给你们~