文章目录
- 1.环境配置
- (一)安装:anaconda
- 1. 理解:为什么需要anaconda
- 2. 下载anaconda
- 3. 启动anaconda
- (二)安装:python环境
- (三)安装:依赖包
- hdbscan的安装问题
- 解决方案
- 1. 安装build-tools-for-visual-studio
- 2. 安装hdbscan
- (四)安装transformers、BERTopic等重要依赖包
- 2.BERT预训练模型下载
- (一)模型原理
- (二)预训练模型获取
- 3.BERT模型实战操作
- 3.1预处理
- 3.2随机生成数据
- 3.3用预训练模型生成词向量
- 3.4文本聚类 ⭐
1.环境配置
(一)安装:anaconda
1. 理解:为什么需要anaconda
不同的python版本适应与相应的依赖包,可以用ANACONDA来管理不同的python版本环境,需要用到哪个环境就调用哪个环境。
本人最常用的就是一个Py3.6的包,这个包很多的版本的库都兼容,但是由于新的出来,一些最新的库已经开始不适配3.6
此前有次,自己的原生代码,在生成WordCloud词云时,从来都不会报错,会出现一个字体的错误。一直没解决,用了很多方法都没解决,后面发现是不适配3.6版本。所以在anaconda中可以再生成一个更高版本的环境。
可以专门用一个python版本,解决相应的问题。
2. 下载anaconda
anaconda下载地址
下载好,双击安装,一直下一步
3. 启动anaconda
在开始菜单,找到anaconda powershell prompt,输入conda
,有输出即可
这样我们就有了管理python版本、依赖包版本