Python如何打开pkl的sample text?(上篇)

点击上方“Python爬虫与数据挖掘”,进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

昨夜闲潭梦落花,可怜春半不还家。

大家好,我是皮皮。

一、前言

前几天在Python私教群【Emma】问了一个Python读取数据的问题,一起来看看吧。上一篇文章讲到【Emma】的Python环境已经安装好了,现在要开始进阶学习了,一起来看看吧。

2d93d7f3a74bdf73d51fa52b59154829.png

二、实现过程

这个pkl数据是她自己的作业,现在要完成相应的数据读取和处理,看上去要做一次词云处理。

6617c2be3a87ecb356368e4d10f5914c.jpeg

这样的数据格式,直接打开的话,一般都会乱码的,如下图所示:

66f0075dd4a7cf7e32420b9632c01c2f.jpeg

还得是需要使用Pandas来进行读取和查看,代码如下:

import pandas as pd
pd.read_pickle("你的文件名")
058473b093dae4dfb64b433b5babeff2.jpeg

【Emma】给的代码中,文件名忘记。用引号括起来了,所以会报错,加上引号之后,就可以解决这个问题了。

c22e9b1728910df5b71d63d30259ea30.jpeg

加上去了,这个问题解决,但是又来了一个新问题,然后粉丝就麻了,从报错来看,文件不存在,说明文件不在当前代码的同级目录下,需要加绝对路径才行。

82a9102e804868bccec0b88551ca6bda.jpeg

她的文件就是在下载里,就是在Safari下载里,那么在mac中怎么看是在哪呢?

757aa14bcecfce6773d949751815e0d8.png

把红框里的点开,就能看到文件路径了,但是【Emma】在操作的时候,还是不太懂。

950d1bab0401608bb2117b5b1a255c6d.png

后来在finder里面找到了它,然后定位到具体的路径,如下图所示:

1db6f50d439c5205ef79ea81fdc9aed6.png

然后拷贝或者剪切到你的pycharm这个项目里,如下图所示:

371d25db2357641fe65f6382c24670f3.jpeg

直接粘贴,会有个弹出框,确认就行了。

6c1eaf48dbf2eacd3d9a23a7dd687d07.jpeg

看上去粘贴过来的时候,文件多了个尾巴,需要把【的副本】这三个字删除才行,不然的话,代码肯定又会报错的,说文件找不到。

6727e6f4874ca80fffc04113939a1e49.png

虽然这样操作理论上来说,应该没啥问题,但是实际上还是有点问题,因为【Emma】是直接打开的,直接打开肯定是乱码,而是需要用Python库来进行读取。

目前【Emma】的文件问题已经解决了,下一步她要开始导入数据了,读取数据了,下一篇文章继续一起来看看【Emma】接下来会遇到什么问题吧,敬请期待!

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个Python库安装和导包基础问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【Emma】提问,感谢【狂吃山楂片】给出的思路和代码解析,感谢【莫生气】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

bef2767d70e43c4c548306d50cdff3b9.png

大家在学习过程中如果有遇到问题,欢迎随时联系我解决(我的微信:pdcfighting1),应粉丝要求,我创建了一些ChatGPT机器人交流群和高质量的Python付费学习交流群和付费接单群,欢迎大家加入我的Python学习交流群和接单群!

250233a6df6896da043eaf7f020c0ccb.png

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

5f5b83d0a32bb3c4e19d1be7d25bd46e.jpeg

------------------- End -------------------

往期精彩文章推荐:

  • if a and b and c and d:这种代码有优雅的写法吗?

  • Pycharm和Python到底啥关系?

  • 都说chatGPT编程怎么怎么厉害,今天试了一下,有个静态网页,chatGPT居然没搞定?

  • 站不住就准备加仓,这个pandas语句该咋写?

5bfd358a8a0000fc72cd8094619416b3.png

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群

万水千山总是情,点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/31007.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mysql_docker主从复制_实战_binlog混合模式_天座著

步骤1:拉取镜像 docker pull mariadb:latest 步骤2.1:创建两个文件夹用于放置挂载mysql的my.cnf /tianzuomysqlconf/master /tianzuomysqlconf/slave mkdir /tianzuomysqlconf cd /tianzuomysqlconf mkdir master mkdir slave 步骤2.2:创…

ElasticSearch:全文检索及倒排索引原理

1.从全文检索说起 首先介绍一下结构化与非结构化数据: 结构化数据将数据具有的特征事先以结构化的形式定义好,数据有固定的格式或有限的长度。典型的结构化数据就是传统关系型数据库的表结构,数据特征直接体现在表结构的字段上,…

idea数据库快速上手-库操作与表结构和数据操作

引言 对数据库的操作无非就是执行SQL语句,要想熟练操作数据库,就要熟练运用SQL语句。 一,数据库操作 展示当前服务器内的数据库 -- 展示服务器内的数据库 show databases; show schemas; 执行结果: 创建数据库: --…

云技术-混沌工程

目录 混沌工程 故障注入 监控和观测 自动化和持续集成 混沌工程 混沌工程(Chaos Engineering)是一种实验性的系统可靠性工程方法,主动引入故障和异常来测试系统的弹性和容错能力。混沌工程的核心思想是通过模拟故障场景来验证系统在各种异…

springboot项目打包 以及打包碰到各种问题

PS:以上资料都来自于网络 1.IDEA 将springboot项目打包 IDEA如何打包springboot成jar包,并运行、停止、重启,本地依赖不能打包怎么办_真是6的不行的博客-CSDN博客 2.[WARNING] Error injecting: org.springframework.boot.maven.RepackageMojo 1.注释…

Python中搭建IP代理池的妙招

在Python的爬虫世界里,你是否也想搭建一个功能强大的IP代理池,让你的爬虫无忧无虑地畅游各大网站?今天,我就来教你使用Scrapy框架搭建IP代理池,让你的爬虫更加智能、高效!跟着我一步一步来,轻松…

Java项目部署云windows细节

springboot项目 pom文件中必须要有这个插件&#xff08;正常其实都有就是我手贱以前不小心删除了&#xff09; 他的作用是查找主类 <build><plugins><plugin><groupId>org.springframework.boot</groupId><artifactId>spring-boot-maven-…

Pytorch基于VGG cosine similarity实现简单的以图搜图(图像检索)

代码如下&#xff1a; from PIL import Image from torchvision import transforms import os import torch import torchvision import torch.nn.functional as Fclass VGGSim(torch.nn.Module):def __init__(self):super(VGGSim, self).__init__()blocks []blocks.append(t…

使用乐观锁解决超卖问题

目录 什么是超卖&#xff1f; 乐观锁和悲观锁的定义 悲观锁&#xff1a; 乐观锁&#xff1a; 乐观锁的实现方式 1.版本号 2.CAS法 什么是超卖&#xff1f; 举个例子&#xff1a;订单系统中&#xff0c;用户在执行下单操作时&#xff0c;可能同一时间有无数个用户同时下单&…

SpringBoot异步任务(2)|(线程池使用)

SpringBoot异步任务&#xff08;2&#xff09;|&#xff08;线程池使用&#xff09; 文章目录 SpringBoot异步任务&#xff08;2&#xff09;|&#xff08;线程池使用&#xff09;[TOC] 前言一、使用场景二、springboot添加异步任务1.配置线程池2.线程池的使用 总结 章节 第一章…

linux静态库与动态库

1、动态库和静态库概念 Linux中的库分为动态库和静态库。 静态库&#xff08;.a&#xff09;&#xff1a;库文件以.a为后缀&#xff0c;程序在编译链接时把库的代码链接到可执行文件中&#xff08;将需要的库函数拷贝一份到代码中&#xff09;。程序运行时不需要再跳转到静态…

vue3报错

这是因为eslint对代码的要求严格导致的&#xff0c;可以在package.json里面删掉"eslint:recommended"&#xff0c;然后重启就可以正常运行了

电影院订票选座网站小程序开发(java开源)

搭建一个电影院订票选座网站小程序需要掌握Java语言和相关的Web开发技术&#xff0c;同时需要使用开源框架和库来实现。以下是一个基本的步骤指南&#xff1a; 确定技术栈 首先&#xff0c;需要确定使用的技术栈&#xff0c;以便更好的开展工作。 设计数据库 设计数据库需要…

畜牧虚拟仿真 | 鱼授精过程VR模拟演练系统

随着科技的发展&#xff0c;虚拟现实(VR)技术逐渐渗透到各个领域&#xff0c;为人们提供了更加真实、直观的体验。在动物养殖教育领域&#xff0c;鱼授精过程VR模拟演练系统正成为一种新的教学手段&#xff0c;它能够帮助人们更好地理解和掌握鱼授精的操作技巧&#xff0c;从而…

vue3组合式api单文件组件写法

一&#xff0c;模板部分 <template><div class"device container"><breadcrumb :list"[首页, 应急处置]" /><div class"search_box"><div class"left"><span style"margin-right: 15px"…

Maven进阶2 -- 私服(Nexus)、私服仓库分类、资源上传和下载

目录 私服是一台独立的服务器&#xff0c;用于解决团队内部的资源共享与资源同步问题。 1.Nexus Nexus是sonatype公司的一款maven私服产品。 下载地址 启动 nexus.exe /run nexus 访问 & 登录 2.私服仓库分类 3.资源上传和下载 本地仓库上传和访问资源需要进行配置。…

android实现获取系统全局对象实例

无需Context获取系统常用全局对象&#xff1a;Application&#xff0c;Activity&#xff0c;PackageManager等。 import android.app.Activity; import android.app.Application; import android.app.Service; import android.content.Context; import android.content.pm.Pac…

蒙德里安的梦想

蒙德里安的梦想 算法标签 状态压缩dp 题目大意&#xff1a;求把 NM的棋盘分割成若干个12 的的小长方形&#xff0c;有多少种方案。 思路分析&#xff1a; 首先&#xff0c;注意到&#xff0c;我们直接考虑如何切割整个棋盘为若干个1x2的长方形是比较困难的&#xff0c;因此…

Java重试的几种写法

在开发Java应用程序时&#xff0c;经常需要处理一些可能失败的操作&#xff0c;例如数据库连接、网络请求等。为了增加程序的健壮性和容错性&#xff0c;我们可以使用重试机制来尝试多次执行失败的操作。本文将介绍Java中常见的7种重试机制&#xff0c;并提供相应的Java示例。 …

Android JNI--C++基础

1,基础结构 C标准支持 #include <iostream>C语言的标准支持 #include <stdio.h> 命名空间 C的特性 std C系统的命名空间 也可以自定义 using namespace std; C中命名空间的作用类似于操作系统中的目录和文件的关系&#xff0c;由于文件很多&#xff0c;不便管…