element文件上传有文件但是后台接收为空_程序员提高篇:大规格文件(G)是如何做分片优化的?...

作者:凹凸实验室 链接:https://juejin.im/post/5ebb4346e51d451ef53793ad

整体思路

第一步是结合项目背景,调研比较优化的解决方案。 文件上传失败是老生常谈的问题,常用方案是将一个大文件切片成多个小文件,并行请求接口进行上传,所有请求得到响应后,在服务器端合并所有的分片文件。当分片上传失败,可以在重新上传时进行判断,只上传上次失败的部分,减少用户的等待时间,缓解服务器压力。这就是分片上传文件。

大文件上传

那么如何实现大文件分片上传呢?

流程图如下:

9d0c41605d00fce63c086930995b2323.png

分为以下步骤实现:

1. 文件 MD5 加密

MD5 是文件的唯一标识,可以利用文件的 MD5 查询文件的上传状态。

根据文件的修改时间、文件名称、最后修改时间等信息,通过 spark-md5 生成文件的 MD5。需要注意的是,大规格文件需要分片读取文件,将读取的文件内容添加到 spark-md5 的 hash 计算中,直到文件读取完毕,最后返回最终的 hash 码到 callback 回调函数里面。这里可以根据需要添加文件读取的进度条。

831d788df624d5d3938eded2819f4501.gif

实现方法如下:

// 修改时间+文件名称+最后修改时间-->MD5md5File (file) {  return new Promise((resolve, reject) => {    let blobSlice =      File.prototype.slice ||      File.prototype.mozSlice ||      File.prototype.webkitSlice    let chunkSize = file.size / 100    let chunks = 100    let currentChunk = 0    let spark = new SparkMD5.ArrayBuffer()    let fileReader = new FileReader()    fileReader.onload = function (e) {      console.log('read chunk nr', currentChunk + 1, 'of', chunks)      spark.append(e.target.result) // Append array buffer      currentChunk++      if (currentChunk < chunks) {        loadNext()      } else {        let cur = +new Date()        console.log('finished loading')        // alert(spark.end() + '---' + (cur - pre)); // Compute hash        let result = spark.end()        resolve(result)      }    }    fileReader.onerror = function (err) {      console.warn('oops, something went wrong.')      reject(err)    }    function loadNext () {      let start = currentChunk * chunkSize      let end =        start + chunkSize >= file.size ? file.size : start + chunkSize      fileReader.readAsArrayBuffer(blobSlice.call(file, start, end))    }    loadNext()  })}

2. 查询文件状态

前端得到文件的 MD5 后,从后台查询是否存在名称为 MD5 的文件夹,如果存在,列出文件夹下所有文件,得到已上传的切片列表,如果不存在,则已上传的切片列表为空。

b649f23aa10e833c813b99fd22c4df6e.png
// 校验文件的MD5checkFileMD5 (file, fileName, fileMd5Value, onError) {  const fileSize = file.size  const { chunkSize, uploadProgress } = this  this.chunks = Math.ceil(fileSize / chunkSize)  return new Promise(async (resolve, reject) => {    const params = {      fileName: fileName,      fileMd5Value: fileMd5Value,    }    const { ok, data } = await services.checkFile(params)    if (ok) {      this.hasUploaded = data.chunkList.length      uploadProgress(file)      resolve(data)    } else {      reject(ok)      onError()    }  })}

3. 文件分片

文件上传优化的核心就是文件分片,Blob 对象中的 slice 方法可以对文件进行切割,File 对象是继承 Blob 对象的,因此 File 对象也有 slice 方法。

定义每一个分片文件的大小变量为 chunkSize,通过文件大小 FileSize 和分片大小 chunkSize 得到分片数量 chunks,使用 for 循环和 file.slice() 方法对文件进行分片,序号为 0 - n,和已上传的切片列表做比对,得到所有未上传的分片,push 到请求列表 requestList。

5e432b5897c5d05f030720e58c6ca396.png
async checkAndUploadChunk (file, fileMd5Value, chunkList) {  let { chunks, upload } = this  const requestList = []  for (let i = 0; i < chunks; i++) {    let exit = chunkList.indexOf(i + '') > -1    // 如果已经存在, 则不用再上传当前块    if (!exit) {      requestList.push(upload(i, fileMd5Value, file))    }  }  console.log({ requestList })  const result =    requestList.length > 0      ? await Promise.all(requestList)        .then(result => {          console.log({ result })          return result.every(i => i.ok)        })        .catch(err => {          return err        })      : true  console.log({ result })  return result === true}

4. 上传分片

调用 Promise.all 并发上传所有的切片,将切片序号、切片文件、文件 MD5 传给后台。

后台接收到上传请求后,首先查看名称为文件 MD5 的文件夹是否存在,不存在则创建文件夹,然后通过 fs-extra 的 rename 方法,将切片从临时路径移动切片文件夹中,结果如下:

d096d2b3485802e7ea9330c9e4da6d21.png

当全部分片上传成功,通知服务端进行合并,当有一个分片上传失败时,提示“上传失败”。在重新上传时,通过文件 MD5 得到文件的上传状态,当服务器已经有该 MD5 对应的切片时,代表该切片已经上传过,无需再次上传,当服务器找不到该 MD5 对应的切片时,代表该切片需要上传,用户只需上传这部分切片,就可以完整上传整个文件,这就是文件的断点续传。

// 上传chunkupload (i, fileMd5Value, file) {  const { uploadProgress, chunks } = this  return new Promise((resolve, reject) => {    let { chunkSize } = this    // 构造一个表单,FormData是HTML5新增的    let end =      (i + 1) * chunkSize >= file.size ? file.size : (i + 1) * chunkSize    let form = new FormData()    form.append('data', file.slice(i * chunkSize, end)) // file对象的slice方法用于切出文件的一部分    form.append('total', chunks) // 总片数    form.append('index', i) // 当前是第几片    form.append('fileMd5Value', fileMd5Value)    services      .uploadLarge(form)      .then(data => {        if (data.ok) {          this.hasUploaded++          uploadProgress(file)        }        console.log({ data })        resolve(data)      })      .catch(err => {        reject(err)      })  })}
cb8752490e54bf4357eb51de98cf24a6.gif
// 上传chunkupload (i, fileMd5Value, file) {  const { uploadProgress, chunks } = this  return new Promise((resolve, reject) => {    let { chunkSize } = this    // 构造一个表单,FormData是HTML5新增的    let end =      (i + 1) * chunkSize >= file.size ? file.size : (i + 1) * chunkSize    let form = new FormData()    form.append('data', file.slice(i * chunkSize, end)) // file对象的slice方法用于切出文件的一部分    form.append('total', chunks) // 总片数    form.append('index', i) // 当前是第几片    form.append('fileMd5Value', fileMd5Value)    services      .uploadLarge(form)      .then(data => {        if (data.ok) {          this.hasUploaded++          uploadProgress(file)        }        console.log({ data })        resolve(data)      })      .catch(err => {        reject(err)      })  })}

5. 上传进度

虽然分片批量上传比大文件单次上传会快很多,也还是有一段加载时间,这时应该加上上传进度的提示,实时显示文件上传进度。

原生 Javascript 的 XMLHttpRequest 有提供 progress 事件,这个事件会返回文件已上传的大小和总大小。项目使用 axios 对 ajax 进行封装,可以在 config 中增加 onUploadProgress 方法,监听文件上传进度。

02c4dc4c80d530e19f0b6dff07160f79.gif
const config = {  onUploadProgress: progressEvent => {    var complete = (progressEvent.loaded / progressEvent.total * 100 | 0) + '%'  }}services.uploadChunk(form, config)

6. 合并分片

上传完所有文件分片后,前端主动通知服务端进行合并,服务端接受到这个请求时主动合并切片,通过文件 MD5 在服务器的文件上传路径中找到同名文件夹。从上文可知,文件分片是按照分片序号命名的,而分片上传接口是异步的,无法保证服务器接收到的切片是按照请求顺序拼接。所以应该在合并文件夹里的分片文件前,根据文件名进行排序,然后再通过 concat-files 合并分片文件,得到用户上传的文件。至此大文件上传就完成了。

12ef1dc34ec9d59c63496d5446905fca.png
68a9e27c186489d0f8f46e224f5156d6.gif

Node 端代码:

// 合并文件exports.merge = {  validate: {    query: {      fileName: Joi.string()        .trim()        .required()        .description('文件名称'),      md5: Joi.string()        .trim()        .required()        .description('文件md5'),      size: Joi.string()        .trim()        .required()        .description('文件大小'),    },  },  permission: {    roles: ['user'],  },  async handler (ctx) {    const { fileName, md5, size } = ctx.request.query    let { name, base: filename, ext } = path.parse(fileName)    const newFileName = randomFilename(name, ext)    await mergeFiles(path.join(uploadDir, md5), uploadDir, newFileName, size)      .then(async () => {        const file = {          key: newFileName,          name: filename,          mime_type: mime.getType(`${uploadDir}/${newFileName}`),          ext,          path: `${uploadDir}/${newFileName}`,          provider: 'oss',          size,          owner: ctx.state.user.id,        }        const key = encodeURIComponent(file.key)          .replace(/%/g, '')          .slice(-100)        file.url = await uploadLocalFileToOss(file.path, key)        file.url = getFileUrl(file)        const f = await File.create(omit(file, 'path'))        const files = []        files.push(f)        ctx.body = invokeMap(files, 'toJSON')      })      .catch(() => {        throw Boom.badData('大文件分片合并失败,请稍候重试~')      })  },}

总结

本文讲述了大规格文件上传优化的一些做法,总结为以下 4 点:

  1. Blob.slice 将文件切片,并发上传多个切片,所有切片上传后告知服务器合并,实现大文件分片上传;
  2. 原生 XMLHttpRequest 的 onprogress 对切片上传进度的监听,实时获取文件上传进度;
  3. spark-md5 根据文件内容算出文件 MD5,得到文件唯一标识,与文件上传状态绑定;
  4. 分片上传前通过文件 MD5 查询已上传切片列表,上传时只上传未上传过的切片,实现断点续传

小福利:

整理了几百本各类技术电子书和视频资料 ,嘘~,免费 送,私信或者评论【666】自行领取。和小伙伴们建了一个技术交流群,一起探讨技术、分享技术资料,旨在共同学习进步,感兴趣就入我们吧!

408efaf8e7b4c44469a2fc3dfa2b95a5.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/299453.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

你连简单的枚举类都不知道,还敢说自己会Java???滚出我的公司

枚举类型是Java 5中新增的特性&#xff0c;它是一种特殊的数据类型&#xff0c;之所以特殊是因为它既是一种类(class)类型却又比类类型多了些特殊的约束&#xff0c;但是这些约束的存在也造就了枚举类型的简洁性、安全性以及便捷性。当需要定义一组常量时&#xff0c;强烈建议使…

绝对硬核!万物有“理”,科学原来如此有趣!

▲ 点击查看假如在生活中&#xff0c;你不小心将生鸡蛋和熟鸡蛋混在一起了&#xff0c;那么此时你要如何分辨&#xff0c;哪个鸡蛋是生的&#xff0c;哪个是熟的呢&#xff1f;假若你曾学过力学&#xff0c;那你一定能够轻易的分辨这个生熟问题。我们把这两个鸡蛋放在桌上&…

微软输入法2010下载使用-IME2010下载使用

3年前&#xff0c;写过IME2007的安装和使用&#xff0c;在Office 2010 beta开放之后&#xff0c;觉得单独把ime2010单独开放出来比较适合Office 2003/2007的用户群。 1。 依然还是和上次的IME2007提取方式一样&#xff0c;先用7-zip解压Office 2007 beta的exe文件&#xff1a;由…

理论修炼之RabbitMQ,消息队列服务的稳健者

????欢迎点赞 &#xff1a;???? 收藏 ⭐留言 ???? 如有错误敬请指正&#xff0c;赐人玫瑰&#xff0c;手留余香&#xff01;????本文作者&#xff1a;由webmote 原创&#xff0c;首发于 【掘金】????作者格言&#xff1a;生活在于折腾&#xff0c;当你不折…

为什么年龄大了近视还增加_年龄明明一样大,为什么有人长得年轻,有人显老呢?...

台湾不老男神林志颖&#xff0c;始终是十几年前演偶像剧的脸。而德云社郭德纲与他是同龄人却饱经沧桑显得更加老相。这是一件让人哭笑不得的事&#xff0c;也被很多人编成段子。那么为什么有些人看起来年轻有些人却老的很快呢&#xff1f;哪一种更长寿呢&#xff1f;接下来让我…

利用Asp.net中的AJAX制作网页上自动选取开始日期及结束日期的用户自定义控件...

前段时间用过一个酒店入住预约网站&#xff0c;当你点击"入住时间"时会悬浮出一对并列的日历&#xff0c;然后点击左边的日历就能选择入住时间&#xff0c;点击右侧的日历就能自动得到离店时间&#xff0c;当时没有太留意是怎么实现的&#xff0c;现在在做项目时&…

【00】架构型

为什么80%的码农都做不了架构师&#xff1f;>>> 1、架构型&#xff08;archetype&#xff09; 一种形式&#xff0c;所有的东西或多或少地遵守。一种形式&#xff0c;属于同一类型的类都或多或少地遵守&#xff0c;包括属性、链接、方法、插入点、交互。 2、领域无…

SQL进阶提升(疑惑篇order by)-学习sql server2005 step by step(十一)

这篇主要发出两个疑惑&#xff0c;希望有兴趣的人解答&#xff0c;谢谢&#xff01; 1.newid()疑惑 1 create table tb (aa int,bb char(1)) 2 insert tb values(1,A) 3 insert tb values(1,B) 4 insert tb values(1,C) 5 insert tb values(1,D) 6 7 insert tb value…

钟南山团队在患者粪便中检出新冠活病毒,国家卫健委回应!专家:做好这事很重要...

全世界只有3.14 % 的人关注了青少年数学之旅2月13日下午&#xff0c;在广东省人民政府新闻办召开的疫情防控新闻发布会上&#xff0c;钟南山院士团队成员、广州医科大学国家呼吸疾病重点实验室副主任、教授赵金存介绍&#xff0c;该团队在P3实验室中&#xff0c;在中山大学附属…

CSDN《某一程序员竟然吃过shi?让我们走进他的生活,揭露背后的故事》

CSDN《某一程序员竟然吃过屎&#xff1f;我们走进他的生活&#xff0c;揭露背后的故事》 ——————————接下来让我们走进他的故事 到底是什么原因让他吃屎 这是这位程序员的自曝&#xff0c;我很好奇的不是他吃过屎&#xff0c;我在好奇是啥味的~ 接下来我们开始咨询这…

专升本c语言网课听谁的好_都说塑钢泥比玻璃胶好,填缝永不变黑,师傅却说不好用,听谁的?...

新房装修&#xff0c;我一点不想再用玻璃胶来填补缝隙了。像洗手台、淋浴房、厨房水槽这些地方&#xff0c;不管用多贵多好的玻璃胶&#xff0c;最后&#xff0c;它都会变黑发霉。朋友同我说&#xff0c;可以用塑钢泥替代&#xff0c;20年不发霉~他说&#xff0c;现在很多业主家…

技术分享|明源云天际集成开放平台接口中心基于IdentityServer4的鉴权机制

源宝导读&#xff1a;企业数字化生态建设中为解决集成多样性和资源统一管理的痛点引入企业级网关&#xff0c;网关作为资源访问的大门&#xff0c;身份认证鉴权是其业务的重中之重&#xff0c;本文将介绍企业级网关-天际集成开放平台是如何通过IdentityServer4来做到身份认证和…

设计模式--6大原则--单一职责原则

2019独角兽企业重金招聘Python工程师标准>>> 单一职责原则&#xff08;Single Responsibility Principle&#xff09;&#xff0c;简称SRP。 定义&#xff1a; There should never be more than one reason for a class to change. 应该有且仅有一个原因引起类的变更…

法国为何是伟大数学家的摇篮?

全世界只有3.14 % 的人关注了青少年数学之旅笛卡尔、韦达、帕斯卡、费马、拉格朗日、拉普拉斯、达朗贝尔、勒让德、蒙日、彭赛列、柯西、傅里叶、庞加莱、伽罗华、格罗藤迪克…… 这些令无数大学生“闻风丧胆”的数学家&#xff0c;基本上都诞生于十七至二十世纪的法国。解析几…

(转)WCF教程系列(1)-创建第一个WCF程序

作为微软技术.net 3.5的三大核心技术之一的WCF虽然没有WPF美丽的外观但是它却是我们开发分布式程序的利器但是目前关于WCF方面的资料相当稀少希望我的这一系列文章可以帮助大家尽快入门下面先介绍一下我的开发环境吧操作系统&#xff1a;windows vista business版本编译器&…

03 Files

本章提要-----------------------------------------------组成 oracle 的 8 种主要文件(包括 instance 和 database)instance: parameter file, trace file, alert filedatabase: data file, temp file, control file, redo log file, password file简单概述:parameter file: …

TensorFlow发布全新版本,又会带来哪些变革?

全世界只有3.14 % 的人关注了青少年数学之旅经过几年的发展&#xff0c;深度学习方法摧枯拉朽般地超越了传统方法&#xff0c;成为人工智能领域最热门的技术。之后&#xff0c;谷歌、亚马逊、百度、Facebook 纷纷开源了自己的深度学习框架。而支撑AlphaGo的核心技术架构--Tenso…

码农身份得到正式认证

各位同行的兄弟姐妹们&#xff0c;我们的码农&#xff08;新生代农民工&#xff09;身份已经得到国家正式确认&#xff0c;程序员这个职业也正式并到农民工行列了。现在互联网大厂&#xff0c;大部分程序员都是在做着模式化开发工作&#xff0c;已经没有技术含量了&#xff0c;…

面试字节我被String类的问题给问死了!

“” 是怎么连接字符串的&#xff1f;&#xff08;JDK1.7及以上&#xff09; 总结&#xff1a; 使用 “” 连接字符串时&#xff0c;实际上是使用临时创建的StringBuilder对象来辅助完成的。 对于编译时常量&#xff0c;在编译后直接计算出字符串的值&#xff0c;而不会在运行…

加州大学惊现神操作!物理教授用数学论文摆脱400美元交通罚单,却惨被网友大反转.........

全世界只有3.14 % 的人关注了青少年数学之旅“学好数理化&#xff0c;走遍天下都不怕。”这句从上个世纪八十年代流传下来的金句&#xff0c;至今仍然哺育着理工科的莘莘学子。为了让模友们更好的理解这句话&#xff0c;今天就让小天给你们涨涨姿势&#xff0c;见识一下什么是学…