日常吐槽
前段时间跟同事聊天,同事洗脑了一个新的(扎心的)世界观,“人生分三个阶段,20岁时承认父母很平庸,30岁时承认自己很平庸,40岁时承认孩子很平庸”。这是这位同事在孩子学而思考试后的心得体会,他的年龄请对号入座。我正处在承认自己很平庸的路上肆意奔跑。不过,不光是什么年龄都有权对现实说不。(封面一般是我最近喜欢的电影)
来源
工程师嘛,目的性一般比较强。肯定是看着哪里不爽了,所以想优化方案。
之所以会有实现Excel文件自动合并的想法,是部门一百多人,每次统计个人意愿,体检信息等内容的时候,都是一个Excel模板,大家修改自己的那一行,然后邮件或者丢到网盘里面,最后一个人打开每个文件要ctrl C+ctrl V把大家的内容合并到一起,这种重复工作毫无意义。
分析如何实现
- 工具:Matlab
- 实现效果:最好能傻瓜式操作,最好能有交互窗口,进度条等,这样可以提升用户体验。
- 实现思路:
1、对话框提示用户输入需要合并文件路径
2、对话框提示用户输入要合并的sheet表和范围(比如A1:C3)
3、将路径内的文件和范围写入到存储变量中,这个过程可能文件较多,最好有个进度条
4、对话框提示用户保存的文件路径和文件名
5、将数据依次保存到指定文件中
6、保存完成后弹出对话框提示用户完成合并
另外程序需要处理用户输入的非法值,比如用户在打开对话框中并没有点确定而是点了取消,程序最好能提示报错。
代码实现
clear
clc
%--- 弹出对话框提示用户选择要合并文件的路径Path = uigetdir('','选择要合并文件路径');%使用uigetdir调取路径
%判断用户是选择了路径还是点了取消
if Path == 0msgbox('路径选择无效,请重新运行程序','错误','error');%如果用户点了取消,系统默认会传递给path为0,这时弹出对话框提示选择错误,点击确认程序退出
else%---去除路径内的无效文件FileList = dir(Path);%使用dir获取路径下的文件列表NaN_data_index = find([FileList.bytes]==0);%使用find查找文件列表中空文件FileList(NaN_data_index) = [];%将空文件从文件列表中删除%---读取文件%提示用户输入excel表格sheet位置及内容范围trydlgPrompt= {'请输入要合并的表格位置','请输入要合并的范围'}; %两行提示信息dlgTitle='选择合并内容';%对话框标题dlgDims=[1 20;1 25];%输入文本框的尺寸dlgDefinput={'1','A1:H3'};%默认值sheet_num = inputdlg(dlgPrompt,dlgTitle,dlgDims,dlgDefinput);catchwarndlg('输入错误')end%循环读取文件内容,设置进度条m=0;%初始化,循环用file_path = [];%初始化,后面所有文件的路径放在这里面data_raw{length(FileList),1} = [];%初始化,后面读取的数据放在这里面h_waitbar=waitbar(m/length(FileList),'开始读取');%进度条for m = 1:length(FileList)str_waitbar = ['文件读取中,已完成:',num2str(m/length(FileList)*100),'%'];%进度条提示语句waitbar(m/length(FileList),h_waitbar,str_waitbar);%进度条更新file_path = fullfile(Path,FileList(m).name);%合并路径和文件名,便于后面文件读取[num,text,data] = xlsread(file_path,str2num(sheet_num{1}),sheet_num{2});%读取文件data_raw{m,1} = data;%循环一次,把data赋值一次endclose(h_waitbar);%关闭进度条%---写入文件 try[save_name,save_path] = uiputfile('merge_excel_.xlsx');%提示选择保存的路径和文件名catchwarndlg('输入错误');end%得到用户合并文件的行数position_num=split(sheet_num{2},':');%用冒号分割字符串,分别得到一个起点一个终点,如A1;B12re_pattern='[0-9]*';%正则表达式,把数字全部提出start_num=regexp(position_num{1},re_pattern,'match');%把起点的数字提出来,如1;stop_num=regexp(position_num{2},re_pattern,'match');%把终点的数字提出来,如12;range_sep=str2num(stop_num{1})-str2num(start_num{1})+1;%把字符串转换成数字,相减得间距%写入操作range_init = 1;%初始化range = 'A1';%初始化for n =1:length(FileList)status = xlswrite(fullfile(save_path,save_name),data_raw{n},1,range);%写入文件的sheet表默认是1status_num(n,1) = status;range = sprintf('A%d',range_init+n*range_sep);%移动写入的位置endnum_success=size(status_num);if num_success(1) == length(FileList)%判断是否已经把全部文件写完str_success = sprintf('合并完成,共合并%d份文件,成功%d 份',length(FileList),sum(status_num));%显示的文本内容msgbox(str_success)end
clear
clc
实现效果
excel 原文件是这样的
把3行进行合并,合并后效果
代码讲解
其实程序的注释,我已经写的很详细,如果还有不清楚的可以看下matlab帮助。这里就对写程序的时候一些废了点时间的地方说下:
1、我不知道我的文件夹里看着是有3个excel文件,但是dir读取后确实5个,其中2个是空的。
windows的实际显示效果
读取后FileList的效果
所以加了一段用文件
%---去除路径内的无效文件
FileList = dir(Path);%使用dir获取路径下的文件列表
NaN_data_index = find([FileList.bytes]==0);%使用find查找文件列表中空文件
FileList(NaN_data_index) = [];%将空文件从文件列表中删除
2、在写入到合并Excel文件的时候需要一个类似指针的东西,不断将写入起点下移,这样避免后面写入文件覆盖前面的。但是下移的量需要用‘A1:H13’这个字符串取得,比如这里13-1=12,这个下移量就是12。在这里我处理的方式是先用冒号将字符串分隔,然后用正则表达式分别取出两个字符串的数字部分,最后实现这两个数字的相减得到下移量。关于正则表达式需要自己查下,还是很有必要了解下的,之所以用正则表达式,而不是硬生生的把前面的A或者H砍掉,是因为用户可能会输入大的行数,比如‘D5:AC123’这时候字母和数字的个数是不定的,无法靠字符串的位来操作。
%得到用户合并文件的行数position_num=split(sheet_num{2},':');%用冒号分割字符串,分别得到一个起点一个终点,如A1;B12re_pattern='[0-9]*';%正则表达式,把数字全部提出start_num=regexp(position_num{1},re_pattern,'match');%把起点的数字提出来,如1;stop_num=regexp(position_num{2},re_pattern,'match');%把终点的数字提出来,如12;range_sep=str2num(stop_num{1})-str2num(start_num{1})+1;%把字符串转换成数字,相减得间距
不完美
最后想说的是程序是不完美的,为什么暂时先不改了,主要是懒
1、对于用户的异常操作,比如应该输入‘A3:H3’,输入成'A:H',该点确认却点了取消等等(最不可靠的就是人类),虽然程序里尝试了if else和try catch,但不是为每个步骤都写了。
2、把文件全部读取到data,最后再一股脑儿都写入,我觉得效率有点低,大文件的话data会很大,占用过多内存。可以读取一个写入一个,这样data数据量有限。其实也好改只需要把写入的操作放入读取的for循环中。
3、另外写入的操作没有设置进度条。(其实解决了第二个,这个也就不是问题了)。
4、完成这个操作,其实也不算是把合并的工作全部完成,还需要把表头和序号填充好。刚兴趣的自己实践操作下,实现还是很简单的。
5、当然前台小妹一般才不装matlab,为了方便更多人使用,其实可以用matlab生成可执行exe文件,matlab Runtime了解下。网上教程很多,感兴趣的可以看看。
6、其他的欢迎指正探讨。有问题可以发我邮箱 283522085@qq.com