今天突然接到一个工作,要把两个存储在.xls的主体信息表,除重后合并成一个主体信息表,并且补充主体类型和所在县区这两列信息。
完成这项工作的方法有很多,如果信息表中的信息量不大的话,手工处理一下也行,如果信息量大的话,还是由电脑来处理比较好,比如用vba写代码来合并,不过我更喜欢用JavaScript来完成。
一、思路
(一)界面设计
用HTML设计页面,放置两个textarea
其中一个textarea(ID=ta1)用来存放要处理的原始企业信息
另一个textarea(ID=ta2)用来存放处理好的企业信息。
代码如下:
<!doctype html>
<html><head><title>文本筛选合并</title><style type="text/css">* {padding: 0px;margin: 0px;}html,body {overflow-y: hidden;}.ta_div {border: 1px solid #CCCCCC;overflow: auto;position: relative;}.ta_div textarea {resize: none;background: none repeat scroll 0 0 transparent;border: 1 solid black;width: 99%;height: 200px;overflow-y: scroll;//position: absolute;left: 0px;top: 0px;z-index: 2;font-size: 18px;white-space: pre-wrap;word-wrap: break-word;word-break: break-all;}p {text-align:center; color:purple}</style>
</head><body><table style="width:100%; borderspacing:0; cellpadding:0;"><tr><td style="width:49%"><div class="ta_div"><p>原始数据</p><textarea id="ta1" onscroll="ta1_scroll()" oninput="t()" onpropertychange="t()">请输入原始数据</textarea></div></td><td style="width:49%"><div class="ta_div"><p>整理后的数据</p><textarea id="ta2" onscroll="ta2_scroll()" oninput="textchange()" onpropertychange="textchange()">合并后的数据</textarea></div></td></tr></table> </body>
</html>
(二)信息处理
1.从ta1读取原始主体名称信息
2.对信息进行清洗
- 用正则表达式删除信息首尾空格
- 从excel复制过来信息中有时包含双引号要删除
- 对于多个连续的换行符(\n\n)要换成一个换行符(\n)
var v = ta1.value.trim();//去除首尾空格v = v.replace(/\"/g, ""); //去除半角双引号v = v.replace(/\n[\s]*\n/g, "\n"); //去除多余的\n,避免空行
3.如果信息长度为0,提示输入信息并结束处理
4.用split方法将其按换行符(\n)转换为数组a
var a = v.split('\n');
5.使用 es6 的 Set 和 Array.from 方法从数组a 生成去重后的数组b
var b = Array.from(new Set([...a]));
6.对数组b中的信息增加类型和所在县区信息
- 增加类型信息,主体类型分为三类:合作社、家庭农场、公司,搜索数组b中主体名称,如果包含合作社、家庭农场,就为其增加相应类型,否则增加"公司"
- 增加县区信息搜索数组b中企业名称,如果包含县区名称,就为其增加相应的县区信息,否则增加"*未知"
function addType(n)
{//补充类型var a = ['合作社','家庭农场','公司'];var j;for (j=0; j < a.length-1; j++ ){if (-1 != n.indexOf(a[j])){break;}}return '\t' + a[j];
} //addType()function addArea(n)
{//补充所在县(区)var a = ['金城江','宜州','罗城','环江','南丹','天峨','东兰','巴马','凤山','都安','大化','*未知'];var j;for (j=0; j < a.length-1; j++ ){if (-1 != n.indexOf(a[j])){break;}}return '\t' + a[j];
} //addArea() function addData(a)
{//追加信息for (var i=0; i < a.length; i++){a[i] += addType(a[i]); //补充类型a[i] += addArea(a[i]); //补充所在县(区)}
} //addData(a)
7.利用join方法将数组b用换行符(\n)连接起来,存储到ta2中。
document.getElementById("ta2").value = b.join('\n');
二、运行效果
三、完整的代码
<!doctype html>
<html><head><title>文本筛选合并</title><style type="text/css">* {padding: 0px;margin: 0px;}html,body {overflow-y: hidden;}.ta_div {border: 1px solid #CCCCCC;overflow: auto;position: relative;}.ta_div textarea {resize: none;background: none repeat scroll 0 0 transparent;border: 0 none;width: 100%;height: 200px;overflow-y: scroll;//position: absolute;left: 0px;top: 0px;z-index: 2;font-size: 18px;white-space: pre-wrap;word-wrap: break-word;word-break: break-all;}p {text-align:center; color:purple}</style>
</head><body><table style="width:100%"><tr><td style="width:50%"><div class="ta_div"><p>原始数据</p><textarea id="ta1" onscroll="ta1_scroll()" oninput="t()" onpropertychange="t()">请输入原始数据</textarea></div></td><td style="width:50%"><div class="ta_div"><p>整理后的数据</p><textarea id="ta2" onscroll="ta2_scroll()" oninput="textchange()" onpropertychange="textchange()">合并后的数据</textarea></div></td></tr></table>
<script>String.prototype.trim = function()
{//功能:去除首尾空格return this.replace(/(^\s*)|(\s*$)/g, ""); /*var t = this.replace(/(^\s*)|(\s*$)/g, ""); return t =t.replace(/(^ *)|( *$)/g, ""); */
}var ta1 = document.getElementById("ta1");function t()
{var v = ta1.value.trim();if ('' == v){alert('请先输入原始数据');}v = v.replacereplace(/\"/g, ""); //去除半角双引号//v = v.replace('','\n'a = v.split('\n');b = Array.from(new Set([...a]));document.getElementById("ta2").value = b.join('\n');
}
</script>
</body>
</html>