知识管理系统Data Solution研发日记之一 场景设计与需求列出

在平时开发的过程中,经常会查找一些资料,从网上下载一些网页,压缩格式文件到自己的电脑中,然后阅读。程序有别于其他行业的一个特征是,所有的资料,数据,压缩文件,只用于产生可以工作的代码,这才算达到目的,解决问题。再漂亮的文档,源代码,如果没有解决问题,产生代码,这样的搜索也是失败。一般在解决问题之后,这些文章,也遗落在硬盘里面,像下面的文件这样

image

从技术的角度,来看图中的文件,我是在以下几个问题的解决方法:设置VSS2005使支持通过Internet访问。可是一不小心,看到有用的资料,比如电子书《乔布斯传——神一样的传奇》,也顺便把他们下载到了硬盘中。随着时间的积累,这样的文档形式,技术和非技术的文件会越来越多,而自己通常很懒惰,不想去仔细的把他们整理到一起。

在刚开始参加工作的时候,遇到好的技术资料,会用EverNote软件,规范的整理好

image

这个动作是需要花时间和耐心,我承认随着工作年限的变长,这方面的激情越来越缺乏。

 

再来看另一种形式的数据,片段式的数据,格式因数据源的不同有差异,请看下图

image

这是博客园网站上人才招聘的一则信息,这则信息的要点是,公司名称,职位描述,技术要求,联系方式。通常在上网之后,会把这个网页存到本地硬盘中,以方便查找。随着时间的积累,这样的文档也越来越多。这个例子解释的是,对于零散的,片段式的数据,也需要一种方式整理到一起,以方便查看。

来设计一下找工作的场景,以增加对片段式数据的理解。打开已经设计好的应用程序,运行它,应用程序会自动在人才网站(中华英才网,无忧人才)中搜索合适的公司信息,并且把它存到本机数据库中,大约一杯咖啡的时间,再用写好的程序从本机数据库中读取工作数据,根据情况,适当的发送简历或是打电话。如果还想对公司的情况进行判断,比如我想查一下这个公司的信用记录,是否被网友曾经很严厉的批评过,借助于IT公司速查数据库系统,可以看到这个公司的评价。以这样的情景来找工作,找到合适的机率会高一些。记住,这里面所指的程序,都是已经写好的程序,不需要开程序语言和编译器,这些程序会在后面的章节中展现出来。

 

互联网时代,订阅RSS聚合数据,是一种简单方便的搜集资料的方法。我选择Greate News作为RSS聚合软件

image

Greate News有一个非常优秀的地方是,它的数据库系统是Sql Lite,也就是说,可以用它作为RSS订阅工具,然后再用代码,读取它的有数据库文件到我的文档管理系统中。本来是要完全写一个RSS聚合软件的,虽然不难,但是要做到稳定,好用也不容易,当我发现Greate News的数据库类型时,欣喜若狂。这也让我的知识管理系统,多了一层数据来源,RSS聚合数据。Web 2.0这个名词已经很老了,得到实实在在的技术创新的好处,我看到的就是RSS。

 

再看别外一种情况,在网页中浏览数据,请看下面的图片

image

这是MSN中国的一篇文章,《中国式金融垄断——致温州中小企业“跑路潮”》,我觉得这几个原因分析的不错,于是有Ctrl+C的冲动,但是,这要求我必要开Word或是WordPad文字处理软件,来保存这一段文件,而且还要给出文件名,保存到硬盘中,时间一长,就又回到了第一种情景,大量的文章,技术,非技术的,片段式的,夹杂在一起。于是,我想到网上有一种专门从网页中拷贝数据,然后进入到自定义的程序中。对头,我就是要造出这个程序来,选中需要的文件,点热键,然后这个片段文字,温州老板“跑路”内部原因,就进入到了我的数据库系统中。

 

整理一下,到现在为止,已经提到了三种场景

  • 本地文件,需要导入到本机数据库系统中,以方便查找,编辑。
  • 网页数据,不带格式,一小段数据,需要保存到本机数据库系统中
  • 网页数据,带格式,比如上面提到的找工作的情形,需要有公司简介,职位要求,联系方式,是格式化的数据
  • RSS 聚合数据源 以Sql Lite数据库格式存在

对于本地文件,扩展一下上面的认识和理解,需要对本机文件系统中的任何格式的文件,扫描然后导入到数据库系统中。经常遇到的doc/docx,pdf,pst/ost/eml,htm/mht,txt/rtf,应用程序可以读取这些格式,并导入到数据库中。

这里要提出两点差异化的内容,按照是否可以对数据库中的文档进行编辑,划分出两类的文档管理系统。一种是只能Viewer,只能查看,不能进行编辑,另一种则可以编辑文档。很明显,我这里是扫描文件进入系统,肯定有很多不需要或是杂乱的内容,肯定需要Edit功能。另外,文档数据库系统,一种形式是把文件放在原始的地方,在数据库中中予以引用,另一种是直接把文件存到数据库中,拷贝数据库,就可以完成数据库系统的部署,对于这两者的选择,肯定后者优于前者,比如我要共享我的开发文档给同事,我只需要把我的数据库文件mdf/ldf拷贝给同事就可以,而不需要再对我的电脑进行任何形式的共享。

 

当把文档保存到数据库中后,要在海量的数据库中查找需要的内容,肯定需要搜索功能。数据库选择SQL Server 2005,这样优秀的数据库系统,平时我们都用来存采购单,销售单,在这个知识管理系统中,我用来保存文档,这个文档可以是任何格式的。因为SQL Server 内置了全文搜索,所以保存为varbinary(max)格式。在Google中找到的精准的描述是:Store the document in a varbinary instead,not ntext,image to use build-in full text search。这是依照后期的需求,对文档进行搜索而做的改变。关于SQL Server的全文搜索,可以参考这本书《Apress.Pro.Full-Text.Search.in.SQL.Server.2008》,这个知识点在后面的文章中会有详细解释。SQL Server的Product Sample中也有一个ItemFinder可以参考。

 

最后来看一下这个软件的目标群体。一开始我想到的是给自己整理文件用的,后来扩展到整理任何形式的数据。这样一来,喜欢搜索资料和数据的朋友,肯定会喜欢这个软件,既节省硬盘空间,又很有条理和逻辑的归纳数据。我一开始出来工作时,把做好的网站给客户之前,还要先输入一些文章,数据到系统中,以让网站的内容丰满,页面漂亮,这样一说,这个软件也适合网站编辑。我那时有一个工作项就是去别人的网站,比如东莞阳光网(sun0769.com)拷贝数据到客户的网站中,现有有这个软件系统了,设置好目标网站和抓取规则,程序后台自动运行,完全可以留更多的时间,做更有意义的内容编辑工作。再扩大一下目标群体,比如我有一个朋友,喜欢读小书,特别是最新的网络小说,可以通过这个程序,自动抓取最新的小说(起点小说网)到本机数据库系统中,通过导出功能,下载到手机中。这样可以省去了手工操作的时间。最后,所有需要对数据和文档进行归纳整理的朋友,都可以从这个软件系统中获益,它对数据的编辑整理能力,可以让你节省大量的时间和精力。本来是以编辑数据,资料Data为主的软件,经过演化,数据就是知识Knowledge,所以这个系列的软件就叫知识管理系统Data Solution。下图是组件之一Data Loader的主界面

image

 

在博客园看到一篇很好的文章,介绍知识管理系统VS文档管理系统的区别,其中有一个表格,借用一下

image

 

这里还要解释下,为什么没有选择SharePoint作为文档管理系统。SharePoint是个优秀的平台,如果要把我的目标架设在它的既定的架构上,需要花很多精力和时间去研究Sharepoint,这在后面的扩展部分,会提到Data Solution与SharePoint集成,但是,现在是我需要的知识管理系统,不单指文档,还有片段式数据。所以在项目决策时,没有考虑用SharePoint作为基础的框架和平台。

 

希望能给你的工作,学习带来帮助。

转载于:https://www.cnblogs.com/JamesLi2015/archive/2011/10/24/2222270.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/275236.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

shields 徽标_我们如何准确地记住著名徽标的特征和颜色?

shields 徽标The logos of global corporations like Apple, Starbucks, Adidas, and IKEA are designed to create instant brand associations in the minds of billions who see them every day. But how accurately can we remember the features and colors of these famo…

面了三次字节,他的一些感悟

大家好,我是若川。最近组织了源码共读活动,感兴趣的可以加我微信 ruochuan12 参与,已进行了三个多月,大家一起交流学习,共同进步。今天分享一篇小K投稿的字节面试记录,这是他第三次面字节了,之前…

解决Wireshark安装Npcap组件失败

2019独角兽企业重金招聘Python工程师标准>>> 解决Wireshark安装Npcap组件失败 从Wireshark 3.0开始,Npcap取代Winpcap组件,成为Wireshark默认的网卡核心驱动。由于该组件属于驱动程序,所以安装时候容易被杀毒/防火墙软件拦截&…

adobe清理工具_Adobe终于通过其新的渐变工具实现了这一点-UX评论

adobe清理工具的Photoshop (Photoshop) UX:用户体验: At first glance, the UX looks okay; it’s pretty clear. The user gets to know how to use this tool right away. The color palette is located above, and the gradient down below. The diamond betwee…

新手向:前端程序员必学基本技能——调试JS代码

1前言大家好,我是若川。最近组织了源码共读活动,感兴趣的可以加我微信 ruochuan12 参与,已进行三个月了,大家一起交流学习,共同进步。想学源码,极力推荐之前我写的《学习源码整体架构系列》 包含jQuery、un…

iOS开发ApplePay的介绍与实现

1、Apple Pay的介绍 Apple Pay官方1.1 Apple Pay概念 Apple Pay,简单来说, 就是一种移动支付方式。通过Touch ID/ Passcode,用户可使用存储在iPhone 6, 6p等之后的新设备上的信用卡和借记卡支付证书来授权支付; 它是苹果公司在2014苹果秋季新…

mes建设指南_给予和接受建设性批评的设计师指南

mes建设指南Constructive criticism, or more plainly, feedback, plays a crucial role in a designer’s job. Design is an iterative process, so we are often either asking for feedback on our own work or dishing it out to a fellow designer.建设性的批评&#xff…

面试官:请实现一个通用函数把 callback 转成 promise

1. 前言大家好,我是若川。最近组织了源码共读活动,感兴趣的可以加我微信 ruochuan12 参与,或者在公众号:若川视野,回复"源码"参与,每周大家一起学习200行左右的源码,共同进步。已进行…

java中filter的用法

filter过滤器主要使用于前台向后台传递数据是的过滤操作。程度很简单就不说明了,直接给几个已经写好的代码: 一、使浏览器不缓存页面的过滤器 Java代码 import javax.servlet.*;import javax.servlet.http.HttpServletResponse;import java.io.IOExcept…

open-falcon_NASA在Falcon 9上带回了蠕虫-其背后的故事是什么?

open-falconYes, that’s right. The classic NASA “worm” logo is back! An image of the revived NASA worm logo was released on Twitter by NASA Administrator Jim Bridenstine as well as press release on the NASA.gov website. NASA explained that original NASA …

听说你对 ES6 class 类还不是很了解

大家好,我是若川。最近组织了源码共读活动,感兴趣的可以加我微信 ruochuan12 参与。前言在ES5中是原型函数,到了ES6中出现了"类"的概念。等同于是ES5的语法糖,大大提升了编写代码的速度,本文只讲一些常用的&…

一篇文章带你搞懂前端面试技巧及进阶路线

大家好,我是若川。最近有很多朋友给我后台留言:自己投了不少简历,但是收到的面试邀请却特别少;好不容易收到了大厂的面试邀请,但由于对面试流程不清楚,准备的特别不充分,结果也挂了;…

小屏幕 ui设计_UI设计基础:屏幕

小屏幕 ui设计重点 (Top highlight)第4部分 (Part 4) Welcome to the fourth part of the UI Design basics. This time we’ll cover the screens you’ll likely design for. This is also a part of the free chapters from Designing User Interfaces.欢迎使用UI设计基础知…

RabbitMQ指南之四:路由(Routing)和直连交换机(Direct Exchange)

在上一章中,我们构建了一个简单的日志系统,我们可以把消息广播给很多的消费者。在本章中我们将增加一个特性:我们可以订阅这些信息中的一些信息。例如,我们希望只将error级别的错误存储到硬盘中,同时可以将所有级别&am…

不用任何插件实现 WordPress 的彩色标签云

侧边栏的标签云(Tag Cloud)一直是 WordPress 2.3 以后的内置功能,一般直接调用函数wp_tag_cloud 或者在 Widgets 里开启即可,但是默认的全部是一个颜色,只是大小不一样,很是不顺眼,虽然可以用 S…

随时随地能写代码, vscode.dev 出手了

大家好,我是若川。最近组织了源码共读活动,感兴趣的可以加我微信 ruochuan12 参与。今天偶然看到了 VSCode 官方发布了一条激动人心的 Twitter,vscode.dev[1] 域名上线了!image-20211021211915942新的域名 vscode.dev[2] 它是一个…

七种主流设计风格_您是哪种设计风格?

七种主流设计风格重点 (Top highlight)I had an idea for another mindblowing test, so here it is. Since you guys liked the first one so much, and I got so many nice, funny responses and private messages on how accurate it actually was, I thought you will prob…

React 18 Beta 来了

大家好,我是若川。最近组织了源码共读活动,感兴趣的可以加我微信 ruochuan12 参与,目前近3000人参与。经过「React18工作组」几个月工作,11月16日v18终于从Alpha版本更新到Beta版本。本文会解释:这次更新带来的变化对开…

osg着色语言着色_探索数字着色

osg着色语言着色Learn how to colorize icons with your NounPro subscription and Adobe Illustrator.了解如何使用NounPro订阅和Adobe Illustrator为图标着色。 For those who want to level up their black and white Noun Project icons with a splash of color, unlockin…

CSS3实践之路(一):CSS3之我观

CSS 的英文全称Cascading Style Sheets,中文意思是级联样式表,通过设立样式表,可以统一地控制HMTL中各DOM元素的显示属性。级联样式表可以使人更能有效地控制网页外观。使用级联样式表,可以扩充精确指定网页元素位置,外观以及创建…