OpenKG 主要关注知识图谱数据(或者称为结构化数据、语义数据、知识库)的开放,广义上 OpenKG 属于开放数据的一种。
关于“开放”的定义,比较好的参考是由国际开放知识基金会 OKFN.ORG(Open Knowledge International)给与的“开放知识”的定义。
下面摘录部分内容如下:
“Open means anyone can freely access, use, modify, and share for any purpose (subject, at most, to requirements that preserve provenance and openness).”
版本 1.1 名词解释
「知识」包含:
-
音乐、电影、书籍等的内容
-
科学、历史、地理或其他的数据
-
政府或其他行政信息
尽管软件显然是开放知识的一个重心内容,但软件在此并不包含在定义内,这是因为以前的工作(比如开源软件)已经较好的陈述了相关问题。
「作品」一词指被传递的知识本身或知识依附的物件。
「作品集」一词指作品的集合。作品集本身应当被视作一份作品。
「许可协议」一词指作品在何种法律授权协议下可被使用。当没有具体的许可协议时,作品应当在满足默认的法律条款(例如,版权许可)下被使用。
定义 一份作品可在满足以下分发条件的情况下被认为是「开放」的:
1. 获取 作品应当能够被完整获取,并且所需的花费应当不超过合理的重制费用 (较好的方案是提供免费的网络下载)。作品本身必须使用方便修改的格式。
备注:这可以被概括为「社会性」的开放, 即不但你应当被允许获取作品,你也应该能够实际获取作品。「完整获取」确保作品不受间接手段限制作品获取,例如,仅允许访问数据库中的某一部分信息。
2.再分发 许可协议不应当限制任何人或组织售卖或分发作品,无论是作品单独本身或者把不同来源的作品包装成一个作品集。 许可协议不应当对此类售卖或分发要求版税或者其他费用。
3.再利用 许可协议必须允许对作品的修改和演绎, 并且允许在满足原始作品条款的前提下对修改和演绎后的作品再分发。
备注:注意这个条款并不禁止「病毒式」或「相同方式共享」的授权,即要求与原作品相同的条款再发布修改的作品。
4.无技术限制 为了执行前述的功能,作品必须使用无技术限制的格式。这一点可通过使用开放数据格式来满足,即使用公开并免费可获取的格式规格,并且该格式规格不存在财务或者其他使用上的限制。
5.署名 许可协议可以要求在再分发或者再利用的过程中对作品的原创者和贡献者署名。如果提出署名要求,那么该要求必须不会增加任何负担。例如, 如果要求署名,那么一份完整的署名名单应该和作品一同提供。
6.完整性 许可协议可以要求修改后的作品在分发时以另一个名字或者版本号来与原始版本作为区分。
7.对任何个人或团体无差别对待 许可协议必须对任何人或者团体无差别对待
备注:为了获得最大限度的开放的好处,差异极大的个人和团体都应当被一视同仁地给予贡献开放知识的权利。因此我们禁止任何开放知识许可协议将任何人排除在外。
备注2: 这一条直接引自OSD (Open Source Definition) 条款5
8.对任何领域的应用无差别对待 许可协议必须不限制任何人在任何领域使用作品。例如,许可协议不可以限制作品在商业或者遗传研究领域的使用。
备注:这一条款的主要意图在于禁止许可协议限制任何开放资料的商业化使用。我们希望商业化用户能够加入这个社区而不是被排除在外。
备注2: 这一条直接引自OSD条款6
9.许可协议的分发 任何可获取作品的人或组织都应当无需额外的附加许可协议而自动享受作品附带的权利。
备注:此条款的意图是禁止以间接方式(例如,签署保密条款)来封闭知识的流通。
10.许可协议不得专属于特定作品集 作品附带的权利应该独立于作品集。如果作品单独从作品集中抽出并且在其相应许可协议下分发,那么任何可获取该作品的人或组织都应该享有作品集中保证的完全一致的作品权利。
备注: 这一条直接引自OSD条款8
11.许可协议不能限制其他作品的分发 许可协议不能设定任何限制来制约与授权作品一同分发的其他作品。例如,许可协议不能要求其他在相同媒介下发布的作品也是开放的。
备注:开放知识的分发者有权做出他们自己的决定。需要注意的这和「相同方式分享」许可协议是类似的,因为这些条款仅适用于单一来源的作品。
备注2: 这一条直接引自OSD条款9
参考文献:
1.「开放知识」的定义 http://opendefinition.org/od/1.1/zh/
OpenKG.CN
中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。
点击阅读原文,进入 OpenKG 博客。