JSON-LD 正式推荐标准2020年7月发布
2020年7月16日,W3C JSON-LD 工作组发布三份正式推荐标准(W3C Recommendation):
-
JSON-LD 1.1 语法(JSON-LD 1.1)定义了一种基于 JSON 的格式来序列化关联数据。该语法的目的是轻松地集成到已经使用 JSON 的部署系统中,并提供从 JSON 到 JSON-LD 的平滑升级路径。它主要支持在基于 Web 的编程环境中使用关联数据,创建可互操作的 Web 服务,并且能够在基于 JSON 的存储引擎中存储关联数据。
-
JSON-LD 1.1 处理算法和 API(JSON-LD 1.1 Processing Algorithms and API)定义了一组用于 JSON-LD 文档编程转换的算法。根据已定义的转换进行重组数据通常会极大地简化其使用。此外,该文档还为开发者提出了一个应用编程接口(API)。
-
JSON-LD 1.1 框架(JSON-LD 1.1 Framing)允许开发人员通过示例查询并强制将特定的树布局添加到 JSON-LD 文档中。
JSON是一种用于表示Web对象的简单语言。链接数据(Linked Data)是一种描述不同文档或网站上的内容的方法。Web资源是使用IRI描述的,通常是可取消引用的实体,可用于查找更多信息,从而创建“知识网络”。JSON-LD旨在成为一种简单的发布方法,不仅可以表达JSON中的链接数据,还可以向现有JSON添加语义。
已经有多种主流语言支持:
- java
- python
- javascript
- PHP等
JSON-LD表示和存储知识
JSON-LD开始是用于表示网页的内容和层次化的嵌套的结构,是一种资料模型。个人不准确的理解,之后这种能力被用来定义语义网络,逐渐延伸到知识图谱应用。
知识图谱的知识,通常有两类表示模型:
- <源实体-关系-目标实体> 模型
- <实体-属性-属性值> 模型
两种都可以表示为三元组,采用图结构存储:
- 节点:储存“实体”,和“属性值”
- 边 :储存“关系”,和“属性”
知识图谱的四种存储格式:
- N-Triples (.nt) :每行一个三元组,实体、关系都是最完整的格式
- Turtle (.ttl) :在开头先定义了前缀,三元组要短很多
- JSON-LD (.json) :即本次发布的标准,包含层次化的可嵌套结构
- RDF/XML (. RDF),或RDFa :全称(RDF attribute),设计提供了一套属性,可以用于在XML(及其方言,也包括HTML)中携带元数据。可以等价表示层次化的可嵌套结构。
可见,利用JSON-LD可以:
- 存储和表示三元组形式的知识,以及多个三元组组成的知识
- 输出为网页的元数据,优化SEO,百度、google都支持
- 支持网页关系的深入搜索,以及基于搜索的推理
进一步,JSON-LD可以作为知识图谱的输入、输出形式,与图数据库一起作为知识计算的载体,承载知识计算。