一、说明
在机器学习中,本体越来越多地用于提供基于相似性分析和场景知识的 ML 模型。
在传统的基于标签的定义中,对象往往是孤立的,可扩展性差,存在重复的可能性,对象之间的关系无法体现。在基于本体的定义中,对象不再孤立存在,场景搜索、本体融合、本体推荐等功能也可以通过关系标注来实现。
本体首先由世界上第一个开源多感官训练数据平台Xtreme1引入,用于从各种模型需求中抽象出AI问题的定义。它可以复用和扩展,以构建AI算法的知识库,从而加速模型开发。
二、什么是本体?
本体论是一种描述世界上一切事物的结构化方式,包括三个要素:
类 — 表示表示实例的类型、标签或抽象类;
关系 ― 表示描述之间的关系,可以是有向图或无向图。例如,在自动驾驶场景中,汽车可能有“平行”、“超车”等。关系;
属性 ― 表示节点或关系的属性。例如,“汽车”的属性可能包括“颜色”、“车窗打开/关闭”等,而“行人”的属性可能包括他们的“性别”或“口罩开/关”。
自动驾驶是人工智能公司和汽车行业最具前途和最具挑战性的研究课题之一。目前,主流自动驾驶汽车都配备了一些高灵敏度的传感器,如摄像头、激光雷达和雷达设备。尽管这些传感器可能已经能够准确识别特定物体,例如汽车或禁止转弯的交通标志,但如果不全面了解数据场景,车辆就无法理解驾驶环境的含义。因此,需要一种机器友好的知识表示方法来弥合感知驾驶环境和处理知识之间的差距。
三、本体在数据管理中的作用是什么?
在本体中心定义类和属性后,用户可以轻松搜索“Chage Lane”等场景。本体中心还可以根据类、属性和关系之间的规则推断出新的注释。随着本体数据量的增加,本体中心还可以推荐不同领域中性能更好的本体模型。
3.1 场景搜索
方案搜索解决了如何定义和查找特定方案中出现的数据的问题。
传统上,当我们通过标签层次结构定义数据来管理数据时,会出现一个问题,即数据标签过于笼统,无法查明数据场景中的特定问题。同时,在传统的基于标签的定义中,对象过于孤立,无法避免重复或显示与其他对象的连接。
方案搜索功能通过类和属性定义对象,通过对象之间的关系和属性定义方案。很容易定义和查找变道、停车、转弯和跑道入侵等场景。
3.2 本体论推理
在注释和质量控制中,可以根据属性、类和关系之间的规则推断出新的标记结果或有问题的注释。例如,在自动驾驶场景中,红灯、绿灯和黄灯属于同一个红绿灯。如果红灯的状态是“亮”,那么可以推断绿灯和黄灯肯定没有亮起。如果红灯和绿灯都标记为“开”,则标记结果可能会出现问题。
3.3 本体消歧
在注释中,在同一数据批中遇到不同的定义是很常见的。本体融合可以帮助用户解决这些不一致的问题。
3.4 本体推荐
在开源 Xtreme1 的 SaaS 版本中,当数据累积到 PB 级时,可以为各个领域的常见模型需求提供更高性能的本体模型,以促进定制解决方案。
安全自动驾驶的核心本体
四、Xtreme1 v0.5.5 的亮点:
·新本体中心旨在对本体和数据进行跨数据集管理,并基于场景完善行业模板和解决方案进行模型训练;
·本体中心中CRUD本体的分类和分类;
·数据集中的类与本体中心中的类之间的本体融合;
·在本体中心和数据集中导出和导入本体;
·从本体中心复制类和/或分类;
·数据集和本体中类的推送/拉取;
·跨数据集搜索相同数据类型的方案;
·将搜索结果导出为 JSON 文件或新数据集。
Xtreme1 未来版本中的计划功能包括:
·注释关系并按类和场景进行搜索;
·按类、关系和/或属性进行属性搜索(在方案搜索中)。
网站 |Xtreme1.io
文档 |docs.xtreme1.io
GitHub 存储库 |github.com/xtreme1.io/xtreme1
松弛 |xtreme1io.slack.com
五、参考:
安全自动驾驶的核心本体:https://ceur-ws.org/Vol-1486/paper_9.pdf