Atlas是一组可伸缩和可扩展的核心基础治理服务——使企业能够有效和高效地满足Hadoop中的遵从性需求,并允许与整个企业数据生态系统进行集成。
Apache Atlas为组织提供开放的元数据管理和治理能力,以建立其数据资产的目录,对这些资产进行分类和管理,并为数据科学家、分析师和数据治理团队提供围绕这些数据资产的协作能力。
特征
元数据类型和实例
各种Hadoop和非Hadoop元数据的预定义类型
为要管理的元数据定义新类型的能力
类型可以具有原始属性、复杂属性、对象引用;可以从其他类型继承。
类型的实例,称为实体,捕获元数据对象细节及其关系
REST API与类型和实例一起工作更容易集成
分类
动态创建分类的能力,如PII、ExIPRESION、DATAAL质量、敏感
分类可以包括属性,如EXPIRES_ON分类中的expiry_date 属性
实体可以与多个分类相关联,从而能够更容易地发现和安全执行。
通过谱系传播分类-自动确保分类跟随数据经过各种处理
搜索/发现
通过类型、分类、属性值或自由文本搜索实体的直观UI
丰富的 REST API 实现复杂的标准搜索
搜索实体的SQL类查询语言——领域特定语言(DSL)
更多Apache相关技术文章,请访问Apache使用教程栏目进行学习!