论文浅尝 | DI刊发的那些有关Knowledge Graph的论文

本文转载自公众号:数据智能英文刊


知识图谱被称为人工智能的基石,它的前身是语义网,由谷歌在2012年率先提出,用于改善自身的搜索业务。Data Intelligence执行主编、东南大学计算机科学与技术学院漆桂林教授这样定义知识图谱:知识图谱是人工智能中研究如何将人类的知识转化为图,从而方便计算机存储并用于推理,计算机可以通过知识图谱实现从感知智能到认知智能的飞跃,支持智能问答、辅助决策、智能分析等应用。DI编委、同济大学特聘研究员王昊奋老师是知识图谱方面的专家,曾深入参与过IBM Watson系统的研发工作,他的定义是知识图谱旨在描述真实世界中存在的各种实体或概念。其中,每个实体或概念用一个全局唯一确定的ID来标识,称为它们的标识符。每个属性-值对用来刻画实体的内在特性,而关系用来连接两个实体,刻画它们之间的关联。

 知识图谱是DI的核心主题之一,创刊以来,已刊发了大量相关论文。我们特别对已出版的知识图谱主题论文进行了整理,并对每篇论文的核心内容做了中文简述,以飨关心和支持DI发展的专家和读者。

 衷心希望DI刊发的文章能启发您的思想,助力您的科研!

 注:点击二维码可直达文章全文页面。

1 Constructing and Cleaning Identity Graphs in the LOD Cloud

Citation: J. Raad, W. Beek, F. van Harmelen, J. Wielemaker, N. Pernelle & F. Saïs. Constructing and cleaning identity graphs in the LOD cloud. Data Intelligence 2(2020), 323–352. https://doi.org/10.1162/dint_a_00057

简述:作者之前的工作展示过一张包含超过5亿条明确含有owl:sameAs语句和350亿条暗含owl:sameAs语句的等价关系图谱(identity graph)。作者提出了一个可扩展的方法,可自动计算每一条语句的错误程度。在本文中,作者生成了整张等价关系图谱的子图,这些子图都包含一定程度的错误数据。本文结论是尽管语义网中包含了许多错误的owl:sameAs语句,语义网上的数据仍是可用的,同时可把因错误使用owl:sameAs语句带来的负面影响降到最低。本文作者之一的Frank van Harmelen教授是荷兰阿姆斯特丹自由大学计算机科学系教授,是世界顶级的语义网技术专家。

2 Virtual Knowledge Graphs: An Overview of Systems and Use Cases

Citation: G. Xiao, L. Ding, B. Cogrel, & D. Calvanese. Virtual knowledge graphs: An overview of systems and use cases. Data Intelligence 1(2019), 201-223. https://doi.org/10.1162/dint_a_00011

简述:虚拟知识图谱技术(VKG)也被称为基于本体的数据访问,本文详细总结了VKG的软件生态圈和应用案例。本文第一作者意大利博尔扎诺自由大学计算机学院Guohui Xiao (肖国辉) 博士,是当今最先进的VKG系统Ontop 研究团队的负责人,作者Diego Calvanese教授是知识图谱领域的国际知名专家。


3 Learning to Complete Knowledge Graphs with Deep Sequential Models

Citation: L. Guo, Q. Zhang, W. Hu, Z. Sun, & Y. Qu. Learning to complete knowledge graphs with deep sequential models. Data Intelligence 1(2019), 224-243. https://doi.org/10.1162/dint_a_00016

简述:本文提出了一种新的知识图谱补全方法,通过扩展多层RNN将知识图谱建模成长度为3的序列,同时提出了3种不同策略来集成RNN单元,并通过实验展示了不同特点。本文通讯作者是南京大学计算机科学与技术系胡伟副教授。

4 KnowID: An Architecture for Efficient Knowledge-Driven Information and Data Access

Citation: P.R. Fillottrani & C.M. Keet. KnowID: An architecture for efficient knowledge-driven information and data access. Data Intelligence 2(2020), 487–512. doi: 10.1162/dint_a_00060

简述:本文介绍了在信息管理系统中知识-数据转换的一种架构,KnowID。该架构提出了在实体-联系模型和关系模型之间转换的新的规则。和其他基于本体的数据访问方法相比,KnowID的突出特点是Runtime 运行可以利用在信息系统设计中经常使用的封闭世界假定思想(closed world assumption),同时利用路径查询提高SQL查询效率。

5 AMiner: Search and Mining of Academic Social Networks

Citation: H. Wan, Y. Zhang, J. Zhang, & J. Tang. AMiner: Search and mining of academic social networks. Data Intelligence 1(2019), 58-76.https://doi.org/10.1162/dint_a_00006

简述:AMiner是一个新型的由作者、论文、会议、期刊以及机构所组成的大规模在线学术搜索与挖掘系统。本文第一作者是北京交通大学万怀宇副教授,通讯作者唐杰教授是国内知名学者、清华大学计算机科学与技术系教授,国家杰出青年科学基金获得者。

6 XLORE2: Large-scale Cross-lingual Knowledge Graph Construction and Application

Citation: H. Jin, C. Li, J. Zhang, L. Hou, J. Li, & P. Zhang. XLORE2: Large-scale cross-lingual knowledge graph construction and application. Data Intelligence 1(2019), 77-98. https://doi.org/10.1162/dint_a_00003

简述:本文介绍了基于维基百科和百度百科自动构建的XLORE升级版的构建和应用。本文为清华大学计算机科学与技术系李涓子教授团队的最新研究成果。李涓子教授目前是中国中文信息学会语言与知识计算专委会主任、清华-青岛数据科学研究院科技大数据研究中心主任。

7 CN-DBpedia2: An Extraction and Verification Framework for Enriching Chinese Encyclopedia Knowledge Base

Citation: B. Xu, J. Liang, C. Xie, B. Liang, L. Chen,& Y. Xiao. CN-DBpedia2: An extraction and verification framework for enriching Chinese encyclopedia knowledge base. Data Intelligence 1(2019), 244-261. https://doi.org/10.1162/dint_a_00017

简述:本文提出了一种抽取加验证的知识库增强框架。相比CN-DBpedia,新版本的知识库(CN-DBpedia2)增加了大量从实体描述文本中抽取出来的高置信度的事实。本文通讯作者肖仰华是复旦大学计算机学院教授、博导、青年973首席科学家。

8 Microsoft Concept Graph: Mining Semantic Concepts for Short Text Understanding

Citation: L. Ji, Y. Wang, B. Shi, D. Zhang, Z. Wang & J. Yan. Microsoft concept graph: Mining semantic concepts for short text understanding. Data Intelligence 1(2019), 262-294. https://doi.org/10.1162/dint_a_00013

简述:本文详述了大型概念知识图谱系统——微软知识图谱 (Microsoft Concept Graph) 的构建实践。通讯作者为微软亚洲研究院纪蕾研究员。

9 Constructing a Scene-Based Knowledge System for E-Commerce Industries: Business Analysis and Challenges

Citation: M. Fu, Q. Chen, W. Lin, P. Wang, & W. Zhang. Constructing a scene-based knowledge system for e-commerce industries: Business analysis andchallenges. Data Intelligence 1(2019), 295-308. https://doi.org/10.1162/dint_a_00012

简述:本文详述了阿里巴巴集团构建的基于场景的知识系统,从商业角度分析该系统的优势和面临的挑战。本文通讯作者为阿里巴巴集团付敏高级工程师。

10 Knowledge Graph Construction and Applications for Web Search and Beyond

Citation: P. Wang, H. Jiang, J. Xu & Q. Zhang. Knowledge graph construction and applications for Web search and beyond. Data Intelligence 1(2019), 345-361. https://doi.org/10.1162/dint_a_00019

简述:本文介绍了搜狗公司构建大规模多源数据知识图谱的案例。作者均来自于搜狗公司。

11 GeoLink Data Set: A Complex Alignment Benchmark from Real-world Ontology

Citation: L. Zhou, M. Cheatham, A. Krisnadhi & P. Hitzler.  GeoLink data set: A complex alignment benchmark from real-world ontology. Data Intelligence 2(2020), 353-378. https://doi.org/10.1162/dint_a_00054

简述:本文构建了用于本体匹配的来自于GeoLink 项目的真实数据集。本文第一作者来自于堪萨斯大学计算机系Pascal Hitzler教授团队。Pascal Hitzler教授是语义网领域国际知名学者,Semantic Web 期刊的创刊主编(Founding Editor-in-Chief) 。

12 The Computer Science Ontology: A Comprehensive Automatically-Generated Taxonomy of Research Areas

Citation: A. A. Salatino, T. Thanapalasingam, A. Mannocci, A. Birukou, F.Osborne & E. Motta. The computer science ontology: A comprehensive automatically-generated taxonomy of research areas. Data Intelligence 2(2020), 379-416. https://doi.org/dint_a_00055

简述:本文详述了计算机科学本体(Computer Science Ontology)的自动构建过程。该本体包括1.4万个主题,12.2万条语义关系。本文通讯作者Angelo A. Salatino是英国开放大学知识媒体研究所的教授,FrancescoOsborne是语义网领域的国际知名青年学者。

13 Refining Linked Data with Games with a Purpose

Citation: I. Celino, G. Re Calegari & A. Fiano. Refining linked data with games with a purpose. Data Intelligence 2(2020),  417-442. https://doi.org/dint_a_00056

简述:本文构建了嵌入众包任务以优化关联数据的开源软件游戏框架。本文通讯作者Irene Celino为意大利Cefriel公司知识技术团队负责人,是语义网技术和人机对话技术领域国际知名学者。

14 The Semantic Data Dictionary – An Approach for Describing and Annotating Data

Citation: S.M. Rashid, J.P. McCusker, P. Pinheiro, M.P. Bax, H. Santos, J.A. Stingone, A.K. Das & D.L. McGuinness. The semantic data dictionary –an approach for describing and annotating data. Data Intelligence 2(2020), 443–486. https://doi.org/dint_a_00058

简述:利用语义数据字典可促进数据的被发现、互操作、可重用,可溯源和可再现。本文展示了可公开获取的美国国家健康与营养检验调查数据集的语义标注的实例,讨论了数据建模的挑战,描述了研究者利用语义数据字典方法进行的工作,包括美国国立卫生研究院资助的大型健康数据网站和伦斯勒理工学院和IBM合作的“分析、学习和语义”健康赋能项目。在评测部分,研究者们设计了四个指标:数据、语义、FAIR原则和普适性,分别对比了语义数据字典、传统数据字典、映射语言和数据集成工具在这四个指标上的得分。研究者们也对该方法的局限性进行了讨论并对未来研究方向进行了展望。

15 An RDF Data Set Quality Assessment Mechanism for Decentralized Systems

Citation: L. Huang,Z. Liu, F. Xu & J.Gu. An RDF data set quality assessment mechanism for decentralized systems. Data Intelligence 2(2020), 487–511. https://doi.org/10.1162/dint_a_00059

简述:本文提出了RDF数据质量评测模型,利用区块链技术记录数据质量评测结果,设计了针对质量评估结果的升级策略。

16 KB4Rec: A Data Set for Linking Knowledge Bases with Recommender Systems

Citation: W.X.Zhao, G. He, K. Yang, H. Dou, J. Huang,S. Ouyang, & J.-R.Wen. KB4Rec: Adata set for linking knowledge bases with recommender systems. Data Intelligence 1(2019), 121-136. https://doi.org/10.1162/dint_a_00008

简述:本文展示了数据集KB4Rec v1.0。该数据集将三个广泛使用的推荐系统数据集的物品链接到两个流行的知识图谱—FreeBase和YAGO。本文通讯作者为中国人民大学信息学院赵鑫副教授。

知识图谱被称为人工智能的基石,它的前身是语义网,由谷歌在2012年率先提出,用于改善自身的搜索业务。Data Intelligence执行主编、东南大学计算机科学与技术学院漆桂林教授这样定义知识图谱:知识图谱是人工智能中研究如何将人类的知识转化为图,从而方便计算机存储并用于推理,计算机可以通过知识图谱实现从感知智能到认知智能的飞跃,支持智能问答、辅助决策、智能分析等应用。DI编委、同济大学特聘研究员王昊奋老师是知识图谱方面的专家,曾深入参与过IBM Watson系统的研发工作,他的定义是知识图谱旨在描述真实世界中存在的各种实体或概念。其中,每个实体或概念用一个全局唯一确定的ID来标识,称为它们的标识符。每个属性-值对用来刻画实体的内在特性,而关系用来连接两个实体,刻画它们之间的关联。

 知识图谱是DI的核心主题之一,创刊以来,已刊发了大量相关论文。我们特别对已出版的知识图谱主题论文进行了整理,并对每篇论文的核心内容做了中文简述,以飨关心和支持DI发展的专家和读者。

 衷心希望DI刊发的文章能启发您的思想,助力您的科研!

 注:点击二维码可直达文章全文页面。

1 Constructing and Cleaning Identity Graphs in the LOD Cloud

Citation: J. Raad, W. Beek, F. van Harmelen, J. Wielemaker, N. Pernelle & F. Saïs. Constructing and cleaning identity graphs in the LOD cloud. Data Intelligence 2(2020), 323–352. https://doi.org/10.1162/dint_a_00057

简述:作者之前的工作展示过一张包含超过5亿条明确含有owl:sameAs语句和350亿条暗含owl:sameAs语句的等价关系图谱(identity graph)。作者提出了一个可扩展的方法,可自动计算每一条语句的错误程度。在本文中,作者生成了整张等价关系图谱的子图,这些子图都包含一定程度的错误数据。本文结论是尽管语义网中包含了许多错误的owl:sameAs语句,语义网上的数据仍是可用的,同时可把因错误使用owl:sameAs语句带来的负面影响降到最低。本文作者之一的Frank van Harmelen教授是荷兰阿姆斯特丹自由大学计算机科学系教授,是世界顶级的语义网技术专家。

2 Virtual Knowledge Graphs: An Overview of Systems and Use Cases

Citation: G. Xiao, L. Ding, B. Cogrel, & D. Calvanese. Virtual knowledge graphs: An overview of systems and use cases. Data Intelligence 1(2019), 201-223. https://doi.org/10.1162/dint_a_00011

简述:虚拟知识图谱技术(VKG)也被称为基于本体的数据访问,本文详细总结了VKG的软件生态圈和应用案例。本文第一作者意大利博尔扎诺自由大学计算机学院Guohui Xiao (肖国辉) 博士,是当今最先进的VKG系统Ontop 研究团队的负责人,作者Diego Calvanese教授是知识图谱领域的国际知名专家。


3 Learning to Complete Knowledge Graphs with Deep Sequential Models

Citation: L. Guo, Q. Zhang, W. Hu, Z. Sun, & Y. Qu. Learning to complete knowledge graphs with deep sequential models. Data Intelligence 1(2019), 224-243. https://doi.org/10.1162/dint_a_00016

简述:本文提出了一种新的知识图谱补全方法,通过扩展多层RNN将知识图谱建模成长度为3的序列,同时提出了3种不同策略来集成RNN单元,并通过实验展示了不同特点。本文通讯作者是南京大学计算机科学与技术系胡伟副教授。

4 KnowID: An Architecture for Efficient Knowledge-Driven Information and Data Access

Citation: P.R. Fillottrani & C.M. Keet. KnowID: An architecture for efficient knowledge-driven information and data access. Data Intelligence 2(2020), 487–512. doi: 10.1162/dint_a_00060

简述:本文介绍了在信息管理系统中知识-数据转换的一种架构,KnowID。该架构提出了在实体-联系模型和关系模型之间转换的新的规则。和其他基于本体的数据访问方法相比,KnowID的突出特点是Runtime 运行可以利用在信息系统设计中经常使用的封闭世界假定思想(closed world assumption),同时利用路径查询提高SQL查询效率。

5 AMiner: Search and Mining of Academic Social Networks

Citation: H. Wan, Y. Zhang, J. Zhang, & J. Tang. AMiner: Search and mining of academic social networks. Data Intelligence 1(2019), 58-76.https://doi.org/10.1162/dint_a_00006

简述:AMiner是一个新型的由作者、论文、会议、期刊以及机构所组成的大规模在线学术搜索与挖掘系统。本文第一作者是北京交通大学万怀宇副教授,通讯作者唐杰教授是国内知名学者、清华大学计算机科学与技术系教授,国家杰出青年科学基金获得者。

6 XLORE2: Large-scale Cross-lingual Knowledge Graph Construction and Application

Citation: H. Jin, C. Li, J. Zhang, L. Hou, J. Li, & P. Zhang. XLORE2: Large-scale cross-lingual knowledge graph construction and application. Data Intelligence 1(2019), 77-98. https://doi.org/10.1162/dint_a_00003

简述:本文介绍了基于维基百科和百度百科自动构建的XLORE升级版的构建和应用。本文为清华大学计算机科学与技术系李涓子教授团队的最新研究成果。李涓子教授目前是中国中文信息学会语言与知识计算专委会主任、清华-青岛数据科学研究院科技大数据研究中心主任。

7 CN-DBpedia2: An Extraction and Verification Framework for Enriching Chinese Encyclopedia Knowledge Base

Citation: B. Xu, J. Liang, C. Xie, B. Liang, L. Chen,& Y. Xiao. CN-DBpedia2: An extraction and verification framework for enriching Chinese encyclopedia knowledge base. Data Intelligence 1(2019), 244-261. https://doi.org/10.1162/dint_a_00017

简述:本文提出了一种抽取加验证的知识库增强框架。相比CN-DBpedia,新版本的知识库(CN-DBpedia2)增加了大量从实体描述文本中抽取出来的高置信度的事实。本文通讯作者肖仰华是复旦大学计算机学院教授、博导、青年973首席科学家。

8 Microsoft Concept Graph: Mining Semantic Concepts for Short Text Understanding

Citation: L. Ji, Y. Wang, B. Shi, D. Zhang, Z. Wang & J. Yan. Microsoft concept graph: Mining semantic concepts for short text understanding. Data Intelligence 1(2019), 262-294. https://doi.org/10.1162/dint_a_00013

简述:本文详述了大型概念知识图谱系统——微软知识图谱 (Microsoft Concept Graph) 的构建实践。通讯作者为微软亚洲研究院纪蕾研究员。

9 Constructing a Scene-Based Knowledge System for E-Commerce Industries: Business Analysis and Challenges

Citation: M. Fu, Q. Chen, W. Lin, P. Wang, & W. Zhang. Constructing a scene-based knowledge system for e-commerce industries: Business analysis andchallenges. Data Intelligence 1(2019), 295-308. https://doi.org/10.1162/dint_a_00012

简述:本文详述了阿里巴巴集团构建的基于场景的知识系统,从商业角度分析该系统的优势和面临的挑战。本文通讯作者为阿里巴巴集团付敏高级工程师。

10 Knowledge Graph Construction and Applications for Web Search and Beyond

Citation: P. Wang, H. Jiang, J. Xu & Q. Zhang. Knowledge graph construction and applications for Web search and beyond. Data Intelligence 1(2019), 345-361. https://doi.org/10.1162/dint_a_00019

简述:本文介绍了搜狗公司构建大规模多源数据知识图谱的案例。作者均来自于搜狗公司。

11 GeoLink Data Set: A Complex Alignment Benchmark from Real-world Ontology

Citation: L. Zhou, M. Cheatham, A. Krisnadhi & P. Hitzler.  GeoLink data set: A complex alignment benchmark from real-world ontology. Data Intelligence 2(2020), 353-378. https://doi.org/10.1162/dint_a_00054

简述:本文构建了用于本体匹配的来自于GeoLink 项目的真实数据集。本文第一作者来自于堪萨斯大学计算机系Pascal Hitzler教授团队。Pascal Hitzler教授是语义网领域国际知名学者,Semantic Web 期刊的创刊主编(Founding Editor-in-Chief) 。

12 The Computer Science Ontology: A Comprehensive Automatically-Generated Taxonomy of Research Areas

Citation: A. A. Salatino, T. Thanapalasingam, A. Mannocci, A. Birukou, F.Osborne & E. Motta. The computer science ontology: A comprehensive automatically-generated taxonomy of research areas. Data Intelligence 2(2020), 379-416. https://doi.org/dint_a_00055

简述:本文详述了计算机科学本体(Computer Science Ontology)的自动构建过程。该本体包括1.4万个主题,12.2万条语义关系。本文通讯作者Angelo A. Salatino是英国开放大学知识媒体研究所的教授,FrancescoOsborne是语义网领域的国际知名青年学者。

13 Refining Linked Data with Games with a Purpose

Citation: I. Celino, G. Re Calegari & A. Fiano. Refining linked data with games with a purpose. Data Intelligence 2(2020),  417-442. https://doi.org/dint_a_00056

简述:本文构建了嵌入众包任务以优化关联数据的开源软件游戏框架。本文通讯作者Irene Celino为意大利Cefriel公司知识技术团队负责人,是语义网技术和人机对话技术领域国际知名学者。

14 The Semantic Data Dictionary – An Approach for Describing and Annotating Data

Citation: S.M. Rashid, J.P. McCusker, P. Pinheiro, M.P. Bax, H. Santos, J.A. Stingone, A.K. Das & D.L. McGuinness. The semantic data dictionary –an approach for describing and annotating data. Data Intelligence 2(2020), 443–486. https://doi.org/dint_a_00058

简述:利用语义数据字典可促进数据的被发现、互操作、可重用,可溯源和可再现。本文展示了可公开获取的美国国家健康与营养检验调查数据集的语义标注的实例,讨论了数据建模的挑战,描述了研究者利用语义数据字典方法进行的工作,包括美国国立卫生研究院资助的大型健康数据网站和伦斯勒理工学院和IBM合作的“分析、学习和语义”健康赋能项目。在评测部分,研究者们设计了四个指标:数据、语义、FAIR原则和普适性,分别对比了语义数据字典、传统数据字典、映射语言和数据集成工具在这四个指标上的得分。研究者们也对该方法的局限性进行了讨论并对未来研究方向进行了展望。

15 An RDF Data Set Quality Assessment Mechanism for Decentralized Systems

Citation: L. Huang,Z. Liu, F. Xu & J.Gu. An RDF data set quality assessment mechanism for decentralized systems. Data Intelligence 2(2020), 487–511. https://doi.org/10.1162/dint_a_00059

简述:本文提出了RDF数据质量评测模型,利用区块链技术记录数据质量评测结果,设计了针对质量评估结果的升级策略。

16 KB4Rec: A Data Set for Linking Knowledge Bases with Recommender Systems

Citation: W.X.Zhao, G. He, K. Yang, H. Dou, J. Huang,S. Ouyang, & J.-R.Wen. KB4Rec: Adata set for linking knowledge bases with recommender systems. Data Intelligence 1(2019), 121-136. https://doi.org/10.1162/dint_a_00008

简述:本文展示了数据集KB4Rec v1.0。该数据集将三个广泛使用的推荐系统数据集的物品链接到两个流行的知识图谱—FreeBase和YAGO。本文通讯作者为中国人民大学信息学院赵鑫副教授。

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478330.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

缓存那些事

本文已发表于《程序员》杂志2017年第3期,下面的版本又经过进一步的修订。 一般而言,现在互联网应用(网站或App)的整体流程,可以概括如图1所示,用户请求从界面(浏览器或App界面)到网络…

LeetCode 42. 接雨水(双指针、单调栈)

文章目录1. 题目2. 解题2.1 正反扫描法2.2 双指针2.3 单调栈1. 题目 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图,计算按此排列的柱子,下雨之后能接多少雨水。 上面是由数组 [0,1,0,2,1,0,1,3,2,1,2,1] 表示的高度图,在这种情况下&am…

论文浅尝 - IJCAI | Knowledge is NOT always you need: 外部知识注入预训练模型的利与弊...

转载公众号 | 浙大KG论文题目:Drop Redundant, Shrink Irrelevant: Selective Knowledge Injection for Language Model Pretraining本文作者:张宁豫(浙江大学)、邓淑敏(浙江大学)、张亦弛(阿里…

圆形的CNN卷积核?华中大清华康奈尔提出圆形卷积,进一步提升卷积结构性能!...

文 | 小马编 | 极市平台写在前面目前正常卷积的感受野大多都是一个矩形的,因为矩形更有利于储存和计算数据的方便。但是,人类视觉系统的感受野更像是一个圆形的。因此,作者就提出,能不能将CNN卷积核的感受野也变成圆形呢&#xff…

Android自定义Lint实践

Android Lint是Google提供给Android开发者的静态代码检查工具。使用Lint对Android工程代码进行扫描和检查,可以发现代码潜在的问题,提醒程序员及早修正。 为保证代码质量,美团在开发流程中加入了代码检查,如果代码检测到问题&…

关于PaddleNLP如何加载训练好的模型进行NER

关于PaddleNLP如何加载训练好的模型进行NER 关于PaddleNLP如何加载训练好的模型进行NER 当时在如何加载已经训练好的模型的问题上花了很长时间,后来也是受另一篇文章启发,问题才得以解决,此文章写的很详细,所以不再详细介绍&#…

论文浅尝 | 利用机器翻译和多任务学习进行复杂的知识图谱问答

笔记整理 | 谭亦鸣,东南大学博士生。来源:EACL‘21链接:https://www.aclweb.org/anthology/2021.eacl-main.300.pdf概述知识图谱问答过程一般包括实体链接,多跳推理等步骤,传统方法将各个步骤作为模块单独处理&#xf…

LeetCode 134. 加油站(贪心)

文章目录1. 题目2. 解题1. 题目 在一条环路上有 N 个加油站,其中第 i 个加油站有汽油 gas[i] 升。 你有一辆油箱容量无限的的汽车,从第 i 个加油站开往第 i1 个加油站需要消耗汽油 cost[i] 升。你从其中的一个加油站出发,开始时油箱为空。 …

诺奖级成果开源!为什么说AlphaFold2足以改变全人类?

文 | 炼丹学徒编 | 小轶前天,AlphaFold2开源,相信大家被大大小小的公众号刷屏了。谷歌Deepmind团队此前使用基于Transformer的模型,在CASP14比赛上,刷新蛋白质三维结构预测的新高度,而详细论文,代码&#x…

美团外卖前端可视化界面组装平台 —— 乐高

乐高,是美团点评一个快速搭建后台系统页面的平台。名称来源于大家熟悉的丹麦知名玩具品牌,他们的玩具都是通过组合易拆卸、装配的零件,形成最终的作品。经过长期的发展,乐高品牌渐渐有了“快乐、想象、创意的未来”的寓意。 随着外…

论文浅尝 | 主题驱动的分子图表示对比学习

笔记整理 | 方尹,浙江大学在读博士,研究方向:图表示学习。论文地址:https://arxiv.org/abs/2012.12533动机与贡献现有的对比学习框架中可能存在以下几个弊端:1.把节点看成一种视图,在节点和图之间进行对比学…

LeetCode 931. 下降路径最小和(DP)

文章目录1. 题目2. 动态规划解题1. 题目 给定一个方形整数数组 A,我们想要得到通过 A 的下降路径的最小和。 下降路径可以从第一行中的任何元素开始,并从每一行中选择一个元素。在下一行选择的元素和当前行所选元素最多相隔一列。 示例: 输…

到2021年,目前深度学习领域有哪些除了调模型以外的硬核研究工作和进展?

文 | 刘斯坦,电光幻影炼金术源 | 极市平台作为一个未入门的研究生小白,一方面为深度学习的实际效果和应用价值而感到兴奋,另一方面也会担忧自己的个人能力的发展。个人目前浅薄的看法是,调模型的强应用向的研究工作,由…

美团点评SQL优化工具SQLAdvisor开源

在数据库运维过程中,优化 SQL 是 DBA 团队的日常任务。例行 SQL 优化,不仅可以提升程序性能,还能够降低线上故障的概率。 目前常用的 SQL 优化方式包括但不限于:业务层优化、SQL逻辑优化、索引优化等。其中索引优化通常通过调整索…

LeetCode 295. 数据流的中位数(大小堆)

文章目录1. 题目2. 大小堆解题1. 题目 中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。 例如, [2,3,4] 的中位数是 3 [2,3] 的中位数是 (2 3) / 2 2.5设计一个支持以下两种操作的数据结构:void addNum(int…

论文浅尝 | 利用常识知识图谱进行多跳推理的语言生成方法

笔记整理 | 朱珈徵,天津大学硕士。链接:https://arxiv.org/pdf/2009.11692.pdf动机尽管生成式预训练语言模型在一系列文本生成任务上取得了成功,但在生成过程中需要对基础常识知识进行推理的情况下,它们仍然会受到影响。现有的方法…

成本砍砍砍!不用数据也能用 BERT 做对比学习?

文 | 小昌编 | 小戏大家好,我是小昌,今天和大家聊一聊如何从 BERT 中获取好的句子表征。大家都知道,BERT 的设计初衷是为了获得更好的单词表征。但是,利用 BERT 来表征句子的需求无论在学术界还是工业界都是非常紧迫的。因此&…

Mt-Falcon——Open-Falcon在美团点评的应用与实践

监控系统是整个业务系统中至关重要的一环,它就像眼睛一样,时刻监测机房、网络、服务器、应用等运行情况,并且在出现问题时能够及时做出相应处理。 美团点评刚开始使用的是Zabbix监控系统,几经优化,在当时能够达到2W机器…

论文浅尝 | 以知识图谱为基础的开放域对话生成的目标规划

笔记整理 | 韩振峰,天津大学硕士。链接:https://ojs.aaai.org//index.php/AAAI/article/view/6474动机 之前有关开放域对话生成的神经模型没有有效的机制来管理聊天主题,并且往往会生成不连贯的对话。受到人与人对话策略的启发,本…

LeetCode 378. 有序矩阵中第K小的元素(二分查找)

文章目录1. 题目2. 解题2.1 暴力法2.2 二分查找1. 题目 给定一个 n x n 矩阵,其中每行和每列元素均按升序排序,找到矩阵中第k小的元素。 请注意,它是排序后的第k小元素,而不是第k个元素。 示例: matrix [[ 1, 5, 9],[10, 11,…