资料连结

本页使用了标题或全文手工转换
维基百科,自由的百科全书

资料连结(又称:“连结资料”、“键连资料”,英文: Linked Data)在计算 (计算机科学),是一种发布“结构化资料”连结的方法,使资料间彼此相互连结。同时透过语意查询.[1] 使连结的资料更为有用。资料连结技术以全球资讯网 标准为主,例如HTTP资源描述架构(RDF)以及统一资源标志符(URIs)。“资料连结”主要提供机器与机器间,可自动交换的一种资料分享的方式。换言之,“资料连结”关联了资料(data)、常人(human)以及机器(machine)三者在知识呈现语意处理的共有课题。[2]

蒂姆·伯纳斯-李, 全球资讯网协会(W3C)主席,在2006年一个与语意网计画有关的设计笔记中提出了"Linked Data"/“资料连结”这个名词。[3]

“资料连结”亦可以是开放资料的一种,在此脉络下通称为开放资料连结(Linked Open Data)。

主要原则

蒂姆·伯纳斯-李在2006年提出“资料连结”四大原则,2009年更简化为三大原则:

2006年的笔记中,蒂姆·伯纳斯-李提出“资料连结”的四大原则如下[3]:

  1. 使用统一资源标志符(URIs)命名(辨识)物件。
  2. 使用HTTP URIs,因此物件得以被查询(被解释/阐释(interpreted)与区分辨识(dereferenced)。
  3. 当物件被查询时,使用开放标准如RDF, SPARQL等,针对此命名之物件提供有用的资讯。
  4. 当物件被发布时,使用以HTTP URI的命名方式来指称其他物件。

2009年在TED大会中,蒂姆·伯纳斯-李重申三大“极其简单”的“资料连结”原则如下:[4]

  1. 所有概念性的事务皆有以HTTP开始的命名
  2. 倘若我查询一个以HTTP命名的物件,我将会得到一个有用的标准化格式资料。此资料包含了与此物件相关的事物与事件的描述。
  3. 当我回到此资讯时,此资讯不仅包括某人的身高体重、出生时间,此资讯还包括了关系。有此关系后,被相关的事务则被赋予以HTTP开始命名的名称。

主要元素

开放资料连结 (Linked Open Data)

开放资料连结开放资料的“资料连结”。[5][6][7] 蒂姆·伯纳斯-李清楚定义了“开放资料连结”与“资料连结”的不同:


“开放资料连结”(LOD) 是以开放授权释出的“资料连结”。此释出并不阻碍资料自由的再次使用。

——Tim Berners-Lee,Linked Data[3][8]

大量的“开放资料连结”资料集包括DBpediaWikidata

历史溯源

“开放资料连结”(LOD)这个词汇至少自2007年2月LOD邮件论坛建立时即开始使用。[9] [10]此邮件论坛是由麻省理工学院SIMILE计画主导。[11]

开放资料连结计画

2014 8月LOD资料及连结情形. 此图由2017年开始的Linked Open Data Cloud 计画制作。部分资料集可能包括可自由取得的版权资料。[12]
2017年2月发布,与上图比较2年半后的快速成长情形。.

W3C Semantic Web Education and Outreach group 的开放资料连结计画,目的是借由发布RDF格式的开放知识资料集,以及建立不同资料集中资料间的RDF连结,进而以data commons扩展全球资讯网。2007年10月, 资料集包含超过由二百万相互连结的RDF links所连结的二十亿 RDF triples。[13][14] 至2011年9月则发展至5百零4万相互连结的RDF links所连结的三十亿个RDF triples。2014年发布详细的统计资料。[15]

欧盟计画

许多欧洲联盟计画均包含“资料连结”,例如: LATC计画、[16] PlanetData 计画、[17]、DaPaaS (Data-and-Platform-as-a-Service)计画[18]以及LOD2 计画[19][20]。而资料的连结也成为欧盟开放资料入口网促使千笔资料集开放使用与连结的主要目的。

资料集(Datasets)

参考资料

  1. ^ Bizer, Christian; Heath, Tom; Berners-Lee, Tim. Linked Data – The Story So Far (PDF) 5. 2009 [2018-10-23]. doi:10.4018/jswis.2009081901. (原始内容存档 (PDF)于2020-12-03).  |journal=被忽略 (帮助); |number=被忽略 (帮助)
  2. ^ Huang, Andrea Wei-Ching; Lee, Cheng-Jen; Chuang, Tyng-Ruey. 結構資料的再次使用:語意、連結與實作 43. 2017 [2018-10-23]. doi:10.6245/JLIS.2017.431/722. (原始内容存档于2020-11-24).  |journal=被忽略 (帮助); |number=被忽略 (帮助)
  3. ^ 3.0 3.1 3.2 Tim Berners-Lee. Linked Data. Design Issues. W3C. 2006-07-27 [2010-12-18]. (原始内容存档于2019-05-23). 
  4. ^ Tim Berners-Lee on the next Web. [2018-10-23]. (原始内容存档于2011-04-10). 
  5. ^ Frequently Asked Questions (FAQs) - Linked Data - Connect Distributed Data across the Web. [2018-10-23]. (原始内容存档于2015-11-18). 
  6. ^ COAR » 7 things you should know about…Linked Data. [2018-10-23]. (原始内容存档于2015-11-18). 
  7. ^ Linked Data Basics for Techies. [2018-10-23]. (原始内容存档于2021-05-05). 
  8. ^ 5 Star Open Data. [2018-10-23]. (原始内容存档于2021-05-08). 
  9. ^ [email protected] Mail Archives. [2018-10-23]. (原始内容存档于2021-04-17). 
  10. ^ SweoIG/TaskForces/CommunityProjects/LinkingOpenData/NewsArchive. [2018-10-23]. (原始内容存档于2020-09-27). 
  11. ^ SIMILE Project - Mailing Lists. [2018-10-23]. (原始内容存档于2016-01-21). 
  12. ^ Linking open data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/页面存档备份,存于互联网档案馆
  13. ^ SweoIG/TaskForces/CommunityProjects/LinkingOpenData - W3C Wiki. esw.w3.org. [22 March 2018]. (原始内容存档于2009-11-16). 
  14. ^ Fensel, Dieter; Facca, Federico Michele; Simperl, Elena; Ioan, Toma. Semantic Web Services. Springer. 2011: 99. ISBN 3642191924. 
  15. ^ Max. State of the LOD Cloud. linkeddatacatalog.dws.informatik.uni-mannheim.de. [22 March 2018]. (原始内容存档于2021-02-24). 
  16. ^ Linked open data around the clock (LATC). latc-project.eu. [22 March 2018]. (原始内容存档于2018-09-19). 
  17. ^ Welcome to PlanetData! - PlanetData. planet-data.eu. [22 March 2018]. (原始内容存档于2021-04-21). 
  18. ^ DaPaaS. project.dapaas.eu. [22 March 2018]. (原始内容存档于2020-12-18). 
  19. ^ CORDIS FP7 ICT Projects – LOD2. European Commission. 2010-04-20 [2018-10-23]. (原始内容存档于2012-09-05). 
  20. ^ LOD2 Project Fact Sheet – Project Summary (PDF). 2010-09-01 [2010-12-18]. (原始内容 (PDF)存档于2011-07-20). 

延伸阅读

外部链接