资源详情
小像学院《知识图谱》课程
2017年10月24-2018年1月
课程简介:
本次的知识图谱课程主要包括三大部分:
1.xa0xa0知识图谱的工程方法论。指导学员了解并掌握知识图谱的基本概念和发展历史,梳理清知识图谱的技术体系,掌握知识图谱的核心技术原理,建立知识图谱工程的方法论思维。
2.xa0 xa0知识图谱的实战技术。从实战出发,围绕知识表示、知识抽取、语义搜索、知识问答、知识推理、知识融合等系统忄生介绍知识图谱相关的实战技术,使得学员具备研发知识图谱相关应用的基础能力。
3.xa0xa0知识图谱的典型应用。结合医疗、金融、电商等实际应用场景,介绍知识图谱各个技术点的实际应用落地方式,使得学员具备结合自身背景开展知识图谱技术实践的应用能力。
面向人群:
1.xa0xa0希望学习知识图谱的学生;
2.xa0xa0希望了解知识图谱实战技术的IT从业人员;
3.xa0xa0未来希望成为知识图谱工程师的求职者;
4.xa0xa0想在知识图谱方向进行深入研究者。
学习收益:
通过本课程的学习,学员将会收获:
1. 帮助学员系统忄生的掌握知识图谱的核心技术原理,结合近期研究成果,学习从基本概念到各个先进算法和技术的转化思路
2. 了解国内外典型的开源知识库数据及技术资源
3. 实践与理论结合,培养学员面对工程及学术问题的思考解决能力
4. 基于百科知识进行各项核心技术的实例训练,并结合医疗、金融、电商等行业应用帮助学员快速积累知识图谱工程项目经验
5. 对有志于从事知识问答工作或学术研究的学员,提供IBM Watson系统实现原理的讲解与指导
课程大纲:
第一课:xa0xa0知识图谱概论xa0 xa0xa0 xa0xa0 xa0
xa0 xa0 1.xa0xa0知识图谱的起源和历史
xa0 xa0 2.xa0xa0典型知识库项目简介
xa0 xa0 3.xa0xa0知识图谱应用简介
xa0 xa0 4.xa0xa0本次课程覆盖的主要范围:知识表示与建模、知识抽取与挖掘、知识存储、知识融合、知识推理、语义搜索、知识问答和行业知识图谱应用剖析等内容。
第二课:xa0xa0知识表示与知识建模xa0 xa0xa0 xa0xa0 xa0
xa0 xa0 1.xa0xa0早期知识表示简介
xa0 xa0 2.xa0xa0基于语义网的知识表示框架
xa0 xa0xa0 xa0xa0 xa0a.xa0xa0RDF和RDFS
xa0 xa0xa0 xa0xa0 xa0b.xa0xa0OWL和OWL2 Fragments
xa0 xa0xa0 xa0xa0 xa0c.xa0xa0SPARQL查询语言
xa0 xa0xa0 xa0xa0 xa0d.xa0xa0Json-LD、RDFa、HTML5 MicroData等新型知识表示
xa0 xa0 3.xa0 xa0典型知识库项目的知识表示
xa0 xa0 4.xa0 xa0基于本体工具(Protege)的知识建模最佳实践
第三课:xa0xa0知识抽取与挖掘I
xa0 xa0 1.xa0xa0知识抽取任务定义和相关比赛:实体识别、关系抽取和事件抽取
xa0 xa0 2.xa0xa0面向结构化数据(关系数据库)的知识抽取,包括D2RQ和R2RML等转换与映射规范与技术介绍
xa0 xa0 3.xa0xa0面向半结构化数据(Web tables, 百科站点等)的知识抽取
xa0 xa0xa0 xa0xa0 xa0a.xa0xa0基于正则表达式的方法
xa0 xa0xa0 xa0xa0 xa0b.xa0xa0Bootstrapping和Wrapper Induction介绍
xa0 xa0 4.xa0xa0实践展示:基于百科数据的知识抽取
第四课:xa0xa0知识抽取与挖掘II
xa0 xa0 1.xa0xa0面向非结构化数据(文本)的知识抽取
xa0 xa0xa0 xa0xa0 xa0a.xa0xa0基于本体的知识抽取,包括NELL和DeepDive系统介绍
xa0 xa0xa0 xa0xa0 xa0b.xa0xa0开放知识抽取,包括TextRunner、Reverb和OLLIE等系统介绍
xa0 xa0 2.xa0xa0知识挖掘
xa0 xa0xa0 xa0xa0 xa0a.xa0xa0知识内容挖掘:实体消歧与链接
xa0 xa0xa0 xa0xa0 xa0b.xa0xa0知识结构挖掘:关联规则挖掘与社区发现
xa0 xa0xa0 xa0xa0 xa0c.xa0xa0知识表示学习与链接预测,包括TransE和PRA等算法介绍xa0 xa0
第五课:xa0xa0知识存储
xa0 xa0 1.xa0xa0基于关系数据库的存储设计,包括各种表设计和索引建立策略
xa0 xa0 2.xa0xa0基于RDF的图数据库介绍
xa0 xa0xa0 xa0xa0 xa0a.xa0xa0开源数据库介绍:Apache Jena、Sesame、gStore、RDF-3X等
xa0 xa0xa0 xa0xa0 xa0b.xa0xa0商业数据库介绍:Virtuoso、AllegroGraph、BlazeGraph等
xa0 xa0 3.xa0 xa0原生图数据库介绍,包括Neo4j、OrientDB、Titan和Cayley等
xa0 xa0 4.xa0xa0实践展示:使用Apache Jena存储百科知识,并使用Fuseki构建图谱查询服务
第六课:xa0xa0知识融合
xa0 xa0 1.xa0xa0知识融合任务定义和相关竞赛:本体对齐和实体匹配
xa0 xa0 2.xa0xa0本体对齐基本流程和常用方法
xa0 xa0xa0 xa0xa0 xa0a.xa0xa0基于Linguistic的匹配
xa0 xa0xa0 xa0xa0 xa0b.xa0xa0基于图结构的匹配
xa0 xa0xa0 xa0xa0 xa0c.xa0xa0基于外部知识库的匹配
xa0 xa0 3.xa0xa0实体匹配基本流程和常用方法
xa0 xa0xa0 xa0xa0 xa0a.xa0xa0基于分块的多阶段匹配
xa0 xa0xa0 xa0xa0 xa0b.xa0xa0基于规则(配置或通过学习)的实体匹配
xa0 xa0 4.xa0xa0知识融合工具介绍:包括Falcon-AO、Silk、PARIS、DEDUPE、LIMES和KnowledgeVault
xa0 xa0 5.xa0xa0实践展示:使用Falcon-AO融合百度百科与维基百科中的知识
第七课:xa0xa0知识推理
xa0 xa0 1.xa0xa0本体知识推理简介与任务分类,包括概念可满足忄生、概念包含、实例分类和一致忄生检测等
xa0 xa0 2.xa0xa0本体推理方法与工具介绍
xa0 xa0xa0 xa0xa0 xa0a.xa0xa0基于Tableaux运算的方法:Fact++、Racer、Pellet和Hermit等
xa0 xa0xa0 xa0xa0 xa0b.xa0xa0基于一阶查询重写的方法:Ontology-based Data Access的Ontop等
xa0 xa0xa0 xa0xa0 xa0c.xa0xa0基于产生式规则的方法(如Rete):Jena、Sesame和OWLIM等
xa0 xa0xa0 xa0xa0 xa0d.xa0xa0基于逻辑编程(如Datalog)改写的方法:KAON2和RDFox等
xa0 xa0xa0xa03.xa0xa0实践展示:使用Jena完成百科知识上的上下位推理、缺失类别补全和一致忄生检测等
第八课:xa0xa0语义搜索
xa0 xa01.xa0xa0语义搜索概述,包括Knowledge Card、Rich Snippet、Facebook Graph Search等
xa0 xa02.xa0xa0基于语义标注的网页搜索
xa0 xa0xa0 xa0xa0 xa0a.xa0xa0Web Data Commons项目介绍
xa0 xa0xa0 xa0xa0 xa0b.xa0xa0排序算法介绍,扩展BM25
xa0 xa03.xa0xa0基于图谱的知识搜索
xa0 xa0xa0 xa0xa0 xa0a.xa0xa0本体搜索(ontology lookup)
xa0 xa0xa0 xa0xa0 xa0b.xa0xa0探索式知识检索,包括查询构造、结果排序和分面(facets)推荐
xa0 xa04.xa0xa0知识可视化,包括本体、查询、结果等的展现方式和可视化分析
xa0 xa05.xa0xa0实践展示:使用ElasticSearch实现百科数据的语义搜索
第九课: 知识问答I
xa0 xa0 1.xa0xa0知识问答概述和相关数据集(QALD和WebQuestions)
xa0 xa0 2.xa0xa0知识问答基本流程
xa0 xa0 3.xa0xa0知识问答主流方法介绍
xa0 xa0xa0 xa0xa0 xa0a.xa0xa0基于模板的方法,包括模板定义、模板生成和模板匹配等步骤
xa0 xa0xa0 xa0xa0 xa0b.xa0xa0基于语义解析的方法,包括资源映射,逻辑表达式候选生成与排序等
xa0 xa0xa0 xa0xa0 xa0c.xa0xa0基于深度学习的方法
第十课:xa0xa0知识问答II
xa0 xa0 1.xa0xa0IBM Watson问答系统及核心组件详细解读
xa0 xa0xa0 xa0xa0 xa0a.xa0xa0问句理解
xa0 xa0xa0 xa0xa0 xa0b.xa0xa0候选答案生成
xa0 xa0xa0 xa0xa0 xa0c.xa0xa0基于证据的答案排序
xa0 xa0 2.xa0xa0实践展示:面向百科知识的问答baseline实现
第十一课:xa0xa0行业知识图谱应用
xa0 xa0 1.xa0xa0行业知识图谱特点
xa0 xa0 2.xa0xa0行业知识图谱应用,包括金融、医疗、数字图书馆等领域应用
xa0 xa0 3.xa0xa0行业知识图谱构建与应用的挑战
xa0 xa0 4.xa0xa0行业知识图谱生命周期定义和关键组件