京东 | NLP人才联合培养计划


01 京东AI项目实战课程安排

覆盖了从经典的机器学习、文本处理技术、序列模型、深度学习、预训练模型、知识图谱、图神经网络所有必要的技术。

项目一、京东健康智能分诊项目

第一周:文本处理与特征工程

| Bag of Words模型

| 从tf-idf到Word2Vec

| SkipGram与CBOW

| Hierarhical Softmax与Negative Sampling

| FastText                                     

| N-gram与平滑操作

| 文本特征工程

| 工具的使用:Gensim、Sklearn、jieba的使用

| 专题:如果阅读科研论文

| 项目:京东健康智能分诊项目讲解(1)

 

第二周:基于统计学习的分类方法

| 决策树

| CART模型

| Bagging & Boosting

| 随机森林和GBDT

| XGBoost

| 精确率、召回率

| F1,AUC

| 专题:如何处理样本不平衡问题

| 专题:京东Neufoundry平台的使用

| 项目:京东健康智能分诊项目讲解(2)

 

第三周:基于深度学习的分类方法

| 统计学习与深度学习的区别

| 深度学习与浅层学习

| 从逻辑回归到神经网络

| 深度学习的非线性性质

| 损失函数与优化器

| 神经网络的调参

| CNN与TextCNN

| 实战:Pytorch的基础使用

| 实战:使用Pytorch实现神经网络和卷积神经网络 

| 项目:京东健康智能分诊项目讲解(3)

项目二、京东智能营销文本生成项目

第四周:递归神经网络RNN与BPTT算法

| BPTT与RNN中的梯度消失、爆炸

| 梯度爆炸的处理

| LSTM与GRU

| 基于LSTM的文本分类

| Bi-LSTM与Deep Bi-LSTM

| RNN与LSTM的可视化

| 实战:基于LSTM的情感分类

| 专题:GPU技术详解

| 项目:京东智能营销文本生成项目讲解(1)

 

第五周:Seq2Seq模型与营销文本生成

| Encoder-Decoder模型以及各类应用场景

| Seq2Seq模型与注意力机制

| Greedy Decoding

| Beam Search

| 基于Seq2Seq的文本生成

| 文本生成的评价指标

| 实战:基于Seq2Seq的机器翻译

| 项目:京东智能营销文本生成项目讲解(2)

 

第六周:Pointer-Generator Network和多模态识别

| 抽取式文本摘要和生成式文本摘要

| Pointer-Generator Network

| Beam Search优化思路

| Length Normalization

| Coverage Normalization

| End of Sentence Normalization

| 多模态识别技术: ResNet和Faster RCNN

| 实战:PGN+Seq2Seq解读

| 论文:京东论文解读

| 项目:京东智能营销文本生成项目讲解(3)

项目三、京东同类商品搜索项目

第七周:Entity Linking与图卷积神经网络

| 什么是实体

| Entity Linking问题解读

| 图的表示

| 图表示的应用场景

| 卷积神经网络回顾

| 在图中的卷积

| 图中的信息传递

| 图卷积神经网络(GCN)

| 论文:GCN论文解读和复现

| 项目:京东同类商品搜索项目讲解(1)

 

第八周:GraphSage与Graph Attention Network

| GraphSage详解

| 注意力机制讲解

| 注意力机制与图表示

| GAT模型详解

| GAT与知识图谱应用

| 对于Heterogenous数据处理

| 论文:GAT论文解读与复现

| 项目:京东同类商品搜索项目讲解(2)

 

第九周:Entity Linking技术与GNN的其他应用场景

| Entity Linking前沿技术剖析

| 基于GNN的文本分类

| 基于GNN的实体识别

| 基于GNN的社交网络分析

| 基于GNN的链接预测

| GNN的前沿主题

| 论文:图神经网络综述

| 项目:京东同类商品搜索项目讲解(3)

项目四、京东智能对话系统项目

京东NLP企业项目实战训练营

专注于培养行业TOP10%的NLP工程师

对课程有意向的同学

截图保存二维码,微信内扫描

报名、课程咨询

????????????

01 科学的实战安排

每一期的训练营都有严谨科学的安排,每周伴随着理论、实战、案例分享、项目讲解等课程一系列课程内容。

▲节选往期部分课程安排

02 项目讲解&实战帮助

训练营最终的目的是帮助学员完成项目,理解项目中包含核心知识技能,训练营中会花大量的时间帮助学员理解项目以及所涉及到的实战讲解。

▲节选往期部分课程安排

03 最佳工程实战

来自京东智联云等业界专家来讲述工业界的最佳工程实战,如AI模型的部署、代码编写、模型的调参以及debug等技术。

▲源自京东智联云AI某模块架构图

04 专业的论文解读

作为AI工程师,阅读论文能力是必须要的。在课程里,我们每1-2周会安排一篇经典英文文章供学员阅读,之后由老师帮助解读。   

    

▲节选往期部分论文安排

05 代码解读&实战

对于核心的模型如BERT,XLNet都会精心安排代码解读和实战课,帮助学员深入理解其细节并有能力去实现。

▲BERT模型代码实战讲解

06 行业案例分享

训练营过程中会邀请合作的专家来分享行业案例以及技术解决方案,如知识图谱的搭建、保险领域的客服系统等。

▲专家分享

《Google YouTube 基于深度学习的视频推荐》

嘉宾简介:曾博士

计算机视觉,机器学习领域专家

先后在CVPR,ACMMM,TPAMI,SCI 期刊,EI 会议等发表超过30篇论文

07 日常社群答疑

为了帮助解决学员遇到的问题,专业助教会提供全天社群答疑服务。我们的助教均来来自于一线AI公司和国内外名校,扎实的理论和工业界应用也是我们选拔助教老师的重要标准,拒绝空谈理论。

▲社群内老师专业的解答

08 日常作业&讲解

为了巩固对一些核心知识点,学员除了大项目,也需要完成日常的小作业。之后助教会给出详细的解答。

▲课程学习中的小作业

 

课程适合哪些学员呐?

  • 大学生:

    • 计算机或者信息领域相关的本科/研究/博士生,毕业后希望从事AI相关的工作。

    • 希望在真实工业场景中磨炼技术,提升职场竞争力。

    • 毕业之后希望申请国内外名校的硕士或者博士。

  • 在职人士:

    • 具备良好的工程研发背景,希望从事AI相关的项目或者工作。

    • 从事AI工作,希望进一步提升NLP实战经验。

    • 从事NLP工作,希望深入了解模型机理。

    • AI developer, 希望突破技术瓶颈, 了解NLP前沿信息。 

入学标准:

1、 理工科专业相关本科生,硕士生或博士生或者IT领域的在职人士

2、具备很强的动手能力、熟练使用Python编程

3、对基本的机器学习算法(逻辑回归、随机森林、SVM)有了解或者有过实战经验

4、具备良好的英文文献阅读能力,至少达到CET-4级水平

●●●

课程其他的细节可以联系课程顾问来获取

添加课程顾问微信

报名、课程咨询

????????????

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478623.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

论文小综 | Pre-training on Graphs

本文转载自公众号:浙大KG。作者:方尹、杨海宏,浙江大学在读博士,主要研究方向为图表示学习。在过去几年中,图表示学习和图神经网络(Graph Neural Network, GNN)已成为分析图结构数据的热门研究领域。图表示学习旨在将具…

初探下一代网络隔离与访问控制

概述 安全域隔离是企业安全里最常见而且最基础的话题之一,目前主要的实现方式是网络隔离(特别重要的也会在物理上实现隔离)。对于很小的公司而言,云上开个VPC就实现了办公网和生产网的基础隔离,但对于有自建的IDC、网络…

LeetCode 189. 旋转数组(环形替换)

1. 题目 给定一个数组,将数组中的元素向右移动 k 个位置,其中 k 是非负数。 示例 1:输入: [1,2,3,4,5,6,7] 和 k 3 输出: [5,6,7,1,2,3,4] 解释: 向右旋转 1 步: [7,1,2,3,4,5,6] 向右旋转 2 步: [6,7,1,2,3,4,5] 向右旋转 3 步: [5,6,7,1,2,3,4]要求…

吴恩达:机器学习应以数据为中心

源 | 新智元今天是吴恩达45岁生日。他是国际最权威的ML学者之一,学生遍布世界各地。在最近的一期线上课程中,吴恩达提出了以模型为中心向以数据为中心的AI。吴恩达发推称,「大家为自己送上最好的礼物就是,观看这个视频观看并提出自…

如何开发小程序开发者工具?

最近集团内部在自研小程序,我负责小程序开发者工具的调试部分。经过一段时间的探索,摸索出不少经过实际检验的可行手段。接下来将会用几篇文章总结一下思路。 文章的内容主要会分为以下几部分: 如何建立逻辑层运行时容器(两种方…

美团点评基于Storm的实时数据处理实践

背景 目前美团点评已累计了丰富的线上交易与用户行为数据,为商家赋能需要我们有更强大的专业化数据加工能力,来帮助商家做出正确的决策从而提高用户体验。目前商家端产品在数据应用上主要基于离线数据加工,数据生产调度以“T1”为主&#xff…

会议交流 | 大规模知识图谱的构建及应用分享

本文转载自公众号:DataFunTalk。论坛出品:张伟 阿里巴巴 资深算法专家分享时间:12月19日,9:00-12:00导读:12月19日,9:00-12:00。在DataFunTalk年终大会上,由阿里巴巴资深…

机器翻译小记

神经网络翻译面临的挑战

赛尔原创 | N-LTP:基于预训练模型的中文自然语言处理平台

论文名称:N-LTP: A Open-source Neural Chinese Language Technology Platform with Pretrained Models论文作者:车万翔,冯云龙,覃立波,刘挺原创作者:冯云龙论文链接:https://arxiv.org/abs/200…

LeetCode 49. 字母异位词分组(哈希)

1. 题目 给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。 示例:输入: ["eat", "tea", "tan", "ate", "nat", "bat"], 输出: [["ate",…

论文浅尝 - SWJ | 基于知识图谱和注意力图卷积神经网络的可解释零样本学习

论文题目:Explainable Zero-shot Learning via Attentive Graph Convolutional Network and Knowledge Graphs本文作者:耿玉霞,浙江大学在读博士,研究方向为知识图谱、零样本学习、可解释性发表期刊:Semantic Web Jour…

LeetCode 3. 无重复字符的最长子串(滑动窗口+哈希)

1. 题目 给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。 示例 1: 输入: "abcabcbb" 输出: 3 解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。示例 2: 输入: "bbbbb" 输出: 1 解释: 因为无重…

安装kenlm出现问题的解决方案gcc g++

安装kenlm出现问题的解决方案 apt-get install gcc apt-get install g参考文章:gcc: error trying to exec ‘cc1plus’: execvp: No such file or directory

论文浅尝 - TACL2020 | 改进低资源跨语言实体链接的候选生成问题

论文笔记整理:谭亦鸣,东南大学博士。来源:TACL 2020链接:https://arxiv.org/ftp/arxiv/papers/2003/2003.01343.pdf1.背景介绍跨语言实体链接(Cross-lingual Entity Linking, XEL)旨在利用源语言文本中实体描述(提及),…

卫星系统——酒店后端全链路日志收集工具介绍

背景 随着酒店业务的高速发展,我们为用户、商家提供的服务越来越精细,系统服务化程度、复杂度也逐渐上升。微服务化虽然能够很好地解决问题,但也有副作用,比如,问题定位。 每次问题定位都需要从源头开始找同事帮我人肉…

拖拽式Vue组件代码生成平台(LCG)新版详细介绍

拖拽式Vue组件代码生成平台是一款小猴自研的Vue代码生成工具,英文全称:Low Code Generator,简称LCG。它也是一种LowCode解决方案。通过它可以快速完成Vue组件的代码骨架搭建,通过减少不必要的重复工作从而带来开发效率的提升。 体…

ImportError: libgthread-2.0.so.0: cannot open shared object file: No such file or directory

apt-get update apt-get install libglib2.0-dev系统:ubuntu16.04

LeetCode 454. 四数相加 II(哈希)

1. 题目 给定四个包含整数的数组列表 A , B , C , D ,计算有多少个元组 (i, j, k, l) ,使得 A[i] B[j] C[k] D[l] 0。 为了使问题简单化,所有的 A, B, C, D 具有相同的长度 N,且 0 ≤ N ≤ 500 。所有整数的范围在 -228 到 228 - 1 之间…

论文浅尝 - AAAI2020 | 多轮对话系统中的历史自适应知识融合机制

论文笔记整理:潘锐,天津大学硕士。链接:https://www.aaai.org/ojs/index.php/AAAI/article/view/6425来 源:AAAI 2020论文简介保持对话的一致性和避免内容重复是构建以知识为基础的多轮对话系统的两个关键因素。尽管一些工作倾…

高性能平台设计—美团旅行结算平台实践

本文根据第23期美团技术沙龙演讲内容整理而成。 背景 美团酒旅有很多条业务线,例如酒店、门票、火车票等等,每种业务都有结算诉求,而结算处于整个交易的最后一环不可缺少,因此我们将结算平台化,来满足业务的结算诉求。…