解读 | 滴滴主题研究计划:机器学习专题+

固定链接 解读 | 滴滴主题研究计划:机器学习专题(上篇)

解读 | 滴滴主题研究计划:机器学习专题(上篇)

解读 | 滴滴主题研究计划:机器学习专题(上篇)

滴滴主题研究计划

滴滴希望通过开放业务场景,与学术界发现与定义问题,合作共赢解决领域难题,构建高水平跨境知识与研究网络,构筑产学研合作共同体。

 

2018年秋季期主题研究计划包含机器学习、计算机视觉、语音信号处理、地理信息技术和能源与汽车五大研究方向的15个来自滴滴真实业务场景。诚邀全球顶尖的学者与滴滴研究员共同探讨前沿技术在出行领域的落地应用,以真实场景驱动技术革新。

 

2018年秋季期提交申报书截止日期819日。请您关注项目关键时间节点,选定申报命题后提前完成申报工作。

 

主题研究计划官方网址:

 

https://outreach.didichuxing.com/RFP

 

本期我们将介绍机器学习方向课题,希望大家可以找到与自己研究方向匹配的申报方向。

 

机器学习

. 供需预测

1.技术方向

时空数据 人群转移分析 城市出行

 

2.课题背景

出行领域的核心在于连接司机和乘客。如何有效利用这些信息通过大数据和机器学习的技术方案,对供给和需求进行描述和建模,实现高频出行下的供需平衡,是提升整个平台效率和服务的关键。通过建立一个统一的供需实时预测系统,通过基础能力的建设和打磨,能赋能订单分配、司机调度、导流、定价、产品策略等业务场景,提升整个出行平台的效率。

 

3.研究目标

针对上述关键问题,研究目标包括不限于:

 

1. 时空数据预测

构建出行场景下时空数据预测能力,其中涉及数据集组织、特征工程、模型训练和验证。对于时空数据的分析和研究一直是业界热议的方向之一,而时空数据预测也一直是业界的一大难题,我们拟建立科学的评估体系,对输出的预测能力提出以下要求:提供实时预测能力,达到数据可用性,适配节假日、极端天气、突发事件等异常情况。

2. 人群转移分析

出行场景的根本是人群的转移,只有深入挖掘人群属性及行为特征,才能对城市出行规律做出更加科学的解读。

 

二.拼车算法研究

1.技术方向

研究拼车合乘算法,提升拼车系统的效率

 

2.课题背景

网约车的快速发展和普及,极大地提升了出行服务的体验和效率。同时,车辆共享使得交通拥堵得到缓解,基于大数据的供需匹配与优化技术也助力于智慧城市的建设。其中拼车通过行程共享,致力于进一步提升车辆利用效率,以提供低价、高效、绿色的出行服务产品。

 

在更少的体验损失下,将更多的订单组合在一起,也将极大提升拼车效率。拼车效率的实现依赖于定价能力, 需求结构及分单能力, 且各部分作用相互耦合。定价模型灵活支持不同业务目标下的基础定价及补贴发放策略。出行需求结构在不同城市差异巨大: 在相似体验约束下,达到同等效率所需的订单数量在不同时空域上迥异。给定供需集合,分单模块负责将需求与需求,供给与需求进行实时匹配,并通过匹配算法及时序决策的优化提升拼车效率。

 

三个部分的综合影响最终决定了拼车效率的实现,而各独立部分影响面的量化及相互作用关系的描述,对整体策略能力进化必不可少。

 

针对上述关键问题,研究目标包括不限于:

1. 拼车分单时序决策优化

实时拼车业务的一个主要特征是分单系统对出行需求的即时响应,意味着匹配决策需要在极短的时间内完成。对某一订单来说,在其生命周期中往往能参与多个订单组合,且该订单组合的集合随时间变化并决定了此订单匹配效率的优化空间。因此,匹配决策需在当前轮次的优化力度及未来需求的随机性之间做权衡。即不仅提升每一轮次的匹配效率,同时需考虑订单在时序上所能参加的匹配轮次组合并决策最佳分配点。

 

2. 需求结构与分单耦合关系建模

分单框架中的各要素如基础匹配算法,时序决策优化,体验参数控制等,在不同的需求结构下,对于拼车效率的影响也相应变化。因此,在不同的需求结构下,需灵活地根据相适应关系调整分单框架,从而使各要素的组合能更好地实现拼车效率。

 

3. 需求结构建模

在同一城市中需求结构是异质化的,而基于业务目标,去有向地调整需求结构十分重要。为不同时空域内的需求建立属性,可增强对输入订单集合的把控能力。如动态泛线路的挖掘,及线路间影响关系的建模等 。

 

4. 绕路识别

拼车绕路的实时识别,包括拼车子单内送驾绕路,拼友接驾绕路,全拼单整体绕路,相邻单绕路等的识别。一般来说,这个过程涉及异常问题定义,用户反馈收集和清洗,特征数据集构建,模型训练和验证。其中,问题的拆解和建模是最困难的。拼车绕路场景有着丰富的内涵,完成机器学习建模应该满足以下三个要求:

 

1)内聚性

每个子问题场景都有一个清晰的定义,任何两个子场景之间的边界尽可能清晰。每个子场景的拆分定义具有较强的内聚性。

 

2)全局性

各子问题场景间的相关性及子场景与总场景的关系,对问题的发现和早期问题的及时解决有较强的影响,需要统筹考虑。

 

3)模型指标

模型需要通盘考虑准确率、召回率对成本和用户体验的平衡,同时兼顾模型判责的可解释性。

 

5. 成单调度

根据订单时间、费用、里程、路况、空余座位、司机属性、乘客属性等特征,结合成本收益体验等建设基于深度学习、强化学习的拼单调度策略,从而提升资源利用率和司乘体验。

 

1) 多目标优化

充分考虑司机、乘客利益和约束,实现司乘体验的优化,体验和效率、平台长期增长的均衡。

 

2) 模型指标

在充分理解业务和数据的基础上,分场景建设通用的灵活可配置的调度模型。实现拼成率、顺路率等核心业务指标的明显提升。

 

. 派单算法研究

1.技术方向

组合优化、强化学习、多目标优化、在线系统

 

2.课题背景

网约车服务在近年来得到了广泛的普及和长足的发展。与传统的巡游出租车相比,网约车的优势之一在于其存在中心化的决策机制,可按需在线地撮合乘客和司机间的匹配,从而达到提升平台效率和司乘体验的效果。订单分配(或派单)算法作为连接司机和乘客的桥梁,是网约车平台中最核心的问题之一。

 

在实际应用中,一个可用的订单分配算法需要满足几下几个要求:

 

1. 实时计算、运行效率高

以滴滴平台为例,每天平台日订单3000万,这对算法的实时性和复杂度有了很高的要求;

 

2. 平衡效率、体验等多个目标

在订单分配算法中,平台不仅要考虑整体的匹配效率,还需要满足司乘体验的要求、公平性、可解释性以及平台长期增长的诉求。如何将这些目标有机地结合在一起是一大难题。

从上述分析可知,派单任务无法简单地由人工配置进行,其对机器算法有着很强的依赖。从另一个角度来说,派单算法也是人工智能、机器学习、运筹优化等研究领域很好的实验土壤。综上,派单问题可以作为学术和工业界结合的重要应用之一。

 

3.研究目标

针对上述关键问题,研究目标包括不限于:

 

1. 匹配算法框架

在订单分配问题中,一个重要的特性是其存在网络效应和时序效应。具体来说,网约车为一个司乘的双边市场,司乘间的匹配皆不是互相独立的,其在时间和空间上组成了一个网络状的结构。同时,派单中需要考虑平台效率、司乘体验、公平性等多种因素,形成了多目标优化的问题。因此,设计一个可满足以上条件的匹配框架,平衡优化目标和约束,并综合时间序列和空间匹配要求,非常有研究价值。

 

2. 个性化派单

根据用户实时状态以及用户特性的不同,进行个性化的分单,以提升司乘和效率。

 

3. 派单公平性和可解释性

滴滴的线上分单系统每天为大量的司机和乘客服务,其服务对象均为有感情有诉求的个体,故算法的可解释性和公平性往往与平台效率、体验处于同样重要的作用。如何把公平性引入优化目标或约束中,并生成可解释可回溯的匹配标准,也是算法必须要考虑的问题。

 

注意

更多项目信息

请关注主题研究计划官方主页:

https://outreach.didichuxing.com/RFP

 

本文来自 滴滴学术合作 微信号。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480738.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

笔记:seafile 7.x 安装和部署摘要

文章目录1. 安装1.1. 注意事项1.2. 企业微信集成并支持自建第三方应用配置1.3. 内置 Office 文件预览配置1.3.1. 安装 Libreoffice 和 UNO 库2. 主要功能2.1. 服务器个性化配置2.2. 管理员面板2.3. seafile 命令行使用教程2.3.1. ubuntu安装2.3.2. init 初始化seafile配置文件夹…

文章合集

Hi 大家好,我是陈睿|mikechen,这是优知学院的所有文章集合,专门整理这个页面,希望会对大家在浏览感兴趣文章的时候,能有更好的帮助! 这些文章的呈现,并不是按照时间轴来排序,无论是新旧文章&…

领域应用 | 阿里发布藏经阁计划,打造 AI 落地最强知识引擎

如果没有知识引擎,人工智能将会怎样?知识引擎可以把数据加工成信息,信息和现有的知识通过推理能够获得新的知识,从而形成庞大的知识网络,像大脑一样支持各种决策。你与智能音箱进行对话,背后就是基于知识引…

ACL2020 | FastBERT:放飞BERT的推理速度

FastBERT 自从BERT问世以来,大多数NLP任务的效果都有了一次质的飞跃。BERT Large在GLUE test上甚至提升了7个点之多。但BERT同时也开启了模型的“做大做深”之路,普通玩家根本训不起,高端玩家虽然训得起但也不一定用得起。 所以BERT之后的发展…

2017年双十一最全面的大数据分析报告在此!+2018年双十一已经开始,厚昌竞价托管教你如何应对流量流失?+2019年双十一大战一触即发:阿里、京东都有哪些套路和玩法

首先说一个众所周知的数据:2017年双十一天猫成交额1682亿。 所以今天,从三个角度带你一起去探索1682亿背后的秘密: 1、全网热度分析:双十一活动在全网的热度变化趋势、关注来源、媒体来源以及关联词分析。 2、各平台对比分析&…

阿里P8架构师谈:大数据架构设计(文章合集)

架构师进阶有一块很重要的内容,就是需要掌握大数据的架构设计,主要涵括: MySQL等关系式数据库,需要掌握数据库的索引、慢SQL、以及长事务的优化等。 需要掌握非关系式数据库(NoSQL)的选型,以及…

论文浅尝 | 利用 RNN 和 CNN 构建基于 FreeBase 的问答系统

Qu Y,Liu J, Kang L, et al. Question Answering over Freebase via Attentive RNN withSimilarity Matrix based CNN[J]. arXiv preprint arXiv:1804.03317, 2018.概述随着近年来知识库的快速发展,基于知识库的问答系统(KBQA )吸引了业界的广…

positional encoding位置编码详解:绝对位置与相对位置编码对比

本文转载自公众号“夕小瑶的卖萌屋”,专业带逛互联网算法圈的神操作 -----》我是传送门 关注后,回复以下口令: 回复【789】 :领取深度学习全栈手册(含NLP、CV海量综述、必刷论文解读) 回复【入群】&#xf…

## 作为多目标优化的多任务学习:寻找帕累托最优解+组合在线学习:实时反馈玩转组合优化-微软研究院+用于组合优化的强化学习:学习策略解决复杂的优化问题

NIPS 2018:作为多目标优化的多任务学习:寻找帕累托最优解多任务学习本质上是一个多目标问题,因为不同任务之间可能产生冲突,需要对其进行取舍。本文明确将多任务学习视为多目标优化问题,以寻求帕累托最优解。而经过实验…

手把手教你求职进入BAT

“ 最近利用部分的时间,帮助了好几位读者朋友进入了自己心仪的公司,以下我会谈到,求职简历方面给到他们的建议。 如果你本身具备很强的实力,不要因为对求职简历细节不重视,反而痛失良机。 求职加薪,除了…

one-hot(独热)、bag of word(词袋)、word-Embedding(词嵌入)浅析

目录 词袋模型 one-hot word-embedding 我们知道,传统的数据挖掘任务面向的是结构化数据。结构化数据很好理解,就是很有结构的数据嘛。 比如下面这张银行客户数据库中的表格: 编号 姓名 年龄 年收入 职业 有无欠贷 01 夕小瑶 16(…

德勤发布《 2020 亚太四大半导体市场的崛起》报告,美国收入占比达到47%,中国大陆仅占 5%

德勤发布《 2020 亚太四大半导体市场的崛起》报告(以下简称《报告》),《报告》指出: 亚太地区半导体市场正在全球加速崛起,中国大陆、日本、韩国和中国台湾,占据全球半导体总收入前六大国家/地区的四席。美…

干货 | 机器学习算法在饿了么供需平衡系统中的应用

干货 | 机器学习算法在饿了么供需平衡系统中的应用 image:url(https://ask.qcloudimg.com/avatar/1292807/6341kxs4h2.png?imageView2/2/w/72)">用户1292807发表于携程技术中心订阅830作者简介陈宁,饿了么人工智能与策略部高级算法专家,负责供…

研讨会 | “人工智能与行业知识图谱技术实战”研讨会

人工智能时代2017年7月,国务院《新一代人工智能发展规划》明确提出“建立新一代人工智能关键共性技术体系”的重点任务和设立“新一代人工智能重大科技项目以及“1N”人工智能项目群”,特别强调“研究跨媒体统一表征、关联理解与知识挖掘、知识图谱构建与…

Sigmoid函数与Softmax函数的区别与联系

目录 缘起逻辑回归 Sigmoid Softmax 缘起逻辑回归 逻辑回归模型是用于二类分类的机器学习模型(不要说逻辑回归可以做多类分类啊喂,那是二类分类器的组合策略问题,而与逻辑回归分类器本身的构造没有半毛钱关系啊)。 我们知道&…

数据挖掘算法(logistic回归,随机森林,GBDT和xgboost)-腾讯云社区

机器学习就是样本中有大量的x(特征量)和y(目标变量)然后求这个function。(了解更多可以看: https://zhuanlan.zhihu.com/p/21340974?refermlearn ) 求函数的方法,基于理论上来说&am…

阿里P8高级架构师教你如何通过BAT面试顺利拿到offer

“ 在开始面试之旅之前还是要多说几句,选公司是要看时机的 ,建议先去小公司试试水,找找感觉,其次建议选熟人内推,也是对面试成功率有帮助的,那么就开始今天的面试之旅吧。 一:招聘方式 BAT技术…

论文浅尝 | SenticNet 5: 借助上下文嵌入信息为情感分析发现概念级别的原语

Citation: Cambria E, Poria S, Hazarika D, et al.SenticNet 5: discovering conceptual primitives for sentiment analysis by meansof context embeddings[C]//AAAI. 2018.概述目前大部分的人工智能的研究都集中在基于统计学习的方法,这些方法需要大量的训练数据…

文本匹配(语义相似度)综述

本文转载自公众号“夕小瑶的卖萌屋”,专业带逛互联网算法圈的神操作 -----》我是传送门 关注后,回复以下口令: 回复【789】 :领取深度学习全栈手册(含NLP、CV海量综述、必刷论文解读) 回复【入群】&…

大型网站架构设计

“ 大型网站的架构设计,涉及到的面非常多,并不像大家想象的那样,就是一个网站这么简单,今天抛砖引玉,希望能给想从事互联网行业的同学一点初步的概念。 架构设计,其实就要清楚整个大型网站技术架构的演变…