[人工智能教程] 人工智能暑期课实践项目建议

哈工大人工智能暑期课实践项目建议

这个博客介绍了暑期课实践作业的建议。
时间:7/10 - 7/22. 一周上课, 一周项目实践。
要求:项目实践的过程请用公开的博客记录。 项目的源代码请放到 github 中。

每4 ~ 5 人一个小组,从下面的候选中选择题目:

1)手写数字识别增强版。 在 MNist示例程序 的基础上进一步扩展,
阶段要求:

  1. 能实现多个数字的手写体识别
  2. 能实现加减乘除符号的识别
  3. 能做一个手写体识别四则运算的APP (可以是网页服务或手机App)

微软讲师提供:识别单个字符的基本版程序。
给学生的建议:我们通过这个练习要学会如何增量改进人工智能模型(把已有模型加强,多个模型的合作)。
另外,我们借用这个练习来学习 OCR 的通用流程,看看有哪些可以重用的地方。
工程上的建议:先设计整个流程,并写完程序框架。把整个程序跑通后,再关心如何提高识别质量。

2) 识别海报照片中的信息并给用户提醒。
场景:你路过一个海报, 上面写了“某年某月某日 有某某活动”, 觉得有点意思,就随手照了一张照片,继续办你的事情去了。 过了一会儿,你的手机自动给你加了一个提醒,提醒内容就是刚才看到的那个海报,但是程序自动识别了海报的日期,标题,地点等关键信息。你的手机上还有其他很多照片,但是 AI 程序并没有把那些照片搞成提醒, 它是怎么做到的呢?

微软工程师提供:一个基本的框架,并在课程中使用这个框架
给学生的建议:
收集训练数据,比如从网上爬取,自己从校园内收集
大量数据需要标记,考虑使用或自制工具辅助标记工作

3) 控制智能家居
在微软讲师提供的实例程序之上,增加新的场景
典型场景:
可以通过语音下达指令。
支持自然语言的多轮对话,如“打开卧室的灯。厨房的也打开。”
通过个性化的语音(如学生自己的语音)进行反馈。
微软讲师提供:语音控制开关灯的示例程序
给学生的建议:
通过微软认知服务语音转文本、语言理解来识别声音输入。
可以尝试通过识别特定的词汇来判断是否是后几轮对话,并复用之前识别出的上下文。
通过微软认知服务文本到语音转换来实现个性化语言输出。

4) 漫画的文字翻译
场景:很多优秀的漫画都是英文或日文的,我们能否用AI 把这些漫画中的文字抠出来,翻译为中文,并把中文再放回原来的地方,这样用户可以马上看到中文的漫画了?
阶段要求:
能替换、翻译基本的文字
能替换、翻译特殊字体的文字(如装饰性文字、音效文字)
能保持原有文字的字体和风格
微软讲师提供的材料:Microsoft Cognitive Service 介绍和示例程序。
给学生的建议:深入了解认知服务中视觉、语言以及必应的服务。着重在如何将几种服务集成到一起,设计出解决问题的流程。避免一开始将太多时间花在界面、数据等问题上。

5) 打造一个 黄金点 竞赛平台并用AI 程序参与比赛
详情见: 黄金点游戏

6)自选项目 (项目必须通过老师的审核,请准备 NABCD 的项目提案文档)

作业要求

  1. 创建一个团队博客,(可以在csdn.net 或 cnblogs.com), 请把博客地址告诉老师(发布到微信群里)
  2. 博客1:列出团队要实现的项目和大致的计划,列出项目的源代码仓库(见下面第3点),博客必须有一个团队成员在工作的照片(可以遮挡脸部)。
  3. 博客2:项目结束后,写一个博客描述项目的进程,软件的功能演示(可以录制视频或截屏),以及你在这个过程中碰到的困难, 对AI 工具的反馈,等。
  4. 在Github 创建一个公开的项目,把项目的代码签入到那里。 希望可以看到每天大部分队员都有代码签入,而不是最后一天 所有代码 “神奇地” 由一个成员签入。没有中间的签入代码的,项目部分得 0 分。 另外,项目可以使用外部的模块/数据/AI模型,请说明模块/数据/模型的来源,并尊重知识产权和遵守使用的要求。如果违背原来作者的使用协议,则项目部分得 0 分。
  5. 检查标准:
    博客1, 博客2,Github 的程序能够被 clone 并能在一个全新的机器编译成功,基本功能运行成功。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/500339.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

新手一小时就写出人工智能应用 - 看图识熊

来不及了,先上车: 人工智能开发案例 熊的分类 如何安装必要的工具并配置环境呢,请看这个详细的解说 今后会有更详细的文字版在这个专题出现。 如果有对这个教程有疑问,请在这里留言。

c++ 线性回归_模型之母:简单线性回归的代码实现

模型之母:简单线性回归的代码实现关于作者:饼干同学,某人工智能公司交付开发工程师/建模科学家。专注于AI工程化及场景落地,希望和大家分享成长中的专业知识与思考感悟。0x00 前言 在《模型之母:简单线性回归&最小…

AI应用开发实战系列之四 - 定制化视觉服务的使用

AI应用开发实战 - 定制化视觉服务的使用 本篇教程的目标是学会使用定制化视觉服务,并能在UWP应用中集成定制化视觉服务模型。 前一篇:AI应用开发实战 - 手写识别应用入门 建议和反馈,请发送到 https://github.com/Microsoft/vs-tools-for-…

server sql 众数_sql 语句系列(众数中位数与百分比)[八百章之第十五章]

众数众数就是出现最多的那个数。select sal,count(*) as cntfrom empwhere DEPTNO20group by sal通过分组把他们的行数计算出来。那么最关键的部分在于,你如何知道最大值。是的我们可以查出当前最大值,然后再取出最大值的sal。但是这肯定要用到两个临时视…

【干货】快速部署微软开源GPU管理利器: OpenPAI

介绍 不管是机器学习的老手,还是入门的新人,都应该装备上尽可能强大的算力。除此之外,还要压榨出硬件的所有潜力来加快模型训练。OpenPAI作为GPU管理的利器,不管是一块GPU,还是上千块GPU,都能够做好调度&a…

python调用ansysworkbench_Workbench通过Python设定材料参数

微信公众号:CAE技术分享以下一段代码是在Workbench中通过Python设定材料的弹性模量和泊松比参数:# encoding: utf-8# Release 16.0SetScriptVersion(Version"16.0.361")template1 GetTemplate(TemplateName"EngData")system1 temp…

现代软件工程 结对/团队作业 - 汉字的 2048 + 俄罗斯方块

一个很有趣的软件工程/编程作业,如果把汉字构成的规律运用在 2048 俄罗斯方块这样的游戏中,会有什么效果呢? (链接1, 链接2) 既然是软件工程的作业, 那就要体现出一些工程的特性: 作业要求: 1) 学生自行…

invoke 按钮点击_h5+ app内点击按钮实现复制功能 实现方法

在项目中由于要实现点击按钮复制功能,我用的是H5APP,实现代码如下(包括安卓IOS):/*** //参数copy是要复制的文本内容* tip 复制成功后的提示语,可空*/function copy_fun(copy,tips) {if(!tips){tips"已成功复制到剪贴板"…

机器学习平台建设

本文从机器学习平台的架构开始,再到具体的功能,然后从需求的角度带给读者思考,找到合适的机器学习平台建设之路。最后,推荐了微软开源开放的机器学习平台OpenPAI,是可私有部署的机器学习训练平台。 本文不少要点都可以…

型管件的作用_管道工程基础 - 管件和管道附件的布置规定

概述1.1 管件的用途1.2 管件的种类根据管件的端部连接形式可将管件分为对焊连接管件、承插焊连接管件、螺纹连接管件、法兰连接管件以及其它管件。管件和管道附件的布置2.1管件的布置(1)弯头宜选用曲率半径等于1.5倍公称直径的长半径弯头;输送气固、液固两相流物料的…

现代软件工程 作业汇总

文档属于这个专栏: ​​​​​​现代软件工程讲义 目录_SoftwareTeacher的博客-CSDN博客 备份:现代软件工程课程 参考:各个学校的编程/软工作业列表 ------- 软件工程的作业 ------- 很多老师反映软件工程的作业题不好出,学生做的…

现代软件工程 作业 第一周博客作业

(软件工程作业汇总) 第一周的博客作业 (这是历届学生的练习中, 从各个老师的作业中汇集而来,特别是北航的作业,东北师大的作业) 1. 介绍自己,建博客 在 http://www.csdn.net 建账号。关注老师和助教,关注一些和你一起…

java grpc 客户端处理 go 服务端多返回值_grpc基础实践(二)

在此篇中我们将简要介绍关于grpc对java客户端的实现。在开始开发前,我们需要先导入io.grpc grpc-netty 1.11.0io.grpc grpc-protobuf 1.11.0io.grpc grpc-stub 1.11.0如果是Android除了这几个包外,你可能还需要一个javax.annotation:javax.annotation-ap…

现代软件工程 作业 团队第一个作业

这是现代软件工程作业系列的一部分 1. 团队成员介绍 介绍每个成员(照片,主页,技术特长,在团队中担任的角色)。 建议拍一张有创意的合影。 在介绍的时候,可以采用艺术照等形式, 保护同学的隐私,不想说明真实…

asp.net 文本框显示xml格式数据_Excel 办公小技巧,查找和替换数据,您值得拥有...

在数据处理的过程中,有时需要在工作表中查找一些数据,以便查看或修改数据。若工作表的数据能一目了然,则可手动进行查找,但在记录繁多的工作表中查找所需数据并替换,效率比较低,而且极易出现遗漏。这时就可…

webpack打包后的文件夹是空的_vue+webpack 打包文件 404 页面空白的解决方法

{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里云文件存储NAS是一个可共享访问&#xf…

微软认知服务应用秘籍 – 与机器人聊知识

在本篇博客中,我们将会学习到零代码情况下,如何利用已有的技术建立自己的知识问答系统,这种系统的可以广泛适用于学校、企业、客服、政府公开信息等领域,代替传统的电话咨询、电子邮件沟通等高人工负荷的方式。 建立知识库 什么…

.net 开发怎么实现前后端分离_ASP.NET Core模块化前后端分离快速开发框架介绍

源码地址GitHub:https://github.com/iamoldli/NetModular演示地址地址:http://118.24.75.170:6220/账户:admin密码:admin前端框架演示地址(临时)地址:http://progqx5cu.bkt.clouddn.com/skins/index.html#/账户&#x…

微软认知服务应用秘籍 – 支持跨平台客户端的视觉服务中间层

不断演进的应用场景 初级应用场景—宅在家里 场景:Bob同学有一天在网上看到了一张建筑物的图片,大发感慨:"好漂亮啊!这是哪里?我要去亲眼看看!"Bob同学不想问别人,可笑的自尊心让他…

python建立列表并输入_python操作列表

遍历列表 for magic = [a,b,c] for m in magic: print(m) 输出控制台 image.png 深入for以及for之后进行操作 for m in magic: print(m.title()+ good boy) print(hahaha) 输出控制台 image.png 创建数值列表 使用函数range for value in range(1,5): print(value) 输出控制台 …