机器学习------精心总结

1.数学

  1. 偏差与方差
  2. 拉格朗日
  3. 核函数
  4. 凸优化
  5. 协方差矩阵
  6. Hessian矩阵
  7. CDF(累计分布函数)
  8. 高斯概率密度函数
  9. 中心极限定理

2.机器学习

Java 机器学习 工具 & 库


1.处理小数据效果好
2.深度学习—大数据,超过500w;图像,语言方面效果奇好


  • SVD

  • 最小二乘法

  • 梯度下降法
  • 局部加权回归

    1.最大似然估计
    2.logistic回归
    3.感知器的初步—logistic的简化情节

  • 牛顿法

    1.介绍了牛顿方法
    2.广义线性模型
    3.多项式分布,softmax回归

  • 高斯判别分析

    1.高斯判别
    2.朴素贝叶斯

  • EM

  • 隐马尔可夫模型
  • 决策树向量机

决策树算法介绍及应用

  • K近邻
  • 支持向量机
  • PageRank
  • 强化学习
  • LDA
  • PCA
  • pLSA
  • LSI
  • ICA
  • 最大熵模型
  • 条件随机场
  • 最大熵隐马尔可夫模型
  • Gradient Boosting
  • K-Means
  • 贝叶斯逻辑斯蒂克回归
  • 关联规则挖掘
  • 随机森林

3.信息论

  1. 压缩率很高的数据结构
  2. 信息熵与信息增益
  3. 数据压缩原理
  4. 香农游戏
  5. 二维码原理

4.深度学习

机器学习的一个分支
各种编程语言的深度学习库整理
深度学习如何入门(知乎)
Elephas:Apache Spark上的Keras深度学习框架


  1. 感知器
  2. 反向传播算法
  3. 自动编码器
  4. 栈式自编码器
  5. 微调多层自编码算法
  6. 深度信息网络
  7. softmax回归
  8. 白化
  9. 池化
  10. 受限玻尔兹曼机
  11. 稀疏编码
  12. 递归神经网络
  13. 卷积神经网络—图像识别,语音识别,,.
  14. 前馈神经网络

5.全文检索

  1. 搜索建索引过程
  2. 搜索评分过程
  3. 搜索查询分析器
  4. Rocchio相关反馈算法
  5. 向量空间模型
  6. BM25基于概率的搜索评分
  7. Lucene源码分析
  8. solrcloud
  9. Solr空间搜索原理
  10. GeoHash算法
  11. 地理空间距离计算原理
  12. WAND检索算法
  13. 智能化信息检索模型
  14. Kullback-Leibler距离/相关熵
  15. 交叉熵

6.计算广告

  1. 正文广告
  2. 上下文广告
  3. 显示广告
  4. 合约广告
  5. 竞价广告
  6. 搜索广告
  7. 受众定向
  8. 竞价广告的定价机制
  9. eCPM估计
  10. 广义第二高价
  11. 精准人群定向
  12. 实时竞价
  13. 广告交易平台
  14. 需求方平台(DSP)程序购买
  15. 广告有效性原理
  16. 二部图匹配算法
  17. HWM算法
  18. 点击流挖掘
  19. 广告系统的一些商业模式
  20. 实时反作弊
  21. CTR点击预测
  22. 架构

7.自然语言处理


  • NLTK

  1. N-gram语言模型
  2. 词共现/TFIDF
  3. 噪声信道模型
  4. 统计分类模型
  5. 语义相关性
  6. 基于HMM的词性标注
  7. 统计语言模型的评价方法
  8. 扩充转移网络
  9. 动态规划算法
  10. 最小编辑距离
  11. 浅层句法分析技术
  12. 知识库的构建
  13. 命名实体识别
  14. 未登陆词识别
  15. 语言模型结构设计
  16. 树邻近语法
  17. 文本建模
  18. 随机上下文无关文法
  19. 概率上下文文法
  20. 同义词自动构建(词共现,基于浅层语法分析)
  21. 文本分类技术

8.架构

  1. OOP
  2. 聊天系统/实时高效信息系统架构与源码
  3. Bloom Filter 过滤器
  4. 分布式时钟(逻辑时钟) 同步技术
  5. SCALA
  6. Netty
  7. Jetty
  8. 一致性Hash
  9. 分布式基本组建
  10. 原子广播

9.爬虫

  1. 爬虫原理
  2. 分布式架构
  3. 通用爬虫
  4. 主题爬虫
  5. Nutch
  6. Xpath
  7. 网页去重
  8. URL去重

10.应用

  1. 人脸识别
  2. 垃圾邮件分类
  3. 文本聚类
  4. 语音合成(分解)
  5. 语音识别
  6. 手写识别
  7. 推荐系统
  8. 文档主题分析
  9. 二进制权限系统
  10. 搜索引擎关键字智能提示
  11. 最小敏感局部hash算法
  12. Simrank
  13. 手写输入法
  14. 为文本生成关键词和摘要
  15. 拼音缩写提取
  16. 汉字转拼音/拼音转汉字
  17. 机器翻译
  18. 自动提取标签
  19. 图片提取标题
  20. 文字生成图像
  21. 问答系统

11.Github中的开源项目

值得mark的11个开源机器学习项目


1.scikit-learn Github:scikit-learn
2.Shogun
Github:shogun
3.Accord Framework/AForge.net
Github:Accord Framework/AForge.net
4.Mahout
5.MLlib
6.H2O
Github:H2O
7.Cloudera Oryx
8.GoLearn
9.Weka
10.CUDA-convnet
11.ConvNetJS
Github:ConvNetJS

12.个人收集网址

  • Microsoft Research
  • 机器学习温和指南
  • 从零实现来理解机器学习算法:书籍推荐及障碍的克服
  • 伯乐在线—机器学习
  • Coursera
  • 台湾机器学习课程
  • 机器学习之开源库大总结
  • 推荐!国外程序员整理的机器学习资源大全
  • 机器学习经典书籍
  • 机器学习经典论文/survey合集
  • 人工智能和机器学习领域有哪些有趣的开源项目
  • 机器学习该怎么入门(知乎回答)
  • 整理:深度学习 vs 机器学习 vs 模式识别

13.机器学习需要了解的人物

1.吴恩达

2.中国大牛组

  • 周志华
    个人主页
  • 杨强
    个人主页
  • 李建中 —分布式数据库
  • 唐杰 —图挖掘
    个人主页
  • 张钹
  • 刘铁岩
    个人主页
  • 王海峰 —信息检索,NPL,机器翻译
    个人主页
  • 何晓飞 — 多媒体处理,图像检索,流型学习
    个人主页
  • 朱军
  • 吴军
    个人主页
  • 张栋
    个人主页
  • 戴文渊
    个人主页
  • 李航—华为诺亚方舟实验室
    华为诺亚方舟实验室

《中国大牛组》资源来源于小木虫
小木虫


14.会议论文收集

15.书籍

1.PRML—Pattern Recognition And Machine Learning
豆瓣

转载于:https://www.cnblogs.com/hellochennan/p/5424162.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/288031.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mysql命令去重_MySQL去重的方法整理

{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里云数据库专家保驾护航,为用户…

NuGet包管理平台

这节来讲一下.NET下的包管理平台:NuGet。简介我们做一个项目,除了自己的代码文件之外,实际上还要引用诸多代码文件,这些文件可能是我们自己封装的底层框架代码,或者为了完成某个功能而引用的工具类文件等等。在.NET里边…

【ArcGIS风暴】ArcGIS影像批量裁剪(分幅)方法总结

实际工作中经常需要采用规则格网或标准分幅格网去对影像进行分幅。ArcGIS提供了强大的影像批量裁剪(分幅)的功能,常规的方法是利用掩膜提取工具手工重复裁剪,费时又费力,裁到让GISers怀疑人生。。。。。当然了如果你是个码农,会使用Python语言的话就很简单了。前面也有文…

Python变量的复制

Python变量的复制 dic {a: 1} dic_fake_copy dic dic_fake_copy.update({b: 2}) print dic_fake_copy %s % dic_fake_copy print dic %s % dic 输出结果为: In [6]: print dic_fake_copy %s % dic_fake_copy dic_fake_copy {a: 1, b: 2}In [7]: print dic %s…

看得懂的设计模式 享元模式python3 最基本(简单)实现

在考量系统内存合理使用时,通过享元模式可降低性能压力以及降低资源占用;主要实现是通过共享数据这一思想实现资源的合理分配。 在开发项目时,很多情况下会存在过多的相似对象,该对象有相同的共同点,该共同点在程序设…

剑指offer之最小的K个数

1 问题 输入N个整数,找出其中最小的K个,例如输入数组6、5、1、4、 2、 7、 3、 8,最小的4个数是1、2、3、4 2 分析 1)我们可以用快速排序从小到大,但是时间复杂度是O(nlogn) 我们取出最前面的K个数就行。 2&#xf…

JCheckbox全选

在实际的使用过程中的一些小技巧。在图形界面的编程中,复选框一般是多个在一起,如果要进行全选时,则要将复选框全部设置setSelected为true,那么如果当前容器里面的复选框很多的时候怎么办呢,我们可以采用向下转型来完成…

creo管道设计教程_CREO/PROE产品设计教程之四芯花线建模,加深对关系式的认识...

阅读完,如果觉得有用,那么点击"关注"和点赞是对作者的一种尊重和鼓励。版权所有,抄袭必究。春节前,基本敲定和相关知名出版社在2020年的图书创作及出版计划。文:钟日铭我曾经介绍过三芯"花线"建模…

如何使用JWT进行身份验证与授权

简介JWT定义了一种紧凑的、自包含的方式,用于作为JSON对象在各方之间安全地传输信息。该信息可以被验证和信任,因为它是数字签名的。工作流程1、用户使用账号、密码登录应用,登录的请求发送到认证服务器。2、认证服务器进行用户验证&#xff…

云应用基础技术成熟需七年时间

本文讲的是云应用基础技术成熟需七年时间,【IT168 资讯】市场研究机构Gartner, Inc.近期认为尽管云计算市场目前正处于活跃、增长和高潜力时期……  市场研究机构Gartner,Inc.近期认为尽管云计算市场目前正处于活跃、增长和高潜力时期,但是在云计算或服…

Qt 第一步 HelloWorld 的第一个程序

简言 Qt 是基于C的 GUI 解决方案。QT简单易学(底层封装的好)、跨平台、相关资料易得到。 开始写Qt 相关的文章的主要原因是,我本人在编写一个视频录制及相关处理的项目,写到一半发现.net winform 相关UI的处理限制较大&#xff…

ArcGIS 10.x属性表乱码问题解决办法

ArcGIS 10.x的版本,文件属性表老出现乱码的问题。 解决方法:在Cmd命令行中输入以下命令: reg add HKEY_CURRENT_USER\Software\ESRI\Desktop10.6\Common\CodePage /v dbfDefault /t REG_SZ /d 936 /f 版本找对应的该就行,10.2 …

SAP MM 采购订单收货被取消了还是不能增加新的delivery cost!

SAP MM 采购订单收货被取消了还是不能增加新的delivery cost! PO# 8500015169, we did GR and cancelled GR, there is no IR for this PO at present. ME22N, try to add a delivery cost ZCIP in the item, You cannot enter new delivery costs Message no. V1631 Diag…

样式中文字和图片对齐问题

html中,在图片和文字对齐的时候,一直没有达到想要的对齐效果,发现使用position中的相对定位绝对定位paddingmargin可以达到需要的效果。转载于:https://www.cnblogs.com/TheoryDance/p/5424456.html

webots仿真报警[ERROR] [1703399199.459991029]: Sampling period is not valid.

一、故障现象 在运行interace传感器使能程序时,报警[ERROR] [1703399199.459991029]: Sampling period is not valid. [ERROR] [1703399199.460080083]: Failed to enable lidar.并发生崩溃。 二、解决方式 1、尝试将程序中的TIME_STEP数值改为与WOrldInfo中的bas…

剑指offer之调整数组顺序使奇数位于偶数前面

1 问题 输入一个整数数组,实现一个函数来调整该数组中数字的顺序,使得所有奇数位于数组的前半部分,所有偶数位于数组的后半部分,比如数组{6、 5 、1、 4、2 、7 、3、8、9}我们调整后变成这样{9、5、1、3、7 、2 、4 、8、6} …

负基础学python编程_【数据科学系统学习】Python # 编程基础[二]

在上一篇中我们讲到了函数,如果你想在所编写的别的程序中重用一些函数的话,应该怎么办?正如你可能想象到的那样,答案是模块(Modules)。我们这一篇就从模块说起。模块为了编写可维护的代码,我们把很多函数分组&#xff…

【JX4G】JX4G摄影测量工作站快捷键大全

本文章总结了JX4G数字摄影测量工作站中常用的快捷键及其用法。 JX4G快捷键一览表序号快捷键作用描述1X删除可以框选,右键删除2C强制闭合可以闭合等高线等3S图形映射开关控制二维图形在三维立体中的显示4Z输入高程值可锁定高程5T流线和折线之间互换流线和折线之间互换…

python3 最简单的实现 模版设计模式

在项目开发过程时,遇见某些子类的逻辑处理流程大致相同,可是用模板模式减少代码冗余,降低耦合。 例如实现某一窗体或者页面启动时,第一步需要加载启动界面图片资源,第二步加载个人信息,第三步加载个人钱包…

《代码整洁之道》读书笔记-1

前言:我最近在读《代码整洁之道》这本书,在读的过程中发现如果只是读,不动手做点什么的话,总感觉少了点什么,于是就写点总结,给自己加深印象。当然,本文只是理论,不会讨论如何写出整…