2021年算法工作总结

2021年5月10日,我转行到互联网做算法工作,离开了工作接近8年的机械设计工作,还是要在这里感谢军哥对我的帮助和指点!

换工作后,陆续学了《流畅的python》,FastAPI框架学了点皮毛,python web 编程学了点,LeetCode的算法题还在写,新年还是要抽时间多学习新的知识。

下面对自己的算法工作做一些总结:

  • 如果没有标注数据,一开始需要自己先标注少量的数据,对数据的特点进行大致的归类

  • 能用简单规则去解决相当一部分的问题(就是一个简单的手写决策树:if - else)

  • 需要抽样估计一下有多少 case 漏召回,可以将算法中的一些规则放松一些,看看有多少例子被召回,此时召回率会上升,准确率会有所下降,用这样的方法去看看,算法有没有漏掉很多问题,尽量把这个规则算法的召回率做高,准确率保证在20%-30%以上都可以

  • 根据规则算法把召回来的case自己进行标注,注意各类样本的比例是否合适,避免后面标注人员的无效工作,注意什么标注方法比较合理,或者编写标注工具,需要和业务方就标注标准达成共识

  • 拿到标注结果后,抽样检查标注结果一致性如何,确定是否要进行二次标注或修改

  • 数据准备好之后,会发现规则算法越写越复杂,解决了一部分问题,另一些问题又冲突不对了,准确率和召回率的跷跷板来回倒腾,可以使用GBDT等树模型进行机器学习,抽取一些特征,如是否有疑问词,是否有,编辑距离是多少(参考加州房价项目),一种特征的one-hot维数比较大,可以考虑分桶降维,不断的加入特征,提高准确率,可以用sklearn搜索参数,看看比较重要的特征是哪些

  • 如果到这步效果已经可以了(业务认可业务场景下的效果,注意不要拿算法研发的中间结果说明问题),那就可以收敛了,毕竟机器学习的计算成本还是比较小的

  • 如果还不能满意,考虑深度学习算法,使用BERT,ERNIE等大模型进行学习

  • 出来一版算法的结果时,去分析混淆矩阵中的 badcase,发现 badcase 的共同特征,把这个特征加入到模型当中,通过分析还可能发现 有的 case 就是人漏标了,有的 case 就是人标错了,汇总各类问题的分布比例是如何,找准问题的大头去努力解决

  • 如果需要的话,还可组合更复杂的模型,比如底层用多个深度学习模型,预测的结果作为上层模型的特征,另外再添加一些其他的特征,一起提供给上层的模型(可以是机器学习模型或者深度学习模型),需要注意标注的数据量是否足够多能满足模型这么多参数的学习

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/471288.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

学硕计算机考296算高分么,考研总分是多少算高分?考研340分是什么水平?

原标题:考研总分是多少算高分?考研340分是什么水平?每个考研的学生都想考一个高分,分数越高代表录取的希望越大,但是考研达到多少分算高分呢?有没有衡量考研分数的标准呢?小编为大家整理了关于考研总分高分相关的相关信息,一起…

HDU 4117 GRE Words

这道题不难想到这样的dp。 dp[字符串si] 以si为结尾的最大总权值。 dp[si] max(dp[sj]) &#xff0c;1.j < i&#xff0c;2.sj是si的子串。 对于第二个条件&#xff0c;是一个多模版串匹配的问题&#xff0c;可以用AC自动机。 预先O(m)把AC自动机建好&#xff0c;然后动态…

十四、CSS 3新特性详解(二)——2D转换(transform)、动画(animation)、动画序列

HTML5 第二天 一、rotate 2d旋转指的是让元素在2维平面内顺时针旋转或者逆时针旋转 使用步骤&#xff1a; 给元素添加转换属性 transform属性值为 rotate(角度) 如 transform:rotate(30deg) 顺时针方向旋转30度 div{transform: rotate(0deg); }二、三角 <!DOCTYPE html&…

pip/conda导出 requirements.txt 注意事项

pip 使用 pip freeze > ./requirements.txt 导出 requirements.txt 发现很多包没有版本号&#xff0c;而是 file:/// 使用pip list --formatfreeze > ./requirements.txt 导入安装 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt con…

计算机系统操作在线作业,电子科大《计算机操作系统》在线作业3

计算机操作,计算机网络14春13秋 13春电子科大《计算机操作14春13秋 13春电子科大《计算机操作系统》在线作业3 1 2试卷总分&#xff1a;100 测试时间&#xff1a;--单选题、单选题(共 20 道试题&#xff0c;共 100 分。)1. 在下列性质中,哪一个是分时系统的特征()。A. 多路性B.…

fortune命令简介

本文转自《阮志峰的网络日志》&#xff0c;原文网址&#xff1a;http://www.ruanyifeng.com/blog/2015/04/fortune.html 作者&#xff1a; 阮一峰 日期&#xff1a; 2015年4月14日 美国中餐馆的最后一道菜&#xff0c;往往是小甜饼&#xff0c;叫做"幸运饼"&#xff…

conda安装pytorch1.10.1+paddlepaddle-gpu2.2.1+cuda10.2+cudnn7.6.5

NV驱动下载安装https://www.nvidia.cn/Download/index.aspx多卡的话&#xff0c;安装 NCCL https://developer.nvidia.com/nccl/nccl-download安装conda&#xff0c;并配置通道 vim ~/.condarc show_channel_urls: truessl_verify: truechannels:- https://mirrors.tuna.tsing…

十五、CSS 3新特性详解(三)——3D转换(位移、旋转、呈现)、透视perspective、旋转rotateX、Y、Z、呈现transform-style

HTML5 第三天 一、 认识 3D 转换 3D 的特点 近大远小物体和面遮挡不可见 三维坐标系 x 轴&#xff1a;水平向右 – 注意&#xff1a;x 轴右边是正值&#xff0c;左边是负值 y 轴&#xff1a;垂直向下 – 注意&#xff1a;y 轴下面是正值&#xff0c;上面是负值 z 轴&#x…

用计算机表白的数字,用数字表白的句子大全 如何用数字表白一段话

表白总是一个让人十分难忘的经历&#xff0c;如果大家想要对喜欢的人表白&#xff0c;又不好意思直说自己的想法&#xff0c;那么今天的这份用数字表白的句子大全就对你们很有帮助了。跟我一起看看&#xff0c;如何用数字表白一段话呢&#xff1f;一、用数字表白的句子大全1、3…

python 常用 time, datetime处理

python 中 time 有三种格式&#xff1a; float, struct tuple(time.struct_time 或 datetime.datetime), str 常用的&#xff1a; float --> struct tuple: time.localtime( float ) struct time tuple --> str: time.strftime(format, struct time tuple) str --> …

pip安装pytorch1.10.1+paddlepaddle-gpu2.2.1+cuda10.2+cudnn7.6.5

NV驱动下载安装https://www.nvidia.cn/Download/index.aspx多卡的话&#xff0c;安装 NCCL https://developer.nvidia.com/nccl/nccl-download配置 pip 源 vim ~/.pip/pip.conf [global] index-url https://pypi.tuna.tsinghua.edu.cn/simple安装virtualenv包pip install vir…

jQuery学习笔记系列(一)——入口函数,jQuery对象和DOM对象,jQuery选择器、样式操作、效果(显示隐藏、滑入滑出、淡入淡出、自定义动画、停止动画队列)

day01 - jQuery 学习目标&#xff1a; 能够说出什么是 jQuery 能够说出 jQuery 的优点 能够简单使用 jQuery 能够说出 DOM 对象和 jQuery 对象的区别 能够写出常用的 jQuery 选择器 能够操作 jQuery 样式 能够写出常用的 jQuery 动画 1.1. jQuery 介绍 1.1.1 JavaScript 库 ​…

计算机主机显卡安装,安装后如何在计算机中启用独立显卡

如今&#xff0c;许多朋友对他们的计算机配置不满意&#xff0c;希望将计算机配置提高一些. 现在&#xff0c;我将告诉您如何设置带有高性能图形卡的笔记本电脑.详细信息如下:1. 第一步&#xff0c;在打开计算机电源后&#xff0c;右键单击桌面&#xff0c;然后在出现的菜单中显…

RHadoop和CDH整合实例(三)- RHive

五、 RHive的安装及测试 RHive依赖于Rserve&#xff0c;所有首先需要安装Rserve(在各个namenode上)&#xff0c;接下来在所有节点上启动Rserve&#xff1a; > sudo R > install.packages("Rserve") > q() > Rserve --RS-conf /usr/lib64/R/Rserv.…

LeetCode 2144. 打折购买糖果的最小开销(贪心)

文章目录1. 题目2. 解题1. 题目 一家商店正在打折销售糖果。每购买 两个 糖果&#xff0c;商店会 免费 送一个糖果。 免费送的糖果唯一的限制是&#xff1a;它的价格需要小于等于购买的两个糖果价格的 较小值 。 比方说&#xff0c;总共有 4 个糖果&#xff0c;价格分别为 1…

在微型计算机中8m,第一部分 计算机基础知识部分习题(答案)

A)bit B)Byte C)bout D)baud95. 目前用于计算机的光盘有三大类&#xff1a;只读光盘、一次性写入光盘和_____C_____A)CD-ROM B)多媒体光盘C)可擦写光盘D)随机光盘96. 要将整屏幕打印出来应按___C_______.A)B)< Printscreen >C)< Printscreen > D)97. 与二进制数010…

淘宝弹性布局方案lib-flexible实践

2个月前&#xff0c;写过一篇文章《从网易与淘宝的font-size思考前端设计稿与工作流》总结过一些移动web中有关手机适配的一些思路&#xff0c;当时也是因为工作的关系分析了下网易跟淘宝的移动页面&#xff0c;最后才有那篇文章的总结&#xff0c;可惜的是因为项目的关系&…

jQuery学习笔记系列(二)

day02 - jQuery 学习目标&#xff1a; 能够操作 jQuery 属性 能够操作 jQuery 元素 能够操作 jQuery 元素尺寸、位置 1.1. jQuery 属性操作 ​ jQuery 常用属性操作有三种&#xff1a;prop() / attr() / data() ; 1.1.1 元素固有属性值 prop() ​ 所谓元素固有属性就是元素本…

LeetCode 2145. 统计隐藏数组数目(前缀和)

文章目录1. 题目2. 解题1. 题目 给你一个下标从 0 开始且长度为 n 的整数数组 differences &#xff0c;它表示一个长度为 n 1 的 隐藏 数组 相邻 元素之间的 差值 。 更正式的表述为&#xff1a;我们将隐藏数组记作 hidden &#xff0c;那么 differences[i] hidden[i 1] -…

飞思卡尔imx7 html5,i.MX6UL 飞思卡尔即将发布基于ARM Cortex-A7核心的低功耗处理器 i.MX 6UltraLite Processor...

i.MX6UL 飞思卡尔即将发布基于ARM Cortex-A7核心的低功耗处理器 i.MX 6UltraLite ProcessorFreescale飞思卡尔即将于7月份发布全新的基于ARM Cortex-A7核心的低功耗处理器i.MX6UL&#xff0c;主要面向车载信息处理、家庭能源管理系统、工控领域、物联网网关等应用。i.MX6UL是一…