多媒体表示、描述、编码以及通信的相关规定和标准课程总结

  • 时间:2016.10.11-2016. 11.3
  • 注意关注会议

机构

  • ITU(国际电信联盟)

  • MPEG: Moving Picture Experts Group,动态图像专家组, 是ISO(International Standardization Organization,国际标准化组织)与IEC(International Electrotechnical Commission,国际电工委员会)于1988年成立的专门针对运动图像和语音压缩制定国际标准的组织。每年举办三次会议。

  • 3GPP: 3GPP的目标是实现由2G网络到3G网络的平滑过渡,保证未来技术的后向兼容性,支持轻松建网及系统间的漫游和兼容性。 其职能: 3GPP主要是制订以GSM核心网为基础,UTRA(FDD为W-CDMA技术,TDD为TD-CDMA技术)为无线接口的第三代技术规范。

标准

MPEG标准:

  • MPEG-1/1993:11172,VCD
  • MPEG-2/1995:13818,DVD
  • MPEG-4/1999:.mp4格式的视频,目前仍在使用
  • MPEG-4 AAC/2003 /H.264
  • MPEG-7/2001:15938,检索标准,较老了
  • HEVC(2013)/H.265
  • MPEG-21

Dolby AC3标准

AVS标准

两种向量差值的表示:

  • 欧氏距离:|F1-F2|^2; 欧几里得度量(euclidean metric)(也称欧氏距离)是一个通常采用的距离定义,指在m维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离)。在二维和三维空间中的欧氏距离就是两点之间的实际距离。

  • 马氏距离: 马氏距离(Mahalanobis distance)是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为μ,协方差矩阵为Σ的多变量向量,其马氏距离为(x-μ)’Σ^(-1)(x-μ)。

JPEG2000 图像检索

问题:描述、匹配、视角问题、手机搜索

拍照过程(信息有损失):

  • 3D——>2D;

  • 成像输入——>摄像头——>去噪——>对应RGB不同的通道对图像采样——>DSP处理——>输出

描述:

Globle Feature:

  • 颜色
  • 结构
  • 轮廓

Local Feature :

  • keypoint(特征点、关键点)
  • Interesting content
  • precise localization
  • repeatable detection under variations of scale rotation(旋转、尺度等变换可重复检测)

SIFT

SIFT概念:

  • 尺度不变特征变换(Scale-invariant feature transform,SIFT),是用于图像处理领域的一种描述。

  • 这种描述具有尺度不变性,可在图像中检测出关键点,是一种局部特征描述子。

    • keypoint(特征点、关键点)
    • Interesting content
    • precise localization
    • repeatable detection under variations of scale rotation(旋转、尺度等变换可重复检测)
  • 该方法于1999年由David Lowe首先发表于计算机视觉国际会议(International Conference on Computer Vision,ICCV),2004年再次经David Lowe整理完善后发表于International journal of computer vision(IJCV)。截止2014年8月,该论文单篇被引次数达25000余次。

SIFT实现方法:

  • 金字塔形状分解(pyramids);逐级检测

  • 尺度空间(scale space);DOG method

仿射(Affin Transform, AT)

包括:旋转、倾斜、平移、缩放

第二课

MPEG-1

  • CD11172-1,音频(A、B、C、D、E、F、G)

  • 帧同步:CD11172-2,视频。

  • 注意:encoder issue编码器问题,只要编码后的码流符合标准即可,对编解码器并没有规定,其中涉及优化问题。

MPEG-1 :13818(视频标准)

帧内编码:

audio(听觉)

  • Bn=20KHZ,Fs=44.1KHZ,或是48KHZ Bps=16bit

voice(语音)

  • Bn=3.4KHZ->4KHZ ,Fs=8KHZ Bps=8bit

MPEG Audio

  • Audio layout2 ——MP2:时域上编码

  • Audio layout3 ——MP2:滤波器组,切割成32个子带

  • AAC MP3有更大的采样率:8-96KHZ,更大的比特数和更长的帧长

编码器

  • CELP:较有名的编码器, 基于模型的编码
  • MIDI

三基色:RGB

  • 16777216种颜色

  • 4096/2048 量化,取最大值

描述图像,用于检索的指标有

  • PBC
  • SRC
  • Edge histogram
    注意:旋转不变性,解决的是角度问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/242845.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

建模与仿真的流程

建模与仿真的流程 以例子为例 第一步:建立模型,列出输出表达式 第二步:解出输出方程 可以参考:解单位冲激 第三步:在simulink中建立仿真图 ctrlr:表示旋转90 按住ctrl可以引出多条线 点击保存&…

AD制图相关问题总结

AD制图总体步骤新建一个工程文件File ->New->Project->PCB.Project->save新建原理图在此工程目录下新建原理图与PCB并保存 File ->New->Schematic->save生成PCB(前提是原理图已完成且没有错误)File->New-> PCB->save&…

vcs 入门

synopsys vcs 软件是仿真和验证的软件,必须掌握。 vcs 即 verilog compile simulator 支持 verilog, systemVerilog, openvera, systemC等语言,同时也有代码覆盖率检测等功能。 可以合第三方软件集合使用,例如 Vera , Debussy ,S…

输入输出及子模块

输入输出及子模块 常用模块库 1 事先规划好功能子系统 2 建立好系统后对系统进行功能划分 在进行动态系统的建模过程中,可以根据需要将模型中比较复杂,或者共同完成某一功能的基本模块(低一层次的子系统)封装起来,并…

使用Hexo搭建博客步骤详解

简介hexo —— 简单、快速、强大的Node.js静态博客框架。Hexo 使用 Markdown(或其他渲染引擎)解析文章,在几秒内,即可利用靓丽的主题生成静态网页。 特性风一般的速度Hexo基于Node.js,支持多进程,几百篇文章…

32个最热CPLD-FPGA论坛

1. OPENCORES.ORG 这里提供非常多,非常好的PLD了内核,8051内核就可以在里面找到。进入后,选择project或者由http//www.opencores.org/browse.cgi/by_category进入。对于想了解这个行业动态人可以看看它的投票调查。http://www.opencores.org/…

师兄师姐就业分享会

华为算法工程师自我定位(找一个岗位,好好准备); 来自当年带我走上这条路的学长 。算法工程师对学术要求比较高,发过高水平论文优势很大 通常是月薪14k以上,年薪20万以上,只是一个概数,具体薪资详…

简单模块说明

接地模块(Ground)和终端模块(Terminator) 进入接地模块的帮助系统 右击选择帮助 接地模块表示:输入模块中没有值的部分 Ground 模块连接到其输入端口不连接到其他模块的模块。如果您使用具有未连接的输入端口的模块运…

毫米波雷达和车联网在未来无人驾驶中的应用和比较

来源:来自新加坡南阳理工大学电气与电子信息工程学院的陆亿泷教授,研究领域包括雷达、天线、微波工程、阵列信号处理、电磁计算、复杂问题的遗传算法优化等。会议时间:2017年8月9日 恩智浦恩智浦 半导体(NASDAQ:NXPI)致力于通过安全连接及基础…

机器学习总结

转摘的,忘记连接了朴素贝叶斯 P(A∩B)P(A)*P(B|A)P(B)*P(A|B) 所以有:P(A|B)P(B|A)*P(A)/P(B) 对于给出的待分类项,求解在此项出现的条件下各个目标类别出现的概率,哪个最大,就认为此待分类项属于哪个类别 工作原理 假…

贷款时,如何评估借款人的还款意愿

贷款有一个公式:正常还款还款能力还款意愿。也就是说借款人能不能正常还款,除了借款人的还款能力之外,借款人的还款意愿也有着至关重要的作用。因此贷款审核过程中,对借款人还款意愿的审核是很重要的一个环节,那信贷员…

FPGA时序分析和约束实例

FPGA时序分析和约束实例

数据库设计笔记——概述(一)

数据库数据库(DataBase,DB)是长期存储在计算机内,有组织的,可共享的数据集合。是存放数据的仓库,并且有组织,有管理。数据库管理系统数据库管理系统(Database Management System&…

你应该知道的浮点数基础知识

本文从一个有趣而又令人意外的实验展开,介绍一些关于浮点数你应该知道的基础知识 文章欢迎转载,但转载时请保留本段文字,并置于文章的顶部 作者:卢钧轶(cenalulu) 本文原文地址:http://cenalulu.github.io/linux/about…

简单模块说明(二)

简单模块说明(二) 利用linmod函数提取状态矩阵 输入输出必须以 in模块和out模块代替 状态空间法的状态向量和状态变量不唯一的。 传递函数模块 得出其是个低通滤波器 零极点增益模块 使用零极点增益来表示传递函数 PID及二阶积分模块 几…

数据库设计笔记——有效设计数据库的目标(二)

参考《数据库设计解决方案》 数据设计关系到整个系统/软件的质量。数据库是一种存储数据的工具,允许以某种方式创建、阅读、更新和删除数据 理想的数据库特性CRUD创建、阅读、更新、删除(必备的四个操作)检索能快速、可靠地查找到数据库中的所…

GNU编译优化级别-O -O1 -O2 -O3

最近做一个算法的GPU加速,发现实际上使用gcc的-O3(最高级编译优化)选项,可以获得很高的加速比,我的程序里达到了3倍的样子,有时效果甚至比GPU加速好。因此小小学习了下GNU的编译优化。 附言一句,在进行调试的时候&…

数据库设计笔记——关系型数据库基础知识(三)

表的行称为元组,列称为属性,行列相交的部分称为单元;关系必须规范化,属性不可再分。(每个属性必须是不可分割的最小数据单元,即表中不能再包含表);主键(Primary Key&…

模块说明(三)

模块说明(三) 惯性环节、超前滞后环节 一般先使用连续列出传递函数,然后通过极性法或者双线线性不变法将连续转换为离散。 实例讲解 通常是通过电子电路对其进行补偿的。 记忆模块、零阶保持器、一阶保持器 离散PID 可参考连续PID…

数据库设计笔记——MySQL基础知识(四)

概述关系型数据库——由表来存储相关的数据,MySQL,SQL Server,Oracle等都是关系型数据库;元数据:用于集成并管理数据。MySQL数据库 用户数据库:用户根据需求创建数据库系统数据库information_schema&#x…