内容安全复习 2 - 网络信息内容的获取与表示

文章目录

  • 信息内容的获取
    • 网络信息内容的类型
    • 网络媒体信息获取方法
  • 信息内容的表示
    • 视觉信息
    • 视觉特征表达
    • 文本特征表达
    • 音频特征表达

信息内容的获取

网络信息内容的类型

  • 网络媒体信息
    传统意义上的互联网网站公开发布信息,网络用户通常可以基于网络浏览器获得。网络媒体、网页信息
  • 网络通讯信息
    互联网用户使用除网络浏览器以外的专用客户端软件,实现与特定点通信或进行点对点通信时所交互的信息。电子邮件、网上聊天

网络媒体信息获取方法

  • 静态媒体发布信息获取
    按信息发布方式,网络媒体信息可以分为直接匿名浏览信息和需身份认证网络信息;
    按网页具体形态可分为静态网页动态网页两种。
  • 基于自然人网络浏览行为模拟的信息获取
    自然人网络浏览行为模拟技术在网络媒体信息获取环节得到广泛应用。
  • 大模型信息获取重点,好好看看
    步骤如下:
    (1)用户提问:可以通过提出问题开始。
    (2)模型评估:基于问题,模型评估能否根据已有知识库回答,否则需要使用浏览器工具。
    (3)使用浏览器工具:如需最新消息,会使用内置的浏览器工具。
    (4)回答用户:将整理好的信息以回答的形式提供给用户。
    (5)反馈和调整:用户可以进行反馈,模型调整搜索策略或解释信息。

信息内容的表示

视觉信息

  • 处理过程
    获取、压缩、传输、重建、处理。
  • 视觉感知器
    柱状细胞、锥状细胞。
    其中锥状细胞对亮度不敏感,在高亮工作;刺激响应快。柱状细胞反之。
  • 三原色
    红、绿、蓝。
  • 计算机视觉信息
    一幅图像可以用矩阵表示,一个像素点对应矩阵中的一个元素。
    在这里插入图片描述
    彩色图像转化成灰度图像: Y = ( R + G + B ) / 3 Y = (R+G+B) / 3 Y=(R+G+B)/3
    对于视频,视频实际是其内容随时间变化的一组动态图像,又叫运动图像或活动图像。

视觉特征表达

图像特征表达是理解图像内容的基础,把图像从非结构化数据变成结构化数据,使得其相关性可以被有效度量。

应用:图像相似度计算(图像检索、匹配)。

  • 颜色特征
    在这里插入图片描述
    首先选择颜色空间,并将颜色空间划分成若干个小的区域,即颜色量化。
    统计其颜色落入每个小区间的像素数目可以得到颜色直方图。
    优点: 计算简单,一定场景下能反映图片内容;缺点:丢失空间信息。如下图示例。
    在这里插入图片描述
  • 纹理特征
    纹理是一种普遍存在的视觉现象,尚无广泛接受的定义。纹理是图像灰度或色彩在空间上的变化或重复。
    (1)局部二值模式(LBP)。
    (2)梯度直方图特征(HOG)。
    (3)尺度不变特征变换(SIFT)。
    (4)后SIFT时代的其他局部特征。

文本特征表达

重点

  • 将词语表达成向量
    首先,我们用 1-of-N Encoding 方法,如下所示。
    在这里插入图片描述
    只有这个方法是不够的。肉眼可见的维数爆炸,词语越多维数越多。因此在这一步后加入了 Word Class 和 Word Embedding 两个步骤,如下。
    在这里插入图片描述
    在 Word Class 中,我们对具有相同特征的词做聚类,将他们分为同一个类(Class),用所属类来表达该词。
    在 Word Embedding 中,我们把每一个词都投影到高维空间上,当然,这个空间的维度远小于第一步 1-of-N Encoding 的维度。因此这实际上是一个降维的过程。
  • 将文本表达成向量
    (1)词频(TF):词频指一个词在文本中出现的次数。通过词频进行特征选择实际上是将某一频率区间外的值去掉从而降维。
    (2)文档频数(DF):指数据集中有多少文本包含某个单词。
    (3)TF-IDF:
    TF = 某个词在文章中的出现次数 / 文章的总词数;
    IDF(逆文档频率)= log(语料库的文档总数 / (包含该词的文档数+1))。
    TF-IDF = TF * IDF。

音频特征表达

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/856977.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

API低代码平台介绍5-数据库记录修改功能

数据库记录修改功能 在上篇文章中我们介绍了如何插入数据库记录,本篇文章会沿用上篇文章的测试数据,介绍如何使用ADI平台定义一个修改目标数据库记录的接口,包括 单主键单表修改、复合主键单表修改、多表修改(整合前两者&#xff…

每日练题(py,c,cpp).6_19,6_20

检验素数 from math import sqrt a int(input("请输入一个数:")) for i in range(2,int(sqrt(a))):if a%i 0:print("该数不是素数")breakelse: print("该数是素数")# # 1既不是素数也不是合数 # #可以用flag做标志位 # b int(…

VUE element-ui之table表格横向展示(表尾汇总)_elementui横向表格

</el-table><section><el-table:show-header“false” :data“tableDataBll” border style“width: 100%;” <el-table-column prop"total" align"center" /><el-table-column prop"totalOrder" /><el-table-col…

视频智能分析平台智能边缘分析一体机安防监控平台打手机检测算法工作原理介绍

智能边缘分析一体机的打手机检测算法是一种集成了计算机视觉和人工智能技术的先进算法&#xff0c;专门用于实时监测和识别监控画面中的打手机行为。以下是关于该算法的详细介绍&#xff1a; 工作原理 1、视频流获取&#xff1a; 智能边缘分析一体机首先通过连接的视频监控设…

国内composer镜像有哪些

阿里云 Composer 全量镜像 镜像地址: https://mirrors.aliyun.com/composer/官方地址: https://mirrors.aliyun.com/composer/index.html镜像类型: 全量镜像更新时间: 1分钟备注: 阿里云CDN加速&#xff0c;更新速度快&#xff0c;推荐使用。腾讯云 Composer 全量镜像 镜像地址…

【UIDynamic-动力学-附着行为-刚性附着 Objective-C语言】

一、接下来,我们来说这个附着行为啊, 1.我们之前举过例子,一个车坏了,另外一个车,拉着这个车,就是附着行为啊, 这个里边呢,我们新建一个项目, Name:09-附着行为-刚性附着, 附着行为呢,分为两个大类: 1)刚性附着 2)弹性附着 刚性附着,指的就是,两个物体之间…

lftp工具速成

登录 lftp user:passwd192.168.0.123:21显示 ls设置本地目录 lcd /home/xxx/ftp下载 // 下载文件 get 1.log// 下载多个文件 mget *.log// 下载目录 mirror dir_name上传 // 下载文件 put 1.log// 下载多个文件 mput *.log// 下载目录 mirror -R dir_name退出 exit

三人同行免单模式:社交电商的新趋势

在当今社交电商日益繁荣的背景下&#xff0c;三人同行免单模式作为一种创新的购物激励机制&#xff0c;正逐渐受到消费者和品牌的青睐。该模式通过消费者之间的互动和分享&#xff0c;促进产品销售和品牌推广&#xff0c;实现消费者与品牌的双赢。 模式概述 三人同行免单模式的…

企业级WordPress开发 – 创建企业级网站的优秀技巧

目录 1 “企业级”一词是什么意思&#xff1f; 2 使用 WordPress 进行企业级 Web 开发有哪些好处&#xff1f; 3 使用 WordPress 进行企业级开发的主要好处 3.1 WordPress 可扩展、灵活且价格实惠 3.2 WordPress 提供响应式 Web 开发 3.3 WordPress 提供巨大的可扩展…

vue2 使用 tailwind css vscode 100%成功

环境 vue -V ---- vue/cli 5.0.8 node -v ----- v16.15.0 npm -v ----- 6.14.18 环境不一样可能不会100%成功哦 创建项目 vue create tailwind 选择vue2 修改package.json "dependencies": {"babel/eslint-parser": "^7.24.7"…

关于时代变迁的小讨论

大家好&#xff0c;我是阿赵。   今天接到一个电话&#xff0c;是中国移动打过来的。这个电话的目的很简单&#xff0c;说免费送给我每个月100g流量和1000分钟通话时长&#xff0c;总共12个月。这个优惠也没什么苛刻的条件&#xff0c;只需要在这12个月内不要转运营商或者注销…

网络流量 数据包length计算

MTUMSSIP header(20 bytes)tcp header(20 bytes) lengthMTUEthernet header(14bytes) 其中MSS为Maximum Segment Size&#xff0c;即最大报文段长度&#xff0c;其受MTU大小影响&#xff0c;这里的MTU指的是三层的&#xff0c;二层的MTU固定为1500&#xff0c;不能修改。 MT…

编译报错:No rule to make target xx/libcam.halmemory_intermediates/export_includes

问题现象&#xff1a; make: *** No rule to make target ‘out/target/product/testdd6737m_35g_m0/obj/STATIC_LIBRARIES/libcam.halmemory_intermediates/export_includes’, needed by ‘out/target/product/testdd6737m_35g_m0/obj/SHARED_LIBRARIES/libcam_platform_inte…

PowerShell 是什么?它的作用都有哪些?

什么是 PowerShell PowerShell 是什么&#xff1f;PowerShell 是一种跨平台的任务自动化和配置管理框架&#xff0c;最初由微软开发并主要用于 Windows 环境。它结合了命令行界面和脚本语言功能&#xff0c;可以帮助用户执行系统管理任务和自动化流程。 PowerShell 的强大之处…

MySQL—索引—基础语法

目录 一、创建、查看以及删除索引的语法 &#xff08;1&#xff09;创建索引 1、会用到一个关键字&#xff1a;CREATE。 2、解释。 &#xff08;2&#xff09;查看索引 1、查看索引需要用到一个关键字&#xff1a;SHOW。 2、作用是去查看指定表中的所有索引。 &#xff…

樱花飘落

文章目录 樱花飘落导入模块和设置屏幕定义树枝绘制函数计算树枝参数绘制左右分支绘制树叶和飘落效果定义樱花绘制函数绘制樱花并定时重复设置屏幕和绘制树开始樱花动画启动事件循环 屏幕录制 2024-06-21 155836 樱花飘落 导入模块和设置屏幕 通过递归函数tree绘制了一棵分形的…

Ollama部署大模型并安装WebUi

Ollama用于在本地运行和部署大型语言模型&#xff08;LLMs&#xff09;的工具&#xff0c;可以非常方便的部署本地大模型 安装 Linux curl -fsSL https://ollama.com/install.sh | sh 我是ubuntu系统安装&#xff0c;其他系统可以看项目的开源地址有写 GitHub - ollama/oll…

Autosar规范的ARM内核平台/PowerPC内核平台的微控制器的开发解决方案

Autosar规范的ARM内核平台/PowerPC内核平台的微控制器的开发解决方案 Autosar规范的ARM内核平台/PowerPC内核平台的微控制器的开发解决方案 目录 引言Autosar简介ARM内核平台的开发解决方案 3.1 ARM架构概述3.2 Autosar在ARM平台的实现3.3 典型的ARM微控制器3.4 开发工具和环…

html渲染的文字样式大小不统一解决方案

React Hooks 封装可粘贴图片的输入框组件&#xff08;wangeditor&#xff09;_react 支持图片拖拽的输入框-CSDN博客 这篇文章中的wangediter可粘贴图片的输入框&#xff0c;输入的文字和粘贴的文字在dangerouslySetInnerHTML渲染后出现了字体不统一的情况 在html中右键检查可…

zerotier-one自建根服务器方法二

一、简介 zerotier-one免费账户有25设备的限制&#xff0c;如果自己的设备多了就需要付费。不过zerotier-one是开源软件&#xff0c;我们可以自己建立根服务器&#xff0c;不用付费速度还很快。 由于时间关系上一篇文章没有写完&#xff0c;今天继续。 二、准备工作 准备一…