眼动追踪技术 | 眼动的分类和模型

摘要

灵长类动物用于调整中央凹位置的正常眼动,几乎都可以归结为五种基本类型的组合:扫视、平稳追踪、聚散、前庭眼震和生理性眼震(与注视相关的微小运动)。聚散运动用于将双眼聚焦于远处的目标(深度知觉)。其他运动(如适应和聚焦)指的是眼动的非位置变化方面(如瞳孔扩张、晶状体聚焦)。

眼外肌和动眼神经

一般来说,眼睛在六个自由度内运动:眼眶内的三个平移和三个旋转。负责眼球运动的眼外肌有六条,分别是内外直肌(侧向运动)、上下直肌(上下运动)以及上下斜肌(扭转),如图1所示。参与眼球运动的神经系统被统称为动眼神经。动眼神经的一般结构和连接如图2所示。眼动控制信号来自几个功能不同的区域。17-19区和22区是被认为负责高级视觉功能(如识别)的枕叶皮层区域。上丘直接接收来自视网膜的传入信号,特别是来自通过大细胞通路传递的周边区域。半规管对三维空间的头部运动做出反应。这三个区域(即枕叶皮层、上丘和半规管)均通过中脑和脑桥网状结构向眼肌传递输出神经元。对观察到的眼动信号进行分类在一定程度上依赖于这些皮层区域已知的功能特性。

图1.眼外肌示意图。

图2.动眼神经系统示意图。

从动眼神经的组织结构中可以得出两个关于眼球运动的观察结果:

1.眼动系统在很大程度上是一个反馈回路。

2.控制眼球运动的信号来自皮层区域,这些区域在功能上可分为随意(枕叶皮层)、不随意(上丘)和反射(半规管)。

眼动反馈回路主要用于需要眼球稳定的眼动类型。眼窝平衡对于物体的稳定视网膜投影是必要的,并伴随着物体的运动和头部的运动。这种稳定性由神经元控制系统维持。

扫视

扫视(或称眼跳)是一种快速的眼球运动,用于将中央窝重新定位到视觉环境中的一个新的位置。扫视动作既可以是自发的也可以是反射性的。这些动作可以是主动执行的,也可以作为一种矫正性的视觉运动或前庭测量的手段。扫视的持续时间约为10-100ms,在此期间执行者在移动过程中基本上是盲目的。关于驱动扫视的潜在神经系统存在一些争论。扫视被认为是一种固定的、重复出现的运动模式。也就是说,一旦计算出到下一个期望注视点的扫视运动(大约200ms的潜伏期),扫视路径就无法改变了。这是因为在扫视执行过程中,没有足够的时间进行视觉反馈来引导眼球到达最终位置。然而,如果假设在扫视过程中使用了头部、眼睛和目标位置的内部复制来引导眼球,那么就可以考虑是否存在一种扫视反馈系统。由于它们的速度很快,扫视可能看起来像是预先编程的。

人们提出了各种关于扫视编程的模型。除了包括“重心”编码的模型外,这些模型可能无法充分预测不可改变的扫视路径。相反,基于目标位置内部表征的扫视反馈系统可能更为合理,因为它们倾向于正确预测所谓的双步实验范式。双步范式(图3)是眼球进行扫视时改变目标位置的实验。Fuchs等人(1985)提出了对Robinson反馈模型的改进,该模型基于上丘(SC)提供的信号和局部反馈回路。局部回路通过从心理目标空间位置减去眼睛位置而产生运动误差的形式来生成反馈。Sparks和Mays(1990)以中间和深层SC中包含的神经元为例,这些神经元是启动和控制扫视运动的神经回路的关键组成部分。SC的这些层接收来自皮层区域的输入,这些区域参与用于引导扫视的感觉(视觉、听觉和躯体感觉)信号的分析。作者还基于Listing和Donders法则进行了说明,这些法则规定了眼动中基本的零扭转分量,扫视运动实际上只需要两个自由度。根据这些法则,运动可以分解成围绕水平x轴和垂直y轴的旋转。

图3.双步范式。

扫视生成模型试图解释负责发送到运动神经元信号的潜在机制。尽管对于扫视程序的来源存在一些争论,但观察到的信号类似于脉冲/阶跃函数。脉冲/阶跃函数指的是对眼外肌的速度和位置的双重指令。扫视阶跃信号的一种简单表征是微分滤波器。Carpenter(1977)提出了一种可能与积分器耦合产生扫视的滤波器。积分滤波器用于模拟将速度编码信息转换为位置编码信号所必需的转换。一个完美的神经积分器将脉冲信号转换为阶跃函数。一个不完美积分器(称为漏积分器)将产生一个类似于衰减指数函数的信号。这种类型的神经整合原理适用于所有类型的共轭眼球运动。连接脑干和小脑结构的神经回路是为了执行包括扫视、平稳追踪、前庭眼震和视动性眼震等共轭眼动的整合。

微分滤波器可以通过线性滤波器进行建模,如图4所示。在时域中,线性滤波器由以下公式建模:

其中st为输入(脉冲),xt为输出(阶跃),gk为滤波器系数。为了确保可微分,滤波器系数通常必须满足近似数学微分的性质。这种滤波器的一个例子是系数为{1,-1}的Haar滤波器。在z变换下,该线性滤波器的传递函数X(z)/S(z)为:

Haar滤波器是一个长度为2的滤波器,它近似于连续输入对之间的一阶导数。

图4.简单线性滤波器模拟扫视运动生成的示意图。

平稳追踪

当视觉追踪运动目标时会涉及到跟随运动。根据目标运动的范围,眼睛能够匹配运动目标的速度。追踪运动提供了一个内置负反馈控制系统的例子。图5展示了一个用于建模追踪运动的简单闭环反馈回路,其中st是目标位置,xt是(期望的)眼睛位置,h是(线性,时不变)滤波器或系统增益。从反馈起始点跟踪环路,在时域中得到以下方程:

图5.平稳追踪运动的简单线性反馈模型图。

在z变换下,该线性系统的传递函数X(z)/S(z)为:

在闭环反馈模型中,来自视觉感受器的信号构成误差信号,指示需要进行补偿以匹配目标的视网膜图像运动。

注视(微扫视、漂移和震颤)

注视是一种使视网膜在感兴趣的静止物体上保持稳定的眼动类型。从直觉上来看,注视应该由控制平稳追踪的相同神经回路产生,其中注视是目标以零速度移动的特殊情况。这可能是不正确的。相反,注视的特征是微小的眼球运动:震颤、漂移和微扫视。微扫视是由于视觉系统单细胞生理学的运动敏感性而产生的眼动信号。微扫视是在空间上呈现出一定程度的随机性,并且其振幅大约在1-2分钟弧度之间变化。关于注视的一个反直觉事实是,如果一个图像被人为地稳定在视网膜上,那么视觉会在大约一秒钟内消失,场景变成空白。这意味着,当视觉系统不再接收到运动信号时,即使静止的图像也会在一定时间内失去视觉感知,这对于人们来说可能是一个反直觉的现象。

微小眼动在注视中起着重要作用,但在控制系统中可能被视为是噪声(可能与平稳追踪回路不同)。这种噪声表现为注视区域周围的随机波动,通常不超过5°的视角范围。虽然将微小运动分类为噪声可能过度简化了自然过程,但它允许通过类似于图5所示的反馈系统对信号进行建模。图5中的加性噪声用et=st-xt表示,其中(期望的)眼睛位置xt从稳定的注视位置st中减去,然后得到et。在该模型中,误差信号以类似于平稳追踪系统的方式刺激注视系统,不同之处在于这里的et是一个误差位置信号,而不是误差速度信号。使用噪声“数据缩减”方法对注视进行建模的反馈系统实际上比追踪模型更简单,因为它隐含地假设了一个平稳的随机过程。统计学意义上的平稳性是指均值恒定的过程。其他与注视相关的统计指标包括注视持续时间范围150-600ms,以及90%的观察时间都用于注视。

眼球震颤

眼球震颤是一种共轭眼球运动,其特征为锯齿状的时间过程(时间序列信号)模式。视动性眼球震颤是一种平稳的追踪运动,其间穿插着扫视以补偿目标视网膜运动。视动性眼球震颤的平稳追踪成分出现在信号的慢性期。前庭性眼球震颤是一种用于补偿头部运动的眼球运动类型。前庭性眼球震颤的时间进程与视动性眼球震颤的时间进程几乎无法区分。

眼动分析的意义

眼动追踪技术通过辅助设备采集人眼相关信息,将获得的数据构建相对应的计算模型,最终根据该模型确定人眼的注视方向或注视区域。由于人的眼动行为包含着当前的任务状况以及人自身状态等信息,因此了解人眼的行为,了解人眼如何获取外界信息是了解个体行为关键。通过测量眼动轨迹获得的信息,不仅在理论研究上有重要意义,在各种生产生活场景中也发挥着重要作用。我们从上述的讨论中可以得出两个与眼动分析相关的重要观察结果。首先,基于眼动的功能,只需对三种类型的眼动进行建模,就可以深入了解视觉注意力的显性定位。这些类型的眼动包括注视、平稳追踪和扫视。其次,基于信号特征和潜在的神经回路,所有三种类型的眼动均可近似为线性时不变(LTI)系统(即线性滤波器;例如适用于扫视检测的线性滤波器示例)。

在注视依赖系统设计背景下,眼动分析主要是确定注视、扫视和平稳追踪。假设这些动作提供了随意的、明显的视觉注意证据。这一假设并不排除这些眼动可能在某些情况下是无意识地发生的,反之亦然。当人们对某个对象感兴趣时,他们会自然地将目光集中在这个对象上,而这种行为就是注视。类似地,对于平稳运动的物体,也可以使用同样的方式进行追踪运动。扫视被认为是自愿改变注意焦点的表现。

总结

本文介绍了眼动的分类,并涵盖了适用于眼动分析的眼动信号线性模型。总的来说,眼动追踪是一种无创的检测技术,具有更高的时间分辨率,可进行实时记录和实时监控,因此获取的数据客观且较少受到主观偏见影响,能够提供个体认知加工过程的量化信息,以及便于与其他脑成像技术进行数据叠加融合等,从而有助于对认知相关任务进行评估。

参考文献:Duchowski, A.T., Taxonomy and Models of Eye Movements. In: Eye Tracking Methodology. Springer, Cham. https://doi.org/10.1007/978-3-319-57883-5_4

小伙伴们关注茗创科技,将第一时间收到精彩内容推送哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/866688.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux权限介绍

目录 1.用户切换 2.权限 (1)权限介绍 (2)文件类型 (3)权限组成 (4)权限修改 (5)重新认识 (6)底层操作 (一&#x…

事件分发机制:demo复现自定义ViewGroup点击事件不起作用

几年前遇到的一个bug,不弄清楚心里就是不舒服! 平时应用开发中,经常遇到的UI需求,例如抖音的设置界面,如下图所示: 很容易想到,自定义一个Layout,左边一个图标,中间文…

无痕消除笔怎么用?3款工具教你完美消除

无痕消除笔怎么用?无痕消除笔在图片编辑中扮演着至关重要的角色。它利用先进的图像处理技术,让用户只需简单几步操作,就能轻松抹除图片上任何不想要的细节,无论是明显的瑕疵、多余的文字还是恼人的水印。这一功能不仅提高了编辑效…

华为大咖说 企业应用AI大模型的“道、法、术” -- 法:落地篇 (上)

本文作者:郑岩(华为云AI变革首席专家)全文约2865字,阅读约需7分钟 在探讨企业如何应用AI大模型的“道、法、术”系列文章的前两篇文章中,我们已经深化了对“AI大模型”的理解,并通过“AI场景12问”洞察了潜…

鸿蒙 HarmonyOS Next 路由 不废话 全干货

一、页面的创建 (1)直接通过创建一个新的Page的方式创建 (2)先创建一个 ArkTs File文件,然后在resources/base/profile/main_pages.json中加上页面对应的src路径,下面的Index_3.ets文件是通过创建ArkTs Fi…

Linux安装达梦

文章目录 前言一、docker安装1.下载镜像2.导入镜像3.生成容器 二、ios安装1.环境准备2.iso安装3.配置实例4.注册服务5.启停服务 总结 前言 公司要求我将数据从oracle迁移到达梦数据库,这个国产数据库以前没用过,所以记录一下这次的安装过程。 一、docke…

后端部署Jar包 | 启动失败系列问题(图解-BuiId,Maven)

目录 项目的构建 打包前的准备 合理配置pox.xml文件 Build 打包方式 Maven打包方式 Jar包部署 测试后端接口 项目的构建 我的项目是SpringBoot2脚手架 先准备一个相对于的数据库依赖 数据库的任意库 Yaml配置后 才能正常在IDEA中跑起来 打包前的准备 合理配置pox.xm…

rs轨迹校验

最近发现有些网站的rs似乎上了轨迹校验,附图: 写了个解rscookie的插件,可以精准看到rs更改了那些校验点,需要做什么处理,就很舒服 有需要轨迹代码或者瑞数相关的可以联系 let v huaqu0727

Feign远程调用,请求头丢失情况

现象 解决方案 import feign.RequestInterceptor; import feign.RequestTemplate; import org.springframework.context.annotation.Bean; import org.springframework.context.annotation.Configuration; import org.springframework.web.context.request.RequestContextHolde…

编译开源车载Linux操作系统AGL

随着汽车行业的智能化和互联化趋势日益明显,车载系统作为汽车的重要组成部分,其性能和功能也受到了越来越多的关注。Linux作为一款开源的操作系统,具有稳定性高、安全性强、可定制性好等优点,因此成为了车载系统领域的热门选择。 …

我应该怎么办?(关于专升本篇!)

kimi,我需要你的帮助,我现在在湖北工业职业技术学院,我2025年将要开始进行专升本,预计在明年4月26日进行专升本,但是我现在很迷茫,自己感觉自己很懒惰,自己每天都过得很迷糊! 面对专…

SSM+汽车停车位共享APP-计算机毕业设计源码041534

摘 要 随着社会经济的快速发展,我国机动车保有量大幅增加,城市交通问题日益严重。为缓解用户停车难问题,本文设计并实现了APP停车位共享系统.该系统通过错峰停车达到车位利用率最大化.基于现状分析,本文结合实际停车问题,从系统应用流程,系统软硬件设计和系统实现三方面进行详细…

MUNIK解读ISO26262--什么是系统安全分析

功能安全之系统阶段-系统安全分析 安全分析在ISO26262标准中横跨了多个阶段例如:概念阶段、系统架构阶段、硬件详设阶段和软件详设阶段,其中part5中的安全分析工具FMEDA是标准中唯一一个和ASIL等级挂钩的,在Part5中也用了很大篇幅在介绍该安…

为什么英智智能宝能让律师工作事半功倍

大语言模型能够极大提高人们的知识理解能力和知识服务能力,法律服务是典型的知识服务领域,据悉律师有38%的任务都是重复性工作,这些任务有潜力被大模型替代。 但在法律行业中的高度专业且复杂的问题时,通用型大模型的回答虽能提供…

CentOS 离线安装部署 MySQL 8详细教程

1、简介 MySQL是一个流行的开源关系型数据库管理系统(RDBMS),它基于SQL(Structured Query Language,结构化查询语言)进行操作。MySQL最初由瑞典的MySQL AB公司开发,后来被Sun Microsystems公司…

电子元器件基础知识总结

1.0 电阻 电阻的定义:导体对电流的阻碍作用称之为电阻【每一种导体都有内阻的存在】 闭合的电路中电子的移动输出有多快?电子在导体中的移动速度是很慢的 【铜线中电流的移动速度】 电子受到原子核的束缚,移动的速度很慢,在电压足…

4面体空间5点结构种类与占比

在30个点的4面体中取5个点,有30*29*28*27*26/(5*4*3*2)142506种取法, 这里要求5个点必须是直链或支链。共有496个组合符合要求,按平移对称性可分成181个不同的结构 结构 数量 结构 数量 结构 数量 结构 数量 结构 数量 结构 数量 …

Harbor:打造docker私有镜像库

part 1. Harbor概览 harbor:我们的使命是成为 Kubernetes 值得信赖的云原生存储库 为什么要使用Harbor? Harbor是VMware公司开源的企业级容器镜像仓库管理平台,它提供了比基本Docker Registry更丰富的功能,特别适合企业环境使用。提供了镜像存储、签名…

【TS】TypeScript 联合类型详解:解锁更灵活的类型系统

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 TypeScript 联合类型详解:解锁更灵活的类型系统一、联合类型的定义二…

【深海王国】小学生都能玩的语音模块?ASRPRO打造你的第一个智能语音助手(6)

Hi~ (o^^o)♪, 各位深海王国的同志们,早上下午晚上凌晨好呀~ 辛勤工作的你今天也辛苦啦(/≧ω) 今天大都督继续为大家带来系列——小学生都能玩的语音模块,帮你一周内快速学会语音模块的使用方式,打造一个可用于智能家居、物联网领域的语音助…