由Fraunhofer FIRST、智能数据分析小组(Klaus-Robert Müller、Benjamin Blankertz)以及Charité - 柏林大学医学部本杰明·富兰克林校区神经学系神经物理学小组(Gabriel Curio)提供的数据集。
致Benjamin Blankertz ⟨benjamin.blankertz@tu-berlin.de⟩ 1
目录
- Data set IVa
- The Thrill
- Experimental Setup
- Format of the Data
- References
Data set IVa
The Thrill
当采用机器学习方法进行脑机接口时,必须具备标记的训练数据来教授分类器。为此,用户通常在开始使用BCI反馈应用程序之前执行无聊的校准测量。BCI研究的一个重要目标是减少初始测量所需的时间。这个数据集的挑战在于只使用少量的训练数据来完成任务。解决问题的一种方法是利用其他受试者的测量信息来减少新受试者所需的训练数据量。当然,竞争对手也可能尝试使用算法来处理小训练集,而不使用其他受试者的信息。
Experimental Setup
这个数据集是从五位健康受试者那里记录下来的。受试者坐在一把舒适的椅子上,手臂放在扶手上。这个数据集只包含了前四个没有反馈的会话的数据。视觉提示指示了3.5秒钟,受试者应该执行以下三个运动想象之一:(L)左手,(R) 右手,(F)右脚。目标提示的呈现被随机长度的间隔打断,1.75到2.25秒,此时受试者可以放松。
有两种类型的视觉刺激:(1)目标由出现在固定十字架后面的字母指示(可能会引起一些与目标相关的眼动),以及(2)随机移动的物体指示目标(引起与目标无关的眼动)。从受试者al
和aw
那里记录了两个类型的会话,而从其他受试者那里记录了三个类型(2)的会话和一个类型(1)的会话。
Format of the Data
给出了118个脑电图通道的连续信号和标记,这些标记指示了每个5个受试者(aa,al,av,aw,ay
)的280个提示的时间点。由于竞赛目的,某些标记没有提供目标类信息(值NaN
)。竞赛只提供“right”和“foot”类的提示。以下表格显示了每个受试者的相应训练(标记)试验“#tr
”和测试(未标记)试验“#te
”的数量。
subjects | #tr | #te |
---|---|---|
aa | 168 | 112 |
al | 224 | 56 |
av | 84 | 196 |
aw | 56 | 224 |
ay | 28 | 252 |
数据以Matlab格式(*.mat
)提供,包含变量:
cnt
:连续的脑电图信号,大小为[时间 x 通道]。该数组以INT16
数据类型存储。要将其转换为微伏(uV)值,请在Matlab中使用cnt= 0.1*double(cnt)
。mrk
:目标提示信息的结构与字段pos
:EEG信号中提示的位置向量,以单位样本给出,长度为#cues
y
:目标类别的向量(1、2或NaN),长度为#cues
classname
:类名的单元数组
info
:结构提供具有字段的附加信息name
:数据集的名称fs
:采样率clab
:通道标签的单元数组xpos
:电极在二维投影中的横坐标ypos
:电极在二维投影中的纵位置
作为替代,数据也以压缩的ASCII
格式提供(每个受试者分为三个文件)。
*_cnt.txt
:连续的脑电信号,每行记录了特定时间点所有通道的值。*_mrk.txt
:目标提示信息,每行表示一个提示,其中第一个值定义了时间点(以单位样本给出),第二个值表示目标类别(1=右手,2=脚,或0表示测试试验)。*_nfo.txt
:包含其他信息,如Matlab格式中所述。
References
- Guido Dornhege, Benjamin Blankertz, Gabriel Curio, and Klaus-Robert Müller. Boosting bit rates in non-invasive EEG single-trial classifications by feature combination and multi-class paradigms. IEEE Trans. Biomed. Eng., 51(6):993-1002, June 2004.
https://bbci.de/competition/iii/desc_IVa.html ↩︎