转自:https://blog.csdn.net/zssureqh/article/details/8846337
背景介绍:
医学影像PACS工作站的服务端需要对大量的dcm文件进行归档,写入数据库处理。由于医学图像的特殊性,每一个患者(即所谓的Patient)每做一次检查(即Study)都至少会产生一组图像序列(即Series),而每一组图像序列下会包含大量的dcm文件(例如做一次心脏CTA的诊断,完整的一个心脏断层扫描序列大约有200幅图像)。DICOM3.0协议中对每一幅影像是按照特定的三个UID(唯一标示符)来进行标记的,分别是StudyInstanceUID、SeriesInstanceUID、SOPInstanceUID。其中StudyInstanceUID代表了唯一的一次检查(Study),SeriesInstanceUID代表了相应检查下的唯一序列(Series)、SOPInstanceUID代表了唯一检查下的唯一序列下的唯一图像。通常PACS工作站都是利用这三个UID来对dcm文件进行归档处理。
归档的设计:
1、基本的归档结构是:
第一级:StudyInstanceUID | 存储同一患者的影像数据 |
第二级:SeriesInstanceUID | 存储同一次检查下的影像数据 |
第三级:SOPInstanceUID | 存储同一个序列下的影像数据 |
了解了大致的归档结构后,现在应该考虑怎样将dcm记录写入到数据库中?最直观的想法就是将每一个dcm文件都记录在数据库中,这样当需要读取指定的dcm文件时通过给定的三个UID直接在数据库中查询就能够得到。但是如此一来,数据库的容量会急剧增加,同一患者在数据库中存在着大量的冗余记录。因为患者的影像数据是按照上述的三级目录来归档的,大量的相关的影像数据存储在服务器的同一个目录下,对于同一个序列的图像可以直接在第二级目录中利用SOPInstanceUID来进行检索,而不需要进行数据库的查询。但是当二级目录下的文件数量较大时,检索文件件中的文件同样需要耗费大量的时间,那么怎样可以提高检索效率呢?答案就是:配置文件。由于在归档的时候我们已经读取过每个dcm文件的三个UID,那么可以将归档时候读取的UID信息写入到相应的INI配置文件中,并存储到相应的图像序列目录下。那么在检索图像时,通过前两级UID可以快速在数据库中查询到影像数据的归档目录,当进入到指定的归档目录后,利用归档时生成的INI文件,可以快速的检索到指定的dcm文件,另外如果归档时将一些常用的dcm文件信息一同写入到INI配置文件中(如图像的宽度、高度、患者姓名、出生年月、窗宽/窗位等),在后续的一些图像处理中同样能够节约时间,提高效率。
2、INI配置文件的生成
INI配置文件的格式就不细讲了,CSDN中已有很多详细讲解的博文,请大家自行参阅。这次详细讲解一下利用dcmtk开源库来提取相应的dcm文件信息并写入到ini配置文件中的方法。
DCMTK开源库是一个很好的医学影像开发基础库,其很好的实现了DICOM3.0标准,且类的继承体系简单明了,与DICOM3.0标准一一对应(参考博文:“dcmtk开源库的继承体系与DICOM3.0标准的对应关系”)。这里我们只用到了dcmtk中的DcmItem类,该类派生自DcmObject基础类,其含有ElementList成员变量,存储了DICOM3.0标准中规定的一系列的数据元(Data Element)基本结构如下图所示:
注:DcmItem类就是Dataset(数据集)的子类。其内部包含了数据元序列(即ElementList数据成员)。
通过阅读关于DcmItem类的源码,总结归纳了以下几种dcmtk开源库给出的操作dcm文件相应数据元的函数:findAndGet 函数、findOrCreate函数、findAndXXX函数、putAndInsert函数,以及insertXXX函数,如下图:
至此我们可以利用findAndGet函数类来提取dcm文件中的相关信息,结合WindowsAPI函数来进行INI配置文件的归档。由于INI配置文件就是文本文件,因此我们选用了DcmItem中的findAndGetString函数来提取dcm文件中的数据元,利用findAndGetString函数能够直接得到字符串格式(const char*)的数据元,另外,结合WritePrivateProfileString函数来生成INI配置文件。(注:此处findAndGetString函数正好与WritePrivateProfileString函数的格式匹配,如果采用findAndGet的其他函数,如findAndGetSin32,就需要利用itoa等函数将整型转换成const char*类型,增加了编程的复杂性)
下面给出部分代码:
DcmTagKey THU_DCM_ELEMENTS[]={DCM_InstanceNubmber, DCM_Rows,DCM_Columns,DCM_PatientName};//定义需要写入到ini文件中的dcm数据元标签数组int num=sizeof(THU_DCM_ELEMNTS)/sizeof(DcmTagKey);OFString mImageValue;OFString mGap("|");//INI配置文件中各个数据元之间的间隔符OFString mImageModule("ImageModule\\");//配置文件的节名称OFString mSOPInstanceUID;OFString mSeriesInstanceUID;DcmDataset *pDataset=mDcmFile->getDataset();DcmMetaInfo *pMetaInfo=mDcmFile->getMetaInfo();pDataset->findAndGetOFString(DCM_SeriesInstanceUID,mSeriesInstanceUID);pDataset->findAndGetOFString(DCM_SOPInstanceUID,mSOPInstanceUID);mImageModule+=mSeriesInstanceUID;for(int i=0;i<num;++i){OFString mValueRecord;DcmElement *element;if(THU_DCM_ELEMNTS[i].getGroup()>0x0002)// to determine if the THU_DCM_ELEMENTS[i] is MetaInfo{//the element belongs to DatasetpDataset->findAndGetOFStringArray(THU_DCM_ELEMNTS[i],mValueRecord);mValueRecord+=mGap;}else{//the element belongs to MetaInfoif(THU_DCM_ELEMNTS[i].getGroup()==0x0000 && THU_DCM_ELEMNTS[i].getElement()==0x0000){mValueRecord=mGap;}else{pMetaInfo->findAndGetOFStringArray(THU_DCM_ELEMNTS[i],mValueRecord);mValueRecord+=mGap;}}mImageValue+=mValueRecord;}::WritePrivateProfileString(mImageModule.c_str(),mSOPInstanceUID.c_str(),mImageValue.c_str(),iniFileName);
3、数据库的写入:
数据库写入的方式与INI配置文件生成基本相似,只要稍微了解C++数据库编程的人员,就很容易仿照上述INI配置文件的生成过程来完成数据库写入的部分,此处就不细讲了,只给出简单的部分代码:
DcmFileFormat fileformat;TCHAR FilePath[MAX_PATH];OFCondition oc = fileformat.loadFile(FilePath);DcmDataset *pDataset=fileformat.getDataset();char query[1000];memset(query,0,sizeof(char)*1000);lstrcat(query,_T("insert into patient values ("));const char *tString;pDataset->findAndGetString(DCM_InstanceNumber,tString);lstrcat(query,tString);lstrcat(query,_T(","));pDataset->findAndGetString(DCM_PatientName,tString);lstrcat(query,_T("\""));lstrcat(query,tString);lstrcat(query,_T("\""));lstrcat(query,_T(","));pDataset->findAndGetString(DCM_PatientID,tString);lstrcat(query,tString);lstrcat(query,_T(","));pDataset->findAndGetString(DCM_PatientBirthDate,tString);lstrcat(query,tString);lstrcat(query,_T(","));pDataset->findAndGetString(DCM_PatientSex,tString);lstrcat(query,"\"");lstrcat(query,tString);lstrcat(query,"\"");lstrcat(query,",");pDataset->findAndGetString(DCM_PatientAge,tString);char temp[100];memcpy(temp,tString,lstrlen(tString));temp[lstrlen(tString)]=_T('\0');for(int i=0;i<strlen(temp);++i)if(temp[i]==_T('Y'))temp[i]=_T('\0');lstrcat(query,temp);lstrcat(query,",");lstrcat(query,_T("2013)")); //mysql数据库的写入MYSQL* con;con=mysql_init((MYSQL*)0);if(con!=NULL && mysql_real_connect(con,host,user,passwd,db,port,unix_socket,client_flag)){if(!mysql_select_db(con,db)){::printf("Selcet successfully the database!\n");con->reconnect=1;int rt=mysql_real_query(mysql,query,strlen(query));if(rt){::printf("Error making insert!!!\n");}}}
对于MYSQL的C++操作,可以参见博文: http://www.cnblogs.com/justinzhang/archive/2011/09/23/2185963.html