C语言中文本文件与二进制文件的区别 一、文本文件与二进制文件的定义 大家都知道计算机的存储在物理上是二进制的,所以文本文件与二进制文件的区别并不是物理上的,而是逻辑上的。这两者只是在编码层次上有差异。 简单来说,文本文件是基于字符编码的文件,常
概述: 今天尝试使用c++中的ifstream来读取一个zip文件,结果发现每次都是读取了451个字节就结束了(测试用的zip文件4M多)。
--------------------------------------------------
author: cs_cjl
website:
http://blog.csdn.net/cs_cjl
--------------------------------------------------
测试代码: #include
#include
using namespace std;
int main (int argc, char *argv[])
{
ifstream fs(L"d:/tic.zip", std::ios::binary);
if (fs.is_open ()) {
cout << "file is open" << endl;
}
if (fs.good ()) {
cout << "filestream is good" << endl;
}
char buf[200];
size_t total_size(0);
while (true) {
fs.read(buf, 200);
total_size += fs.gcount ();
if (!fs) {
cout << "read " << fs.gcount () << endl;
cout << "fs.good () : " << fs.good () << endl;
cout << "fs.eof () : " << fs.eof () <
cout << "fs.fail () : " << fs.fail () << endl;
break;
}
}
cout << "read total size: " << total_size << endl;
return 0;
}
通过16进制编辑器查看zip文件,发现第252个字节为0x1a,通过查看 ascii表:
http://en.wikipedia.org/wiki/Ascii 发现它对应Ctrl+Z,由于历史原因,在字符模式下 当遇到这个字符时,读取会结束
结论: 一直以为 二进制模式 和 字符模式 的区别只是对换行符\r \n的处理的不同 通过这次测试发现除了对换行符的处理不同外,字符模式还会对一些控制字符进行处理
参考: wikipedia ASCII:
http://en.wikipedia.org/wiki/Ascii stackoverflow Line reading chokes on 0x1A
http://stackoverflow.com/questions/405058/line-reading-chokes-on-0x1a/405169#405169