判断文件的编码方式

/*
    功能:实现文件编码格式的判断
    通过一个文件的最前面三个字节,可以判断出该的编码类型:
    ANSI:        无格式定义;(第一个字节开始就是文件内容)
    Unicode:       前两个字节为FFFE;
    Unicode big endian: 前两字节为FEFF; 
    UTF-8:        前两字节为EFBB,第三字节为BF
*/
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
// 读取一个文件的最前面n个字节,并以十六进制形式输出每个字节的值
void readNBytes(char *fileName, int n)
{
    FILE *fp = fopen(fileName, "r");
    unsigned char *buf = (unsigned char*)malloc(sizeof(unsigned char)*n);
    int i;
    if(fp == NULL)
    {
        printf("open file [%s] failed.\n", fileName);
        return;
    }
    fread(buf, sizeof(unsigned char), n, fp);
    fclose(fp);
    printf("%s:\t", fileName);
    for(i = 0; i < n; i++)
    {
        printf("%x\t", buf[i]);
    }
    printf("\n");
    free(buf);
}
void main()
{
    char fileName[][50] = {"ansi.txt", "unicode.txt", "ubigendian.txt", "utf8.txt"};
    int i;
    for(i = 0; i < 4; i++)
    {
        // 每个文件中的内容都是:你what123456
        readNBytes(fileName[i], 3);
    }
}

每个测试文件中的内容都是:你what123456

运行结果为:

ansi.txt:       c4      e3      77
unicode.txt:    ff      fe      60
ubigendian.txt: fe      ff      4f
utf8.txt:       ef      bb      bf

分类: C/C++, Linux_C/C++

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/383226.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux系统编程----12(线程概念,Linux线程实现原理,栈中ebp指针和ebp指针,线程的优缺点和共享资源)

线程概念 什么是线程 在一个程序里的一个执行路线就叫做线程&#xff08;thread&#xff09;。更准确的定义是&#xff1a;线程是“一个进程内部的控制序列” 一切进程至少都有一个执行线程线程在进程内部运行&#xff0c;本质是在进程地址空间内运行在Linux系统中&#xff0…

Linux系统编程---13(线程控制函数,创建线程,循环创建多个线程,线程间共享全局变量)

线程控制 操作系统并没有提供创建线程的系统调用接口&#xff0c;因此大佬们封装了一个线程的接口库实现线程控制。意为着用户创建线程都使用的是库函数&#xff08;所以有时候我们说创建的线程是一个用户态线程&#xff0c;但是在内核中对应有一个轻量级进程实现线程程序的调…

Linux系统编程---14(回收子线程,回收多个子线程,线程分离,杀死线程)

回收子线程 pthread_join 函数 阻塞等待线程退出&#xff0c;获取线程退出状态 其作用&#xff0c;对应进程中 waitpid() 函数。 int pthread_join (pthread_t thread,void** retval); 成功&#xff1a;0&#xff0c;失败&#xff1a;错误号 参数&#xff1a;thread&#x…

Linux系统编程----15(线程与进程函数之间的对比,线程属性及其函数,线程属性控制流程,线程使用注意事项,线程库)

对比 进程 线程 fork pthread_create exit (10) pthread_exit &#xff08;void *&#xff09; wait (int *) pthread_join &#xff08;&#xff0c;void **&#xff09;阻塞 kill pthread_cancel ();必须到取消点&#xff08;检查点&#xff09;&#xff1a;…

内核双向循环链表

#include <string.h>#include <stdio.h>#include <stdlib.h>#include<malloc.h>#include <arpa/inet.h>//链表头结构struct list_head{struct list_head *next,*prev;};//真正实现链表插入操作void _list_add(struct list_head *nnew,struct lis…

Linux系统编程----16(线程同步,互斥量 mutex,互斥锁的相关函数,死锁,读写锁)

同步概念 所谓同步&#xff0c;即同时起步&#xff0c;协调一致。不同的对象&#xff0c;对“同步”的理解方式略有不同。如&#xff0c;设备同步&#xff0c;是指在两 个设备之间规定一个共同的时间参考&#xff1b;数据库同步&#xff0c;是指让两个或多个数据库内容保持一致…

转移字符的转换

使得网页上不会显示 \x0a\x0a \x0a \x0a \x0a \x0a 类似的字符static int te_escape_isDec(char *ptr, unsigned int len) { …

Linux系统编程---17(条件变量及其函数,生产者消费者条件变量模型,生产者与消费者模型(线程安全队列),条件变量优点,信号量及其主要函数,信号量与条件变量的区别,)

条件变量 条件变量本身不是锁&#xff01;但它也可以造成线程阻塞。通常与互斥锁配合使用。给多线程提供一个会合的场所。 主要应用函数&#xff1a; pthread_cond_init 函数pthread_cond_destroy 函数pthread_cond_wait 函数pthread_cond_timedwait 函数pthread_cond_signa…

好友

http://blog.csdn.net/liangyuannao/article/details/8583139

Linux系统编程---18(线程池相关概念及其实现)

线程池 概念&#xff1a; 一堆线程任务队列 作用 避免大量线程频繁的创建/销毁时间成本避免瞬间大量线程创建耗尽资源&#xff0c;程序崩溃危险 实现 创建固定数量的线程创建一个线程安全的任务队列 一种线程使用模式。 线程过多会带来调度开销&#xff0c;进而影响缓…

设计模式--1(设计模式基础,设计模式基本原则,设计模式分类)

设计模式基础 模式 在一定环境中解决某一问题的方案&#xff0c;包括三个基本元素–问题&#xff0c;解决方案和环境。大白话&#xff1a;在一定环境下&#xff0c;用固定套路解决问题。 设计模式 是一套被反复使用、多数人知晓的、经过分类编目的、代码设计经验的总结。使…

source insight 使用技巧

source insight 使用技巧 1 sourceinsight screen font 的默认字体是Verdana的&#xff0c;它是一直变宽字体。在Document style中可以将字体改为定宽的Courier2 document options->auto indent 去掉indent Open Brace和Indent Close Brace的效果: 继上一段&#xff0c;在…

设计模式----2(简单工厂模式的概念,简单工厂模式的实现,简单工厂模式的优缺点)

简单工厂模式 简单工厂模式的概念 简单工厂模式属于类的创建型模式,又叫做静态工厂方法模式。通过专门定义一个类来负 责创建其他类的实例&#xff0c;被创建的实例通常都具有共同的父类。 具体分类 工厂&#xff08;Creator&#xff09;角色 简单工厂模式的核心&#xff0…

Redis常见问题及其一些重点知识总结

1、什么是 Redis&#xff1f;简述它的优缺点&#xff1f; Redis 的全称是&#xff1a;Remote Dictionary.Server&#xff0c;本质上是一个 Key-Value 类型的内存数据库&#xff0c;很像 memcached&#xff0c;整个数据库统统加载在内存当中进行操作&#xff0c;定期通过异步操…

shell生成随机文件名

1 #!/bin/bash 2 # tempfile-name.sh: 临时文件名产生器 3 4 BASE_STRmcookie # 32-字符的 magic cookie. 5 POS11 # 字符串中随便的一个位置. 6 LEN5 # 取得 $LEN 长度连续的字符串. 7 8 prefixtemp # 最终的一个临时文…

设计模式---3(工厂方法模式的概念,工厂方法模式的实现,工厂方法模式和简单工厂模式比较)

工厂方法模式 概念 工厂方法模式同样属于类的创建型模式又被称为多态工厂模式 。 工厂方法模式的意义 定义一个创建产品对象的工厂接口&#xff0c;将实际创建工作推迟到子类当中。 核心工厂类不再负责产品的创建&#xff0c;这样核心类成为一个抽象工厂角色&#xff0c;仅…

设计模式---4(抽象工厂模式的概念,产品组和产品等级的概念,抽象工厂模式的实现)

抽象工厂模式 抽象工厂模式的概念 抽象工厂模式是所有形态的工厂模式中最为抽象和最其一般性的。抽象工厂模式可以向 客户端提供一个接口&#xff0c;使得客户端在不必指定产品的具体类型的情况下&#xff0c;能够创建多个产品 族的产品对象。 抽象工厂的角色及其职责 抽象工…

Win32项目关于MessageBox参数的详细说明

函数功能&#xff1a;该函数创建、显示、和操作一个消息框。消息框含有应用程序定义的消息和标题&#xff0c;加上预定义图标与Push&#xff08;下按&#xff09;按钮的任何组合。 函数原型&#xff1a;int MessageBox(HWND hWnd,LPCTSTR IpCaption,UINT…

w3af解析

1. w3af简介 w3afis a Web Application Attack and Audit Framework.即Web应用攻击和审计框架。w3af用python编写&#xff0c;依赖的库主要有2类&#xff0c;分别如下&#xff1a; <1> Core requirements: Python 2.6 fpconst-0.7.2&#xff1a;用于处理IEEE 754浮点…

1.c++中初始化列表和构造函数初始化的区别是什么?2.类的成员变量的初始化顺序是按照声明顺序吗?

初始化列表和构造函数初始化的区别是什么&#xff1f; 初始化和赋值对内置类型的成员没有太大的区别&#xff0c;在成员初始化列表和构造函数体内进行&#xff0c;在性能和结果上都是一样的。只有一些需要注意的事项 初始化列表一般情况如下&#xff1a; Date(int year, int …