【转】oracle数据库中varchar2陷阱

转自:http://www.cnblogs.com/iyangyuan/p/3491215.html

 

oracle数据库相信大家都比较熟悉,数据库中有一种非常常用的数据类型:字符串型。

         对应该类型,在oracle中有三种比较常用的类型:varchar2(byte)、varchar2(char)、nvarchar2()。

         那么这三种类型到底有什么区别呢?

         首先,我们要时刻记清:无论是varchar2还是nvarchar2,最大字节数都是4000

         varchar2(byte):就是默认的表示方式,比如我们写成:varchar2(100),就相当于varchar2(100 byte),表示最大字节数是100,该字段最多能容纳100个字节,强调空间大小。由于我们描述的是字节,因此,保存汉字等字符时,就要小心了。如果你的数据库用的是GBK编码,那么一个汉字将占用2个字节,最多能存50个汉字,如果你的数据库用的是UTF8编码,那么一个汉字将占用3个字节,最多能存33个汉字。

         varchar2(char):表示最大字符数是100,该字段最多能容纳100个字符,强调个数。假设我们写成varchar2(100 char),那么无论是数字、字母、汉字,都看成一个字符,最多写100个,当然,汉字越多,占用的空间越大,同样遵循上边的数据库编码原则。例如:存入一个汉字,底层占2或3个字节,存入一个字母,占1个字节,绝对不是某些文章所说1个字母或数字也占2或3个字节!

         nvarchar2():没有byte、char之分,类似于varchar2(char),只不过nvarchar2()屏蔽了数据库编码,无论是何种编码,nvarchar2()中一个汉字都占两个字节。

         一般的教程,也就到这了,可是如果再多一步思考,会发现一个致命问题。

         实际应用中,很可能会出现这种写法:varchar2(1400 char),我们主观的认为,这个字段最长不能超过1400个字符,这意味着我们可能会存入1399个字符,貌似很正确的样子。

         但是,如果这1399个字符都是汉字,字符长度并没有超过1400,看起来一切正常,但实际上我们损失了一部分数据,为什么?

         因为1399个汉字,按UTF8编码来说(99%的项目都是UTF8编码吧。。),需要占用1399*3=4197个字节,而文章开篇就说,无论是什么char,最大长度就是4000字节,一个也不能多,因此多出来的197个字节,都会抹去,而整个过程中,无任何错误提示,你的数据就这样蒸发了!

         所以,对于GBK编码的数据库而言,安全的写法为:varchar2(2000 char)、nvarchar2(2000),对于UTF8编码的数据库而言,安全的写法为:varchar2(1333 char)、nvarchar2(2000)。

         各位读者,赶快检查一下你的数据库吧!

         小菜水平有限,高手勿喷,欢迎与我交流~~~

转载于:https://www.cnblogs.com/bj20170624/p/8492207.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/466564.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

浅析Linux 64位系统虚拟地址和物理地址的映射及验证方法

前言有好久没更新了,这段时间发生了挺多大喜事哈。但是也还是有挺久没更新了,不得不意识到自己是个小菜鸡,就算是小菜鸡也要做一只快乐小菜鸡。就算更新慢但是我依然会持续更新,因为更文使我快乐。虚拟内存先简单介绍一下操作系统…

SPI、I2C、UART三种串行总线协议的区别

SPI、I2C、UART三种串行总线协议的区别 宗旨:技术的学习是有限的,分享的精神是无限的。 第一个区别当然是名字: SPI(Serial Peripheral Interface:串行外设接口); I2C(INTER IC BUS:意为IC之间总线) UART(…

FLEX组件AnyChart实例教程.

自己看吧,十分详细. 这是其中一个例子: http://www.anychart.com/products/anychart/docs/platforms/flex/samples/gauge_tank/GaugeTank.swf http://www.anychart.com/products/anychart/docs/platforms/flex/

C语言指针:从底层原理到花式技巧,用图文和代码帮你讲解透彻

一、前言二、变量与指针的本质三、指针的几个相关概念四、指向不同数据类型的指针五、总结一、前言如果问C语言中最重要、威力最大的概念是什么,答案必将是指针!威力大,意味着使用方便、高效,同时也意味着语法复杂、容易出错。指针…

软件过程改进

对于软件企业来说,软件过程是整个企业最复 杂、最重要的业务流程,软件产品就是软件企业的生命,改进整个企业的业务流程,最重要的还是要改进它的软件过程。多年以来,人们认识到要想高效率、高质量 和低成本地开发软件&a…

ARM

ARM 宗旨:技术的学习是有限的,分享的精神是无限的。 1 、ARM处理器的特点 ARM 处理器具有耗电少,功能强大,16 位/32 位双指令集等众多优点。主要有以下六个主要特点: ① 体积小、低功耗,低成本和高性能&am…

Linux下精准踢掉登录用户-pkill命令

pkill -kill -t 用户的TTY pkill -9 用户的TTY 转载于:https://www.cnblogs.com/setart/p/8496165.html

解决一个I2C读写问题

之前写关于I2C相关的文章排查一个触摸屏驱动问题MTK 平台TP调试遇坑1、问题今天遇到一个问题&#xff0c;我们有一个芯片&#xff0c;I2C读写失败&#xff0c;导致录音有问题&#xff0c;而且是偶现的。log提示看到是返回 -6<3>[ 730.336308] (3)[2085:tinycap]es7243_…

用多媒体库 Bass.dll 播放 mp3 [9] - 绘制波形图

本例效果图:代码文件:unit Unit1;interfaceusesWindows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,Dialogs, StdCtrls, ExtCtrls, ComCtrls;typeTForm1 class(TForm)OpenDialog1: TOpenDialog;PaintBox1: TPaintBox;Button1: TButton;Button2: TBut…

我是如何使用wireshark软件的

长按二维码识别关注技术共享|资料共享|沟通交流01简介这篇文章介绍一个好用的抓包工具Wireshark&#xff0c; 用来获取网络数据封包&#xff0c;包括HTTP、TCP、UDP等网络协议包。开始界面wireshark是捕获机器上的某一块网卡的网络包&#xff0c;当你的机器上有多块网卡的时候&…

揩油

揩油&#xff0c;说的是老是有人送上来给我揩油&#xff0c;让我很没有心理准备&#xff0c;而且很不适应。 昨天去家乐福买东西&#xff0c;排队付钱的时候&#xff0c;我和前面一个女孩子的距离间隔<?xml:namespace prefix st1 ns "urn:schemas-microsoft-com:off…

AfxGetMainWnd( )函数

AfxGetMainWnd( )函数 版权声明&#xff1a;需要转载的请注明出处 https://blog.csdn.net/qq_22642239/article/details/52241405 AfxGetMainWnd( )&#xff1a; 使用AfxGetMainWnd函数获取MFC程序中的主框架类指针是一个常用作法。 就是获得应用程序主窗口的指针&#xff…

8086 汇编

8086 汇编速查手册 宗旨&#xff1a;技术的学习是有限的&#xff0c;分享的精神的无限的。 一、数据传输指令 ─────────────────────────────────────── 它们在存贮器和寄存器、寄存器和输入输出端口之间传送数据. 1. 通用数…

BZOJ4681 [jsoi2010]旅行

时间限制&#xff1a; 3S空间限制&#xff1a; 256M具体思路:DPf[i][j][k]表示1-i,前L条路上用了 j条,L后的路上换了k条的最小代价枚举一下L就有了一个复杂度O(nlognk^3)的做法AC代码#include<bits/stdc.h> using namespace std; #define INF 100000000 #define P pair&l…

IIC踩过的坑

读取IT8563WE时&#xff0c;读取第一次正确&#xff0c;第二次错误&#xff0c;第三次正确&#xff0c;第四次错误。。。。。。看到读取成功之后&#xff0c;SDA信号没有被正确拉高&#xff0c;电平大概只有一半。再次读取&#xff0c;主机设置读模式时&#xff0c;从机会发送N…

PostMessage()

PostMessage函数 PostMessage是Windows API(应用程序接口) 中的一个常用函数&#xff0c;用于将一条消息放入到消息队列中。消息队列里的消息通过调用GetMessage和PeekMessage取得。 函数功能 该函数将一个消息放入&#xff08;寄送&#xff09;到与指定窗口创建的线程相联系…

ATT汇编指令总结

AT&T汇编指令总结 宗旨&#xff1a;技术的学习是有限的&#xff0c;分享的精神是无限的。 1.寄存器引用 引用寄存器要在寄存器号前加百分号%,如“movl %eax, %ebx”。 80386有如下寄存器&#xff1a; 8个32-bit寄存器 %eax&#xff0c;%ebx&#xff0c;%ecx&#xff0c;…

jpush 极光推送 java

https://www.jianshu.com/p/22a4d630c01a http://blog.csdn.net/qq_35860097/article/details/75117323转载于:https://www.cnblogs.com/volatileAndCrazy/p/8508061.html

1万字30张图说清TCP协议

本篇文章较长&#xff0c;大家先看下目录1、简介2、TCP协议头3、TCP 数据包的编号&#xff08;SEQ&#xff09;4、三次握手建立连接5、四次挥手断开连接6、TCP可靠性的保证7、滑动窗口技术9、窗口滑动的数据重发9、TCP 流控制10、网线“断”了怎么办01简介TCP(Transmission Con…

比tween更有效的tween包.

感谢经典feixing1的提示. TweenLite&#xff1a; http://blog.greensock.com/tweenliteas3/ Tweener: http://code.google.com/p/tweener/ Burrows 翻译的 TweenLite中文文档http://www.troikaer.cn/blog/