一个有趣的问题——MySQL中varchar的最大长度
明明维护了一个1k的最小堆,可是输出到MySQL里却只有九百多行数据。
查log,发现这么一段内容:
01stderr logs02com.mysql.jdbc.MysqlDataTruncation: Data truncation: Data too long for column 'reqs' at row 103 at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3595)04 at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3529)05 at com.mysql.jdbc.MysqlIO.sendCommand(MysqlIO.java:1990)06 at com.mysql.jdbc.MysqlIO.sqlQueryDirect(MysqlIO.java:2151)07 at com.mysql.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2625)08 at com.mysql.jdbc.PreparedStatement.executeInternal(PreparedStatement.java:2119)09 at com.mysql.jdbc.PreparedStatement.executeUpdate(PreparedStatement.java:2415)10 at com.mysql.jdbc.PreparedStatement.executeUpdate(PreparedStatement.java:2333)11 at com.mysql.jdbc.PreparedStatement.executeUpdate(PreparedStatement.java:2318)12 at com.successfactors.perflog.hadoop.mapreduce.core.ParseRecordToDB$RecordReducer.insertData(Unknown Source)13 at com.successfactors.perflog.hadoop.mapreduce.core.ParseRecordToDB$RecordReducer.cleanup(Unknown Source)14 at org.apache.hadoop.mapreduce.Reducer.run(Reducer.java:178)15 at org.apache.hadoop.mapred.ReduceTask.runNewReducer(ReduceTask.java:649)16 at org.apache.hadoop.mapred.ReduceTask.run(ReduceTask.java:417)17 at org.apache.hadoop.mapred.Child$4.run(Child.java:255)18 at java.security.AccessController.doPrivileged(Native Method)19 at javax.security.auth.Subject.doAs(Subject.java:415)20 at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1121)21 at org.apache.hadoop.mapred.Child.main(Child.java:249)
看来是column的最大长度不够,查看DDL:
01CREATE TABLE `record` (02 `eid` varchar(100) NOT NULL,03 `module` varchar(32) NOT NULL,04 `stime` int(11) NOT NULL,05 `edate` varchar(32) NOT NULL,06 `fname` varchar(100) NOT NULL,07 `event` varchar(500) NOT NULL,08 `reqs` varchar(10000) NOT NULL,09 PRIMARY KEY (`eid`)10) ENGINE=InnoDB DEFAULT CHARSET=utf8;
我都一万了还不够,试下65535吧!
发现varchar直接变成mediumtext了,这可不对。那就试试22222吧
又报错了...
最后我设置为20000长度了,倒是通过了,通过一个复杂的减法可以计算更为临界的值。
去网上查查,发现MySQL里column的最大长度貌似跟很多东西有关,跑去问公司的DBA,貌似oracle是另一套机制。
附一篇别人的文章,讲最大值的:
http://www.bitsCN.com/database/201210/159610.html
01这不是一个固定的数字。本文简要说明一下限制规则。0203strlen 计算字符串长度,一个中文当2字符0405mb_strlen根据它的字符编码模式,统计字符quot0607count计算数组中的元素数目或对象中的属性个数0809 ";16echo strlen($string2);17echo "";18//用 php 多字节扩展函数 mb_strlen试试看19echo mb_strlen($string1,'utf8');20echo "";21echo mb_strlen($string2,'utf8');22echo "";23 ?>2425输出结果是:269273283293301、限制规则3132字段的限制在字段定义的时候有以下规则:3334a) 存储限制3536 varchar 字段是将实际内容单独存储在聚簇索引之外,内容开头用1到2个字节表示实际长度(长度超过255时需要2个字节),因此最大长度不能超过65535。3738b) 编码长度限制3940 字符类型若为gbk,每个字符最多占2个字节,最大长度不能超过32766;4142 字符类型若为utf8,每个字符最多占3个字节,最大长度不能超过21845。4344 对于英文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。4546 若定义的时候超过上述限制,则varchar字段会被强行转为text类型,并产生warning。4748c) 行长度限制4950 导致实际应用中varchar长度限制的是一个行定义的长度。 MySQL要求一个行的定义长度不能超过65535。若定义的表长度超过这个值,则提示5152 ERROR 1118 (42000): Row size too large. The maximum row size for the used table type, not counting BLOBs, is 65535. You have to change some columns to TEXT or BLOBs。53542、计算例子5556 举两个例说明一下实际长度的计算。5758a) 若一个表只有一个varchar类型,如定义为5960create table t4(c varchar(N)) charset=gbk;6162则此处N的最大值为(65535-1-2)/2= 32766。6364减1的原因是实际行存储从第二个字节开始’;6566减2的原因是varchar头部的2个字节表示长度;6768除2的原因是字符编码是gbk。69707172b) 若一个表定义为7374create table t4(c int, c2 char(30), c3 varchar(N)) charset=utf8;7576则此处N的最大值为 (65535-1-2-4-30*3)/3=218127778减1和减2与上例相同;7980减4的原因是int类型的c占4个字节;8182减30*3的原因是char(30)占用90个字节,编码是utf8。8384 如果被varchar超过上述的b规则,被强转成text类型,则每个字段占用定义长度为11字节,当然这已经不是“varchar”了。