设为首页  
联系我们  
加入收藏  
网页制作 冲浪宝典 图形图像 操作系统 软件教学 编程开发 认证考试 安全技术 站长专区 文学驿站 娱乐天地 游戏天地 办公软件
文章搜索
您的位置: 首页 >> 文章首页 >> 编程开发 >> 网络编程 >> PHP文摘 >> PHP对GB编码动态转UTF-8几种方法评测
精品推荐
PHP文摘点击TOP10
·谈网页编程PHP语言的发展
·PHP 脚本:随心所欲的代码逐渐流行
·php4和php5区别
·针对初学PHP者的疑难问答(1)
·初探PHP5
·PHP4在Windows2000下的安装
·真正面向对象编程:PHP5.01发布
·PHP安装攻略:常见问题解答(二)
·PHP安装攻略:常见问题解答(一)
·Zend Studio 5 Beta
网络编程点击TOP10
·ASP.NET 程序中常用的三十三种代码
·用C#实现木马程序
·C#编写的windows计算器-源代码
·从零开始学ASP.NET(基础篇)
·VS.net 2005 Beta 下载地址(Express Edition)
·利用Web Application Stress Tool(WAS)做性能测试(1)
·"SQL Server不存在或访问被拒绝"问题的解决
·《用C#和数据库实现无限级分类法》修正程序
·.NET 初 级 读 本
·我的.NET书架 (入门篇)
精选专题

PHP对GB编码动态转UTF-8几种方法评测

作者: 来源:http://www.xgdown.com/ 时间:2007-9-9 10:58:17

PHP对GB编码动态转UTF-8几种方法评测(3) }
for ($i = 0; $i < 100; $i++) { // 随机产生100个ip地址
 $strIp = mt_rand(0, 255).\".\".mt_rand(0, 255).\".\".mt_rand(0, 255).\".\".mt_rand(0, 255);
 $arrAddr[$i] = ip2addr(EncodeIp($strIp));
}
$resConn = mysql_connect(\"localhost\", \"netnest\", \"netnest\");
mysql_select_db(\"test\");
// 测评MySQL查询的编码转换
$dblTimeStart = GetMicroTime();
for ($i = 0; $i < 100; $i++) {
 $strUTF8Region = GB2UTF8_SQL($arrAddr[$i][\"region\"]);
 $strUTF8Address = GB2UTF8_SQL($arrAddr[$i][\"address\"]);
}
$dblTimeDuration = GetMicroTime() - $dblTimeStart;
// 测评结束并输出结果
echo $dblTimeDuration; echo \"\r\n\";
// 测评文本文件查询的编码转换
$dblTimeStart = GetMicroTime();
for ($i = 0; $i < 100; $i++) {
 $strUTF8Region = GB2UTF8_FILE($arrAddr[$i][\"region\"]);
 $strUTF8Address = GB2UTF8_FILE($arrAddr[$i][\"address\"]);
}
$dblTimeDuration = GetMicroTime() - $dblTimeStart;
// 测评结束并输出结果
echo $dblTimeDuration; echo \"\r\n\";
?>

测评两次结果(精确到3位小数,单位是秒):

MySQL查询转换:0.112
文本查询转换:10.590

MySQL查询转换:0.099
文本查询转换:10.623

可见这次是MySQL方法遥遥领先于文件查询法。但是现在还不急于使用MySQL方法,因为文本文件方法之所以如此耗时,主要因为它每次转换都要把整个gb_unicode.txt读入内存,而gb_unicode.txt又是文本文件,格式如下:

0x2121   0x3000   # IDEOGRAPHIC SPACE
0x2122   0x3001   # IDEOGRAPHIC COMMA
0x2123   0x3002   # IDEOGRAPHIC FULL STOP
0x2124   0x30FB   # KATAKANA MIDDLE DOT
0x2125   0x02C9   # MODIFIER LETTER MACRON (Mandarin Chinese first tone)
……
0x552A   0x6458   # <CJK>
0x552B   0x658B   # <CJK>
0x552C   0x5B85   # <CJK>
0x552D   0x7A84   # <CJK>
……
0x777B   0x9F37   # <CJK>
0x777C   0x9F3D   # <CJK>
0x777D   0x9F3E   # <CJK>
0x777E   0x9F44   # <CJK>


文本文件效率较低,于是考虑把文本文件转换为二进制文件,然后用折半法查找这个文件,而不需要把整个文件读入内存。文件格式为:文件头2字节,存储记录数;接着一条接一条记录存入文件,每条记录4字节,前2字节对应GB代码,后2字节对应Unicode代码。转换程序如下:
共5页 9 7 [1] [2] [3] [4] [58 :>

PHP对GB编码动态转UTF-8几种方法评测 相关文章:
PHP对GB编码动态转UTF-8几种方法评测 相关软件:
特别声明:本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作者。文章版权归文章原始作者所有。对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转载的文章有版权问题请联系编辑人员,我们尽快予以更正。
转载请注明来源:http://www.xgdown.com