设为首页  
联系我们  
加入收藏  
网页制作 冲浪宝典 图形图像 操作系统 软件教学 编程开发 认证考试 安全技术 站长专区 文学驿站 娱乐天地 游戏天地 办公软件
文章搜索
您的位置: 首页 >> 文章首页 >> 编程开发 >> 网站制作技术 >> AWStats: Apache/IIS的日志分析工具——在GNU/Linux和Windows平台上的使用简介
精品推荐
网站制作技术点击TOP10
·网页打印问题,打印设置,打印预览,打印分页,纵打,横打及页面的边距
·Asp.net可输入下拉框服务器控件
·包过滤规则配置示例
·ISAPI_Rewrite Lite
·一个带搜索功能的网页原代码
·漂亮的日期选择器
·全角/半角的转换函数
·AWStats: Apache/IIS的日志分析工具——在GNU/Linux和Windows平台上的使用简介
·手把手教你如何免费注册国际顶级域名
·Do All in Cmd Shell
编程开发点击TOP10
·数字小键盘指法练习
·ASP.NET 程序中常用的三十三种代码
·用C语言编通讯录程序(初学者级别的)
·我写的Java学生成绩管理系统源代码
·CHK文件恢复工具
·Modem 常用AT指令集
·java笔试题
·异常java.sql.SQLException: Io exception:The Network Adapter could not establish connection
·单片机模拟I2C总线及24C02(I2C EEPROM)读写实例(源代码)
·C++经典电子书下载
精选专题

AWStats: Apache/IIS的日志分析工具——在GNU/Linux和Windows平台上的使用简介

作者: 来源:网络文章 时间:2005-12-17 22:37:46

AWStats: Apache/IIS的日志分析工具——在GNU/Linux和Windows平台上的使用简介(6) ---
>                               my $hr=($ix+1); if ($hr>12) { $hr=$hr-12; }

在Awstats 5.5以后中已经加入了针对中文主要搜索引擎的定义:这里是补充后的完整列表(包括了主要门户搜索和搜索门户)
62c60
< "baidu\.com","search\.sina\.com","search\.sohu\.com",
---
> "baidu\.com","sina\.com","3721\.com","163\.com","tom\.com","sohu\.com",

153c144
< "baidu\.com","Word=", "search\.sina\.com", "word=", "search\.sohu\.com","word=",
---
> "baidu\.com","word=", "sina\.com", "word=", "3721\.com", "name=","163\.com","q=","tom\.com","word=","sohu\.com","word=",

250c234
< "baidu\.com","Baidu", "search\.sina\.com","Sina", "search\.sohu\.com","Sohu",
---
> "baidu\.com","Baidu", "sina\.com","Sina", "3721\.com","3721","163\.com","NetEase","tom\.com","Tom","sohu\.com","Sohu",

对Google的Unicode查询还是需要一些查询补丁:
因为Google对于Windows 2000以上的IE浏览器缺省发送的查询都是UTF-8格式的,而其他搜索引擎大部分使用的是系统本地编码:GB2312,因此需要将查询URI解码后,还要根据是否使用UTF-8进行到GB2312的转码,否则同样的单词会在统计中留有UTF-8和GB2312两条记录。

我增加了以下函数用于Google UTF-8字符的解码和类似于“\xc4\xbe\xd7\xd3\xc3\xc0”这样查询的解码
sub Utf8_To_Ascii {
     my $string = shift;
     my $encoding = shift;

     # change \xc4\xbe\xd7\xd3\xc3\xc0 into %c4%be%d7%d3%c3%c0
     $string =~ s/\\x(\w{2})/%\1/gi;

     # uri unescape
     $string = uri_unescape($string);

     if ( $string =~ m/^([\x00-\x7f][\xc2-\xdf][\x80-\xbf]\xe0[\xa0-\xbf][\x80-\xbf][\xe1-\xef][\x80-\xbf][\
x80-\xbf]\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf][\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf])*$/ )
     {
         $string = decode("utf-8", $string);

共8页 9 7 [1] [2] [3] [4] [5] [6] [7] [88 :>

AWStats: Apache/IIS的日志分析工具——在GNU/Linux和Windows平台上的使用简介 相关文章:
AWStats: Apache/IIS的日志分析工具——在GNU/Linux和Windows平台上的使用简介 相关软件:
特别声明:本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作者。文章版权归文章原始作者所有。对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转载的文章有版权问题请联系编辑人员,我们尽快予以更正。
转载请注明来源:http://www.xgdown.com