设为首页  
联系我们  
加入收藏  
网页制作 冲浪宝典 图形图像 操作系统 软件教学 编程开发 认证考试 安全技术 站长专区 文学驿站 娱乐天地 游戏天地 办公软件
文章搜索
您的位置: 首页 >> 文章首页 >> 办公软件 >> Word >> 把Word转为简洁的html的若干种方法
精品推荐
Word点击TOP10
·轻松破解Word与Excel的文档密码
·Word表格行、列、单元格的添加与删除
·让Word2003代替金山词霸帮你翻译英文
·Word公式编辑器快速上手指南
·教你微软Office Word文挡损坏后的修复
·word2003 视频教程(60)-制作目录
·在Word 2007中手工绘制复杂表格
·在Word 2007中轻松插入或创建表格
·实例讲解Word 2007中编辑公式的方法
·真正经典的十个Word实用技巧
办公软件点击TOP10
·Excel常用技巧25条
·防止Access数据库被下载的9种方法
·轻松破解Word与Excel的文档密码
·Word表格行、列、单元格的添加与删除
·让Word2003代替金山词霸帮你翻译英文
·不用公式 让Excel按人头打印出工资条
·Word公式编辑器快速上手指南
·Excel表格分栏打印输出的两种巧妙方法
·用好Excel共享工作簿 大大提高工作效率
·用WPS表格快速制作拼音田字格的方法
精选专题

把Word转为简洁的html的若干种方法

作者: 来源:http://www.xgdown.com/ 时间:2007-8-10 12:16:22

把Word转为简洁的html的若干种方法(1) Word可以直接另存为 htm,但即使是 另存为 html 也会有大量的废代码。以前我一般用 Dreamweaver 的 clean up html 来处理,先处理 word 特有标签,然后删除一些 font,b,span 等。进一步,在 editplus 里面用正则进行处理,最后得到我想要的干净的html 代码。当然最完美的办法就是拷贝文字出来,自己用文本编辑器书写htm标签,:)

今天又看到lifehacker这几种word 2 clean htm方法:

1.使用这个HTML Tidy Library Project开源软件来处理。

2.微软官方站点也有个ASPx?FamilyID=209ADBEE-3FBD-482C-83B0-96FB79B74DED&displaylang=EN">Office 2000 HTML Filter 2.0工具,可以用来处理掉word2000转html时出现的多余代码。

3.使用这个Word HTML Cleaner 在线工具来处理。只能处理word2000以下版本。

4.有人给出了正则表达式(其实,上面的各种软件也都是用正则来解决的)

删除不需要的标签

<[/]?(fontspanXML[ovwXP]:w+)[^>]*?>
- replace any matches with the empty string

删除class,style...等不需要的属性

<([^>]*)(?:classlangstylesizeface[ovwxp]:w+)=(?:'[^']*'""[^""]*""[^>]+)([^>]*)>
- replace any matches with <$1$2>

详细解释在Clean Word HTML using Regular Expressions

共2页 9 7 [1] [28 :>

把Word转为简洁的html的若干种方法 相关文章:
把Word转为简洁的html的若干种方法 相关软件:
特别声明:本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作者。文章版权归文章原始作者所有。对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转载的文章有版权问题请联系编辑人员,我们尽快予以更正。
转载请注明来源:http://www.xgdown.com