为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

自己动手MOBI转PDF

2018-04-15 4页 doc 72KB 685阅读

用户头像

is_482581

暂无简介

举报
自己动手MOBI转PDF自己动手MOBI转PDF 自己动手 MOBI 转 PDF 最近想多背些单词,扩充下词汇量,网上兜了一圈发现大家对韦小绿【是什么自己到网上收下,我就不列出来了,以免引起纠纷】评价很高, 原来想去到书城买本进口原版的看,想来想去那么厚,虽然很轻但是还是带起来不方便啊。平时身上都带着一本M92和一部V9+已经塞满小包了。于是就邪恶的在网上找了本mobi格式的第二版,打算放在M92里。PS:现在知道生活在天朝是多么的幸福吧。 尼玛,谁知道在M92里显示出来有2000多页,实体书也就500多页。音标也无法正确显示,原因是音标都是用图...
自己动手MOBI转PDF
自己动手MOBI转PDF 自己动手 MOBI 转 PDF 最近想多背些单词,扩充下词汇量,网上兜了一圈发现大家对韦小绿【是什么自己到网上收下,我就不列出来了,以免引起纠纷】评价很高, 原来想去到城买本进口原版的看,想来想去那么厚,虽然很轻但是还是带起来不方便啊。平时身上都带着一本M92和一部V9+已经塞满小包了。于是就邪恶的在网上找了本mobi格式的第二版,打算放在M92里。PS:现在知道生活在天朝是多么的幸福吧。 尼玛,谁知道在M92里显示出来有2000多页,实体书也就500多页。音标也无法正确显示,原因是音标都是用图片拼接的。不知道是不是M92的原因,KINDLE的没有试过。在网上找转换工具想把MOBI转成PDF的,结果音节正常了,但是还是有2000多页,每页空白很大,看起来很不爽啊。智能的去掉空白,一般转化软件还真做不到。没办法只有自己手工的改了。 原理,其实MOBI是个zip包,你可以把后缀改成zip,然后用解压缩软件打开,再修改里面的HTML文件。都是HTML文件了还是有什么我们不能改的,,赶紧动手~ 1. 把所有HTML文件里的把除了BODY标签里的保留下来,其他的统统删掉。 [plain] view plaincopy 1. sed -i "1,7d;$d" *.html 2. sed -i "s/<\/body>//g" *.html 2. 把所有处理完的HTML 内容集中在一个文件里,这里因为文件名特殊,要简单处理下 。[python] view plaincopy 1. import os 2. for i in range (0,2005): 3. if i == 0 : 4. strs = "000" 5. elif i > 0 and i < 10: 6. strs = "00" + str(i) 7. elif i>=10 and i<100: 8. strs = "0" + str(i) 9. else : 10. strs = "" + str(i) 11. finalstr = "D:\\test\\1\\xxxxxxxxxxx_" +strs+".html" 12. cmds = "cat " + finalstr + " >> d:\\test\\all2 " 13. print cmds 14. os.system(cmds) 3. 处理音标。 就是把所有的标签删掉,注意要避免VI下的贪婪匹配,防止删掉不该删的东西。 [plain] view plaincopy 1. %s/]*\/>//g 4. 微调格式 [plain] view plaincopy 1. :%s/. /
/g 5. 把生成的文件中头尾加入在第2步中删除的BODY 标签之外的东西。在浏览器中打开, 拷到WORD中,然后另存为PDF. 6. 大功告成。如果大家有好的转换软件可以告诉我哈。 查看前后效果对比: 未处理前 2000多页: 处理后 500多页:
/
本文档为【自己动手MOBI转PDF】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索