最近书荒得厉害,想重温金庸全集,找了几个武侠小说官网发现只能在线看。点哪都要钱,下载按钮藏得比《笑傲江湖》里的葵花宝典还深。我偏不信邪,花了三天时间折腾,终于摸出三招野路子。
第一招:手动扒网页
我找到个号称正版的武侠站,打开《射雕英雄传》目录页直接右键选”另存为”,存了个HTML文件到桌面。打开一看傻眼了,正文全都加载在iframe框架里,存下来的只有章节名。气得我连摔三次鼠标,打开浏览器开发者工具(按F12),在Network标签页里刷新页面,盯着JS文件挨个找。终于发现个api接口返回了所有章节内容,直接复制json数据扔进在线json转txt工具,这才把第一章弄到手。
坑爹之处:有本小说每章都被拆成三个接口调用,光复制粘贴就折腾到凌晨三点,存到二十章时手抖关了页面全白干…
第二招:嗅探真实地址
另个网站更鸡贼,点下载按钮弹出”请安装专属阅读器”。我火速装了软件,打开发现所有书都加密了。突然想起老司机教的抓包工具,打开后启动阅读器随便点开本书,果然抓到个带.zip的直链地址!把链接复制到迅雷,进度条瞬间跑满。解压时提示要密码,返回阅读器翻安装目录,在userdata文件夹里翻出本地缓存库,对照着小说ID找到密码本txt,这才解开压缩包。
小编温馨提醒:本站只提供游戏介绍,下载游戏推荐89游戏,89游戏提供真人恋爱/绅士游戏/3A单机游戏大全,点我立即前往》》》绅士游戏下载专区
- 工具:抓包软件名字就不说了省得吃律师函
- 难点:动态密钥每半小时变一次
- 补救:设了三组闹钟卡着25分钟刷新密码
第三招:OCR暴力扫描
有个老站连目录页都不给,必须跳转APP。我直接用虚拟机装安卓模拟器,开着自动翻页脚本录屏。用视频剪辑软件把三小时录像抽帧成五千张截图,扔进OCR工具识别。结果《神雕侠侣》变成《神周侠侣》,《九阴真经》认成《九阴贞经》。挂淘宝花五块钱让店家人工校对,校对回来还是错字连篇,气得我直接删了二十章垃圾文本。
吐血折腾完三套方法,硬盘里塞了83G武侠小说,结果发现某二手书平台全套旧版才卖三十八块包邮,现在只想穿越回去抽自己两耳光。