一提到爬虫,大家脑海里浮现的可能都是 Python、数据、挖掘、网页这些貌似触不可及的名词,这当然是程序员们的工作,而有些开发者不但熟练掌握爬虫技术,还能将爬虫功能打包成客户端,让普通用户也能愉快地使用、爬取网页。

知乎助手

知乎助手 是一款可以爬取知乎内容的工具,支持 Windows 与 Mac,并生成爬取内容为 epub 和 html 格式,便于离线阅读,其中 html 方式网页文件和图片是分开保存的,也可以当成可以爬取知乎图片;使用知乎助手,可以自由爬取:

任务类型描述URL示例
指定知乎用户的全部提问/回答/想法/赞同过的回答/赞同过的文章/关注过的问题用户个人主页地址http://www.zhihu.com/people/yyln2016
专栏专栏网址http://zhuanlan.zhihu.com/yyln2016
文章文章地址https://zhuanlan.zhihu.com/p/58653502
话题知乎话题地址,保存话题信息和话题精华中的答案http://www.zhihu.com/topic/20024374
问题问题地址https://www.zhihu.com/question/26784045
回答答案地址https://www.zhihu.com/question/26784045/answer/178802510
想法想法地址https://www.zhihu.com/pin/1013109294408986624
收藏夹(公开/私人)收藏夹地址http://www.zhihu.com/collection/19555617

使用教程

  1. 下载 Windows / Mac 客户端并安装运行(Windows 建议安装到非系统盘);

  2. 在内置浏览器中登录知乎;

  3. 添加任务类型并设置爬取参数;

  4. 程序自动开始爬取;

  5. 爬取完成后会自动打开文件夹。

Snipaste20200510134708png
Snipaste20200510134708png

Snipaste20200510141752png
Snipaste20200510141752png

爬取速度非常快,我这里测试的收藏夹一百多个回答,几分钟就爬取完了。而且作者为爬取的 html 文件加入了 css,阅读起来非常清爽,

Snipaste20200510142107png
Snipaste20200510142107png

下载地址

GitHub:https://github.com/YaoZeyuan/zhihuhelp/releases

百度网盘:https://pan.baidu.com/s/1qdVoGcJzHCVuRMXz5mHZgg // x9dv

稳部落

稳部落 是一款专业备份导出微博记录的工具,与上面的 知乎助手 是同一开发者(良心啊),同样支持 Windows / Mac 双端,可以将用户或自己的帖子下载成 html 和 pdf 文件,

使用教程

与知乎助手一样,先下载安装运行程序,登录微博,然后设置参数开始爬取,

Snipaste20200510144123png
Snipaste20200510144123png

Snipaste20200510144156png
Snipaste20200510144156png

爬取的时候为了防封,作者加入了20s延迟爬取的功能,所以速度相对来说有些慢,可以挂在后台慢慢等待,

Snipaste20200510144310png
Snipaste20200510144310png

下载地址

官网:https://www.yaozeyuan.online/stablog/

百度网盘:https://pan.baidu.com/s/1qdVoGcJzHCVuRMXz5mHZgg // x9dv

微信公众号文章搜索导出助手

这是一款爬取下载微信公众号文章的工具,与上面两款爬虫工具不同的是,这个是收费的,39.9才能解锁文章导出功能;以前我花过几百块买了一款爬取工具,配置麻烦,爬取较慢,这个工具就十分的不错,有需要的小伙伴可以上车,

使用教程

参照官网教程即可,需要微信电脑客户端

Snipaste20200511164942png
Snipaste20200511164942png

下载地址

官网:http://www.juyimv.cn/