0°
资源分享

涨姿势:汤不热抓取工具(附小白使用指南)

1024转载来的技术文,独乐乐不如众乐乐,把这个工具介绍给大家,可以试用一下。

不能附链接,请手动复制并访问以下网址
Github项目地址:  github.com/seanhuai/tumblr-source-list
技术文档地址:  www.ruye.org.cn/2017/08/tumblr-source-list

有操作能力的用户,参考以下指南图片自行操作
没有经验的,参考本文后附面向小白的使用指南





面向小白的使用指南:
注意:以下说明需要建立在已翻墙的基础上,你需要知晓你的代理软件的工作端口。

准备工作:
1. 百度 ‘git’ ,进入 git-scm.com 下载客户端。百度 ‘python’  下载 3.0 版以上客户端。(Windows 用户下载 Windows 版本即可)
2. 安装 git 客户端,安装完成后,开始菜单中选择 git 文件夹,启动 git-bash。
3. 执行命令 cd /d (此处的 d 意为你设定的下载位置,/d 即指设定为 D盘,/d/abc  即指设定为 D盘下abc文件夹,其余同理 ),执行完成后,输入命令 git clone https://github.com/seanhuai/tumblr-source-list 下载本工具代码
4. 执行命令 cd tumblr-source-list 进入本工具文件夹
(可选:修改 packages 文件夹下 _profiles.py 文件中 port 属性值为你的代理软件的工作端口)

操作指南:
1. 基本命令: python app.py (模式) (值)
2. 模式:当前支持 username / posturl 两个模式
3. 用户模式:获取指定用户的图片或视频资源,该模式下值按 ‘python app.py username 用户名 资源类型 获取内容页数’ 输入,媒体类型仅支持 photo / video 两种类型。
举个栗子:
获取 u44002 用户的 3页 图片,输入  python app.py  username  u44002 photo 3 回车即可。
获取 u44002 用户的 6页 视频,输入  python app.py  username  u44002 video 6  回车即可。
4. 链接模式:获取指定 tumblr链接 包含的内容,该模式下值按 ‘python app.py posturl 链接’ 输入。
举个栗子:
获取 https://wsyghf.tumblr.com/post/150478441406 这个页面的内容,输入 python app.py posturl https://wsyghf.tumblr.com/post/150478441406 回车即可。

常见问题:
1. 提示 ‘你正在获取的内容不宜于未成年人……’  等内容:
如果你获取的是敏感内容(不适宜于未成年人的内容)时,会有此提示,如输入 Y 后回车将继续执行,输入其他内容将中断执行。
2. 不提示 ‘你正在获取的内容不宜于未成年人……’  等内容,但有乱码提示:
可能是字符集设置问题,不影响操作,可参考上一条处理。

资源分享
资源分享
0 条回复 A 作者 M 管理员
    当上帝赐给你荒野时,就意味着,他要你成为高飞的鹰
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论