七宝猕猴桃 发表于 2024-3-31 08:59:13

请问有没有方法可以批量下载文字

本帖最后由 七宝猕猴桃 于 2024-3-31 09:35 编辑

在网站上的一些原创文章想要下载,但是复制粘贴的时候会复制上代码,有的小说篇章挺多的,不想一直复制粘贴,请问有相关的插件或方法可以批量下载呢


毛茸茸兽兽 发表于 2024-3-31 08:59:14

https://greasyfork.org/zh-CN/scripts/406070-小说下载器
https://greasyfork.org/zh-CN/scripts/25068-downloadallcontent
油猴里的相关插件,都试试咧(´×ω×`)
https://www.bilibili.com/read/cv18211804/
实在不行也只能用笨办法了欸

Umito 发表于 2024-3-31 09:43:48

复制之后。粘贴为纯文本?

不是卖萌的基佬 发表于 2024-3-31 09:47:13

下个篡改猴安装爬虫脚本(https://greasyfork.org/zh-CN/scripts?q=%E7%88%AC%E8%99%AB)

li漠北 发表于 2024-3-31 10:35:22

插件可以,参考麦基那个,比较基础

zhuovboyan 发表于 2024-3-31 11:21:00

QAQ 电脑小白一直用的笨办法来着 蹲下看看大佬方法

牙旋暗雾 发表于 2024-3-31 11:54:02

把网页保存成htm文件,用文本管理器打开,搜索span替换成title,搜索font替换成title,然后直接打开网页复制即可。此方法有一种缺点就是文档标题会和谐掉,需要自己手动复制回来才行。

cinder 发表于 2024-3-31 11:55:26

我只知道抓下來用編輯器清代碼的笨方法XD

神威的老公 发表于 2024-3-31 13:07:35

偷偷插个眼,我也想知道解决办法{:4_101:}

无聊的人 发表于 2024-3-31 14:22:13

我也想要这样的插件,看了下前几位的回答,好像主要适用于正规的小说网站。不过有时候自己喜欢的原创小说都是在隔壁论坛更新,主要是插件能爬取论坛帖子楼主的发言就好了。(而且还要附加屏蔽论坛干扰码)

黑达克 发表于 2024-3-31 14:42:18

去除乱码的方法倒是有坛友分享过:https://www.gamemale.com/thread-120529-1-1.html

夏漏光微 发表于 2024-3-31 15:39:04

要学习一下爬虫
以前想做的时候,查到了不少python 做这个的例子

轮回2L 发表于 2024-3-31 16:56:17

我是记得脚本可以处理来着,可以先试试楼上大佬的链接{:6_200:}

wdhgzdhcxb 发表于 2024-3-31 17:40:23

如果只是要求把文本内容记录下来,那楼上的脚本基本够用了。
我也用过,但是它有很多进阶版,没点基础知识真的搞不来,直接下下来的格式又不符合我的要求,校对花的时间可能还更多,最后还是老老实实手动复制了{:4_100:}

thh866 发表于 2024-4-1 01:39:59

基本都是爬虫吧,但是写匹配规则过滤啥的有点麻烦

chouki 发表于 2024-4-17 18:49:56

大佬们都推荐了很多实用的爬文字脚本,果断收藏了{:6_200:}
页: [1]
查看完整版本: 请问有没有方法可以批量下载文字