请问有没有方法可以批量下载文字
本帖最后由 七宝猕猴桃 于 2024-3-31 09:35 编辑在网站上的一些原创文章想要下载,但是复制粘贴的时候会复制上代码,有的小说篇章挺多的,不想一直复制粘贴,请问有相关的插件或方法可以批量下载呢
https://greasyfork.org/zh-CN/scripts/406070-小说下载器
https://greasyfork.org/zh-CN/scripts/25068-downloadallcontent
油猴里的相关插件,都试试咧(´×ω×`)
https://www.bilibili.com/read/cv18211804/
实在不行也只能用笨办法了欸 复制之后。粘贴为纯文本? 下个篡改猴安装爬虫脚本(https://greasyfork.org/zh-CN/scripts?q=%E7%88%AC%E8%99%AB) 插件可以,参考麦基那个,比较基础 QAQ 电脑小白一直用的笨办法来着 蹲下看看大佬方法 把网页保存成htm文件,用文本管理器打开,搜索span替换成title,搜索font替换成title,然后直接打开网页复制即可。此方法有一种缺点就是文档标题会和谐掉,需要自己手动复制回来才行。 我只知道抓下來用編輯器清代碼的笨方法XD 偷偷插个眼,我也想知道解决办法{:4_101:} 我也想要这样的插件,看了下前几位的回答,好像主要适用于正规的小说网站。不过有时候自己喜欢的原创小说都是在隔壁论坛更新,主要是插件能爬取论坛帖子楼主的发言就好了。(而且还要附加屏蔽论坛干扰码) 去除乱码的方法倒是有坛友分享过:https://www.gamemale.com/thread-120529-1-1.html 要学习一下爬虫
以前想做的时候,查到了不少python 做这个的例子 我是记得脚本可以处理来着,可以先试试楼上大佬的链接{:6_200:} 如果只是要求把文本内容记录下来,那楼上的脚本基本够用了。
我也用过,但是它有很多进阶版,没点基础知识真的搞不来,直接下下来的格式又不符合我的要求,校对花的时间可能还更多,最后还是老老实实手动复制了{:4_100:} 基本都是爬虫吧,但是写匹配规则过滤啥的有点麻烦 大佬们都推荐了很多实用的爬文字脚本,果断收藏了{:6_200:}
页:
[1]