GameMale
登陆 / 注册 搜索

USERCENTER

SEARCHSITE

搜索

查看: 1194|回复: 19
收起左侧

[问题求助] 批量将文件名(书名)导入各自TXT+去掉《作者有话要说:……》

[复制链接] |关注本帖

Futūrum(未来)诺克提斯·路西斯·伽拉姆人到中年里昂‧S‧甘乃迪皮尔斯‧尼凡斯普隆普特·阿金塔姆威尔卡斯克里斯·埃文斯安德森‧戴维斯

    50金币
    本帖最后由 wubingyonglei 于 2024-10-13 15:55 编辑

    首先希望请理解:毕竟在下有2000篇+纯爱小说待阅读+精修(虽然不知最后会留下多少篇)

    毕竟大部分是网络,没大佬进行精修
    第一难题:
    如何批量将文件名(书名)导入各自TXT(不是将所有书名导出到一个TXT)
    例子:
    外面看:

    但打开各自的TXT:
      《30→01分钟》金刀刀刀刀
      文案:
      《把金手指上交给国家》作者:桃小小(正确的书名)
    所以希望求一个软件能办到这样功能。毕竟2000+手动复制书名——再拷贝到TXT内部会麻木

    求的是批量/一键将各自书名导入各自TXT
    抱歉在下文笔不够高,再举更具体例子:
    以文件夹的
    《《30→01分钟》作者:金刀刀刀刀 (现代 温柔体贴攻X腼腆胆小受 受获得时停的超能力去撩攻 甜文 HE)》:

    TXT内部
    1(原版)
    一键将书名导入TXT里面
    2(导入)

    3(高级版)

    《遍地金刚》作者:青浼》
    TXT内部:
    1(原版)

    2(导入)

    3(高级版)




    第二难题:
    较少“作者有话要说”内容有价值
    但大部分“作者有话要说”内容跟正文大无关系:
    像:
      作者有话要说:开新文~今日三更,求捧场!┌(┘3└)┐
      2

      作者有话要说:晋江规定网页订阅可以多分作者一成,买一张同样的钱,但是网页给作者六成,APP和WAP只有五成,所以拜托大家尽可能网页订阅,跪谢(づ ̄3 ̄)づ╭?~
      今天继续更6000,看我能坚持到哪天(*/ω╲*)
      当然,作为一个勤劳的小千航,我觉得我能坚持到完结,大家觉得呢?
      感谢大家的地雷手榴弹和火箭筒,大家破费了,爱泥萌么么哒(づ ̄3 ̄)づ╭?~
      阿织扔了1个地雷投掷时间:2016-03-0222:44:20
      阿织扔了1个地雷投掷时间:2016-03-0222:55:05
      阿织扔了1个地雷投掷时间:2016-03-0222:55:05
      越家三岁美少年扔了1个地雷投掷时间:2016-03-0300:48:09

    所以求:txtFormat类型的正则去除或大佬神秘工具:
    一键将“作者有话要说:all 一切文字 ”去除而且避免误伤(不误删后面带有XX章)。

    先谢谢各位大佬






    附件: 您需要 登录 才可以下载或查看,没有账号?立即注册

    最佳答案

    查看完整内容

    只要确保所有的文都是这样同样的格式,批量处理可以的
    回复

    使用道具 举报

    无瑕的回忆镜中小鸟香蕉特饮40x43 隐形➀香喷喷的烤鸡月影狼

      只要确保所有的文都是这样同样的格式,批量处理可以的
        收起(6)
      • wubingyonglei wubingyonglei :同样的格式是指:《书名》作者:XX。部分TXT书名带有:《书名》作者:XX(ABC)
        2024-10-13 12:24 回复
      • user_login user_login :回复 wubingyonglei :素的,需要标题这样的格式,正文内的也像列举出来的这样。
        另外,“不误伤后面带有XX章”这个描述模糊,最好也是有文本举例或者传几篇例文出来。
        2024-10-13 14:12 回复
      • wubingyonglei wubingyonglei :回复 user_login :+w+嗷~4楼5楼几乎回答一半完美答案。接着等验证5楼python.exe。越来越感叹跟电脑代码接触的你们都是大佬级别。
        2024-10-13 14:48 回复
      • user_login user_login :回复 wubingyonglei :这种还算简单的啦,需要的话再召唤我详细讨论下要求。
        2024-10-13 17:43 回复
      • wubingyonglei wubingyonglei :回复 user_login :5楼的python脚本只能做出6本有效。召唤U佬。我在上面写了更具体的例文+发了文包给你作参考,期待你的大佬一键操作(一键导入文件名或一键替换)。谢谢
        2024-10-14 19:13 回复
      • user_login user_login :其实做起来还是有点难的。1取了文件名中的三个信息来清除原文开头的内容,然后插入文件名。2按行读取,预设了多种情况来匹配章节开始,辅以捕获的字数放过误判。 先后遇到的问题是文件的字符编码、单线程ui更新不及时、java导出后仍需要运行环境。一步一个脚坑过来可能学到了一点东西吧。
        2024-10-15 11:29 回复
      • 我也说一句

      回复

      使用道具 举报

      『户口本: Lv7+』十年一梦岛田源氏杰森‧斯坦森Forever Titanic虚空之海的鲸缘起星空美恐:新的开始雄躯的昇格『终点站:极地』

        回复

        使用道具 举报

        辐射:新维加斯龙腾世纪:审判达拉然最终幻想XVI瑞雪兆丰年,生灵万物新五彩斑斓的蛋暮色卵

          木浪 发表于 2024-10-13 12:22:44 | 显示全部楼层 |取消关注该作者的回复
          本帖最后由 木浪 于 2024-10-13 12:41 编辑

          问题一应该比较难实现,以前也找过,好像有软件可以用,但是需要1楼大佬说的要名称一致的对照文本,然后插入什么用的啥软件有点忘了;

          问题二:目前我知道的就是用楼主说的txtFormat,然后需要手动查找一个一个去掉
          1. 作者有话(.*)\n(.*)\n(.*)\n
          复制代码

          (.*)\n(.*)\n(.*)\n表示3
          (.*)\n(.*)\n(.*)\n(.*)\n(.*)\n(.*)\n就是6




          楼楼想偷懒的话也可以在章节前边添加很多行数,然后再用上边的一键去掉就行了
          1. \n第([0-9]{1,9})章   

          2. 替换

          3. \n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n第$1章
          复制代码
            收起(5)
          • wubingyonglei wubingyonglei :感觉有效答案接近四分之一+w+。毕竟部分txt的作者有话要说很多很多不稳定(不是全部1行)
            2024-10-13 12:33 回复
          • 木浪 木浪 :回复 wubingyonglei :2333,楼楼是去jj的文吗,那边作者好像都有写这种,没办法,要批量去掉的话你也可以在章节前边加很多很多行,然后再用上边的批量去掉,这样可以防止把后边的内容去掉,我贴一下增加章节前的行数正则
            2024-10-13 12:37 回复
          • wubingyonglei wubingyonglei :回复 木浪 :已接近二分之一。先是增加章节前的行数正则,再是一键去掉“作者有话要说”。最后用清除多余空格。
            虽说问题一有下楼大佬,但不会操作+W+,等看看如何解答。你跟楼下是对半的最佳答案。
            2024-10-13 13:00 回复
          • 木浪 木浪 :回复 wubingyonglei :23333
            2024-10-13 13:16 回复
          • wubingyonglei wubingyonglei :送了蛋糕给你。
            2024-10-15 09:39 回复
          • 我也说一句

          回复

          使用道具 举报

          近地夜航大黄蜂(ChevroletCamaro)霍格沃兹特快列车光子之海琉璃玉坠可疑的肉蛋御医神兔小丑与格雷与星光璀璨康纳‧沃什

            Heyeah 发表于 2024-10-13 12:28:19 | 显示全部楼层 |取消关注该作者的回复

            写了个python脚本 批量/一键将各自书名导入各自TXT

            没写第二个,需求有点模糊,只有开头判断,结尾不知道怎么结束

            本帖子中包含更多资源

            您需要 登录 才可以下载或查看,没有账号?立即注册

            x
              收起(4)
            • wubingyonglei wubingyonglei :大佬,你的办法很高级,我试着下载了:python。
              Python 3.11.5 (tags/v3.11.5:cce6ba9, Aug 24 2023, 14:38:34) [MSC v.1936 64 bit (AMD64)] on win32
              Type \"help\", \"copyright\", \"credits\" or \"license\" for more information.
              >>>
              完全没接触不知道如何激活脚本。还是要去付费买官方python?
              2024-10-13 12:56 回复
            • Heyeah Heyeah :回复 wubingyonglei :额有没有可能是python是免费的
              算了我打包成exe了
              https://wwuz.lanzouv.com/i1hHq2cfsspg
              密码:7okk
              2024-10-13 13:53 回复
            • wubingyonglei wubingyonglei :回复 Heyeah :呜呜呜,菜是我的大罪。运用exe。选择输入文件夹:科幻文、选择输出文件夹:科幻文1
              但黑框是:Exception in Tkinter callback
              Traceback (most recent call last):
                File \"tkinter\\__init__.py\", line 1921, in __call__
                File \"txt_set.py\", line 88, in process
                File \"txt_set.py\", line 57, in process_files
                File \"txt_set.py\", line 29, in recursive_process
                File \"txt_set.py\", line 41, in process_file
                File \"codecs.py\", line 322, in decode
              UnicodeDecodeError: \'utf-8\' codec can\'t decode byte 0xa1 in position 0: invalid start byte
              我发个一个文包发给你,里面有各自书名。
              2024-10-13 14:08 回复
            • wubingyonglei wubingyonglei :慢等佳息,如感觉行不通没关系,我再等等看大佬解答问题1
              2024-10-13 18:00 回复
            • 我也说一句

            回复

            使用道具 举报

            您需要登录后才可以回帖 登录 | 立即注册

            本版积分规则

            文字版|手机版|小黑屋|GameMale

            GMT+8, 2024-12-22 09:22 , Processed in 0.081789 second(s), 53 queries , Redis On.

            Copyright © 2013-2024 GameMale

            All Rights Reserved.

            快速回复 返回列表