GameMale
登陆 / 注册 搜索

USERCENTER

SEARCHSITE

搜索

查看: 924|回复: 19
收起左侧

[问题求助] 批量将文件名(书名)导入各自TXT+去掉《作者有话要说:……》

[复制链接] |关注本帖

遗忘之水『逆境中的幸运女神』幸运女神的微笑变骚喷雾安德森‧戴维斯萨赫的蛋糕威尔卡斯诺克提斯·路西斯·伽拉姆里昂‧S‧甘乃迪

    50金币
    本帖最后由 wubingyonglei 于 2024-10-13 15:55 编辑

    首先希望请理解:毕竟在下有2000篇+纯爱小说待阅读+精修(虽然不知最后会留下多少篇)

    毕竟大部分是网络,没大佬进行精修
    第一难题:
    如何批量将文件名(书名)导入各自TXT(不是将所有书名导出到一个TXT)
    例子:
    外面看:

    但打开各自的TXT:
      《30→01分钟》金刀刀刀刀
      文案:
      《把金手指上交给国家》作者:桃小小(正确的书名)
    所以希望求一个软件能办到这样功能。毕竟2000+手动复制书名——再拷贝到TXT内部会麻木

    求的是批量/一键将各自书名导入各自TXT
    抱歉在下文笔不够高,再举更具体例子:
    以文件夹的
    《《30→01分钟》作者:金刀刀刀刀 (现代 温柔体贴攻X腼腆胆小受 受获得时停的超能力去撩攻 甜文 HE)》:

    TXT内部
    1(原版)
    一键将书名导入TXT里面
    2(导入)

    3(高级版)

    《遍地金刚》作者:青浼》
    TXT内部:
    1(原版)

    2(导入)

    3(高级版)




    第二难题:
    较少“作者有话要说”内容有价值
    但大部分“作者有话要说”内容跟正文大无关系:
    像:
      作者有话要说:开新文~今日三更,求捧场!┌(┘3└)┐
      2

      作者有话要说:晋江规定网页订阅可以多分作者一成,买一张同样的钱,但是网页给作者六成,APP和WAP只有五成,所以拜托大家尽可能网页订阅,跪谢(づ ̄3 ̄)づ╭?~
      今天继续更6000,看我能坚持到哪天(*/ω╲*)
      当然,作为一个勤劳的小千航,我觉得我能坚持到完结,大家觉得呢?
      感谢大家的地雷手榴弹和火箭筒,大家破费了,爱泥萌么么哒(づ ̄3 ̄)づ╭?~
      阿织扔了1个地雷投掷时间:2016-03-0222:44:20
      阿织扔了1个地雷投掷时间:2016-03-0222:55:05
      阿织扔了1个地雷投掷时间:2016-03-0222:55:05
      越家三岁美少年扔了1个地雷投掷时间:2016-03-0300:48:09

    所以求:txtFormat类型的正则去除或大佬神秘工具:
    一键将“作者有话要说:all 一切文字 ”去除而且避免误伤(不误删后面带有XX章)。

    先谢谢各位大佬






    附件: 您需要 登录 才可以下载或查看,没有账号?立即注册

    最佳答案

    查看完整内容

    只要确保所有的文都是这样同样的格式,批量处理可以的
    回复

    使用道具 举报

    收到情书没有梦想的咸鱼灵光补脑剂镜中小鸟香蕉特饮40x43 隐形➀香喷喷的烤鸡月影狼

      只要确保所有的文都是这样同样的格式,批量处理可以的
        收起(6)
      • wubingyonglei wubingyonglei :同样的格式是指:《书名》作者:XX。部分TXT书名带有:《书名》作者:XX(ABC)
        2024-10-13 12:24 回复
      • user_login user_login :回复 wubingyonglei :素的,需要标题这样的格式,正文内的也像列举出来的这样。
        另外,“不误伤后面带有XX章”这个描述模糊,最好也是有文本举例或者传几篇例文出来。
        2024-10-13 14:12 回复
      • wubingyonglei wubingyonglei :回复 user_login :+w+嗷~4楼5楼几乎回答一半完美答案。接着等验证5楼python.exe。越来越感叹跟电脑代码接触的你们都是大佬级别。
        2024-10-13 14:48 回复
      • user_login user_login :回复 wubingyonglei :这种还算简单的啦,需要的话再召唤我详细讨论下要求。
        2024-10-13 17:43 回复
      • wubingyonglei wubingyonglei :回复 user_login :5楼的python脚本只能做出6本有效。召唤U佬。我在上面写了更具体的例文+发了文包给你作参考,期待你的大佬一键操作(一键导入文件名或一键替换)。谢谢
        2024-10-14 19:13 回复
      • user_login user_login :其实做起来还是有点难的。1取了文件名中的三个信息来清除原文开头的内容,然后插入文件名。2按行读取,预设了多种情况来匹配章节开始,辅以捕获的字数放过误判。 先后遇到的问题是文件的字符编码、单线程ui更新不及时、java导出后仍需要运行环境。一步一个脚坑过来可能学到了一点东西吧。
        2024-10-15 11:29 回复
      • 我也说一句

      回复

      使用道具 举报

      达拉然十年一梦岛田源氏Forever Titanic虚空之海的鲸缘起星空美恐:新的开始雄躯的昇格『终点站:极地』

        回复

        使用道具 举报

        千杯不醉变骚喷雾咆哮诅咒萨赫的蛋糕雷霆晶球『正在入住GM村』迷你蔓生灵树

          本帖最后由 木浪 于 2024-10-13 12:41 编辑

          问题一应该比较难实现,以前也找过,好像有软件可以用,但是需要1楼大佬说的要名称一致的对照文本,然后插入什么用的啥软件有点忘了;

          问题二:目前我知道的就是用楼主说的txtFormat,然后需要手动查找一个一个去掉
          1. 作者有话(.*)\n(.*)\n(.*)\n
          复制代码

          (.*)\n(.*)\n(.*)\n表示3
          (.*)\n(.*)\n(.*)\n(.*)\n(.*)\n(.*)\n就是6




          楼楼想偷懒的话也可以在章节前边添加很多行数,然后再用上边的一键去掉就行了
          1. \n第([0-9]{1,9})章   

          2. 替换

          3. \n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n第$1章
          复制代码
            收起(5)
          • wubingyonglei wubingyonglei :感觉有效答案接近四分之一+w+。毕竟部分txt的作者有话要说很多很多不稳定(不是全部1行)
            2024-10-13 12:33 回复
          • 木浪 木浪 :回复 wubingyonglei :2333,楼楼是去jj的文吗,那边作者好像都有写这种,没办法,要批量去掉的话你也可以在章节前边加很多很多行,然后再用上边的批量去掉,这样可以防止把后边的内容去掉,我贴一下增加章节前的行数正则
            2024-10-13 12:37 回复
          • wubingyonglei wubingyonglei :回复 木浪 :已接近二分之一。先是增加章节前的行数正则,再是一键去掉“作者有话要说”。最后用清除多余空格。
            虽说问题一有下楼大佬,但不会操作+W+,等看看如何解答。你跟楼下是对半的最佳答案。
            2024-10-13 13:00 回复
          • 木浪 木浪 :回复 wubingyonglei :23333
            2024-10-13 13:16 回复
          • wubingyonglei wubingyonglei :送了蛋糕给你。
            2024-10-15 09:39 回复
          • 我也说一句

          回复

          使用道具 举报

          琉璃玉坠大黄蜂(ChevroletCamaro)可疑的肉蛋霍格沃兹特快列车御医神兔『住在GM村』灵光补脑剂没有梦想的咸鱼


            写了个python脚本 批量/一键将各自书名导入各自TXT

            没写第二个,需求有点模糊,只有开头判断,结尾不知道怎么结束

            本帖子中包含更多资源

            您需要 登录 才可以下载或查看,没有账号?立即注册

            x
              收起(4)
            • wubingyonglei wubingyonglei :大佬,你的办法很高级,我试着下载了:python。
              Python 3.11.5 (tags/v3.11.5:cce6ba9, Aug 24 2023, 14:38:34) [MSC v.1936 64 bit (AMD64)] on win32
              Type \"help\", \"copyright\", \"credits\" or \"license\" for more information.
              >>>
              完全没接触不知道如何激活脚本。还是要去付费买官方python?
              2024-10-13 12:56 回复
            • Heyeah Heyeah :回复 wubingyonglei :额有没有可能是python是免费的
              算了我打包成exe了
              https://wwuz.lanzouv.com/i1hHq2cfsspg
              密码:7okk
              2024-10-13 13:53 回复
            • wubingyonglei wubingyonglei :回复 Heyeah :呜呜呜,菜是我的大罪。运用exe。选择输入文件夹:科幻文、选择输出文件夹:科幻文1
              但黑框是:Exception in Tkinter callback
              Traceback (most recent call last):
                File \"tkinter\\__init__.py\", line 1921, in __call__
                File \"txt_set.py\", line 88, in process
                File \"txt_set.py\", line 57, in process_files
                File \"txt_set.py\", line 29, in recursive_process
                File \"txt_set.py\", line 41, in process_file
                File \"codecs.py\", line 322, in decode
              UnicodeDecodeError: \'utf-8\' codec can\'t decode byte 0xa1 in position 0: invalid start byte
              我发个一个文包发给你,里面有各自书名。
              2024-10-13 14:08 回复
            • wubingyonglei wubingyonglei :慢等佳息,如感觉行不通没关系,我再等等看大佬解答问题1
              2024-10-13 18:00 回复
            • 我也说一句

            回复

            使用道具 举报

            您需要登录后才可以回帖 登录 | 立即注册

            本版积分规则

            文字版|手机版|小黑屋|GameMale

            GMT+8, 2024-10-16 16:54 , Processed in 0.071704 second(s), 52 queries , Redis On.

            Copyright © 2013-2024 GameMale

            All Rights Reserved.

            快速回复 返回列表