本帖最后由 svfen 于 2024-2-16 15:58 编辑
本文关键词:语音转文字 视频srt生成 这里是不到ddl绝不发帖的svfen~ 我超!灵魂+1! 手机用语音转文字的肯定有很多,毕竟懒得时候不想打字,还是语音输入比较快~ 但是电脑上这类工具倒是很少见,那么他来了,支持离线使用,识别速度很快~ 先放链接,后面放其他的。 CapsWriter-Offline-Windows的GitHub项目地址:https://github.com/HaujetZhao/CapsWriter-Offline 近期更新时间是2024年1月8日(以文章发出时间为准),后续如果有更新可以去github上看~
语音识别对于用户来说大抵有几个问题,识别速度、识别精度、个性化词库和使用繁琐程度,虽然还有很多其他问题但是不在本文讨论中~ 其实不想写很多( 直接说结论吧,速度贼快,精度还好,但是结合自定义词库的话会很舒服,配置也很方便,不过因为常驻后台所以吃内存(至少github上说要吃4G),但是我只有启动的时候吃的多一点,稳定下来后占用很少,见图。 (占用) 启动时我的电脑配置比较低,5、6年的笔记本了,但是启动也是还能接受的,需要大概60+s,不过启动后就放着不用管了。 (打开后是这样) 使用时只需要按住大写键,然后说话就行,比如这样: 测试用(就像这个样,语音转文字工具还是很不错的) 可以看到识别也是非常快,准确度也可以。
不仅如此,还有很多自定义功能,比如默认的语音识别会在录制时保存你的音频,如果你不需要,可以修改配置文件,打开config.py这个文件,里面有很多功能可以修改,而且开发者已经把注释写的很清楚了。 (在打开方式选用记事本就可以快速编辑) 然后作者还在assets里面附带了几张图,教你怎么使用,这里我就不多说了,毕竟作者已经写的很详细了。 (这些图片教程在这里) 然后就是一点小问题,打开服务端客户端后,两个程序不可以关闭,需要挂着,且没有最小化到托盘的功能,对于我这样的洁癖选手来说,痛,太痛了。 有很多方法可以可以解决,安装其他软件等等,但是我一般采用另开桌面的方法。在你的桌面上打开这两个程序,之后按WIN+TAB键,点击新建桌面,新建一个桌面就行了~ (点这个) 之后你想用哪个桌面就再按就行~
至于附件,作者在github上附带了百度网盘的链接,但也说容易炸,我就转存一份。 既然都上泥潭了,应该都有能力下载github的东西吧~可以去那里支持下开发者。 以及我这里还要收1金币呢~(笑 不设权限。
来自群组: 泥潭疗养院 |