系统:PC
日期:2025-11-11
类别:翻译工具
版本:v2.1.0
CapsWriter是一款免费、开源的语音输入工具,无限时长、低延迟、高准确率、中英混输、自动阿拉伯数字、自动调整中英间隔。其具体作用是:当你长按键盘上的大写锁定键后,软件会开始语音识别,当你松开大写锁定键时,识别的结果就可以立马上屏,对于聊天时候进行快捷输入、写代码时快速加入中文注释非常的方便。需要的用户欢迎下载使用!
1、利用"大写键"来启动语音输入
2、用户能够自定义使用自己所需要的API
3、开源并且没有广告
1、热词功能
可以在 hot-en.txthot-zh.txt hot-rule.txt 中添加三种热词,客户端动态识别载入。
2、日记功能
默认每次录音识别后,识别结果记录在 年份/月份/日期.md ,录音文件保存在 年份/月份/assets。
3、关键词日记
识别结果若以关键词开头,会被记录在 年份/月份/关键词-日期.md,关键词在 keywords.txt 中定义。
4、转录功能
将音视频文件拖动到客户端打开,即可转录生成 srt 字幕、txt文本等等。
小白下载的 Release 其实是用 pyinstaller 导出的 exe 文件,如果你需要在源码基础上使用,就需要安装以下模块:
● keyboard (用于监听键盘输入)
● pyaudio (用于接收录音)
● PySide2 (图形界面框架)
● aliyun-python-sdk-core (阿里云 sdk)
● alibabacloud-nls-java-sdk (阿里云智能语音引擎 sdk)
其中:
● pyaudio 在 windows 上不是太好安装,可以先到 这个链接 下载 pyaudio 对应版本的 whl 文件,再用 pip 安装,Mac 和 Linux 上需要先安装 port audio,才能安装上 pyaudio
● alibabacloud-nls-java-sdk 是指阿里云官方 java sdk 的 python 实现,它不是通过 pip 安装的(官方没有上传到 pypi ),而是通过 阿里云官方文档的方法 进行安装。
● 其它模块使用 pip 安装即可
● 本文件夹内有一个 安装指南 文件夹,在里面可以找到详细的安装指南,还包括了提前下载的 alibabacloud-nls-python-sdk 和 pyaudio 的 whl 文件。
● 在主页面选择一个引擎,点击启用按钮,就可以进行语音识别了!
● 启用后,在实际使用中,只要按下 CapsLock 键,软件就会立刻开始录音
1、使用语音识别时:
● 如果只是单击 CapsLock 后松开,录音数据会立刻被删除;
● 如果按下 CapsLock 键时长超过 0.3 秒,就会开始连网进行语音识别,松开 CapsLock 键时,语音识别结果会被立刻输入。
2、因 Caps Writer 2.0 内置了对阿里云一句话识别 API 的支持。如果你要使用,就需要先在阿里云上实名认证,申请语音识别 API,在设置页面添加一个语音识别引擎。如果不会可以点击帮助按钮进行观看。
3、阿里云注册后可免费试用 3 个月,之后需要付费使用。
热门推荐
评分及评论
点击星星用来评分