CapsWriter语音输入工具

CapsWriter语音输入工具

官方

系统:PC

日期:2025-11-11

类别:翻译工具

版本:v2.1.0

  • 详情
  • 相关
  • 评论

CapsWriter是一款免费、开源的语音输入工具,无限时长、低延迟、高准确率、中英混输、自动阿拉伯数字、自动调整中英间隔。其具体作用是:当你长按键盘上的大写锁定键后,软件会开始语音识别,当你松开大写锁定键时,识别的结果就可以立马上屏,对于聊天时候进行快捷输入、写代码时快速加入中文注释非常的方便。需要的用户欢迎下载使用!

Caps Writer

软件特色

1、利用"大写键"来启动语音输入

2、用户能够自定义使用自己所需要的API

3、开源并且没有广告

软件功能

1、热词功能

可以在 hot-en.txthot-zh.txt hot-rule.txt 中添加三种热词,客户端动态识别载入。

2、日记功能

默认每次录音识别后,识别结果记录在 年份/月份/日期.md ,录音文件保存在 年份/月份/assets。

3、关键词日记

识别结果若以关键词开头,会被记录在 年份/月份/关键词-日期.md,关键词在 keywords.txt 中定义。

4、转录功能

将音视频文件拖动到客户端打开,即可转录生成 srt 字幕、txt文本等等。

源代码使用

小白下载的 Release 其实是用 pyinstaller 导出的 exe 文件,如果你需要在源码基础上使用,就需要安装以下模块:

● keyboard (用于监听键盘输入)

● pyaudio (用于接收录音)

● PySide2 (图形界面框架)

● aliyun-python-sdk-core (阿里云 sdk)

● alibabacloud-nls-java-sdk (阿里云智能语音引擎 sdk)

其中:

● pyaudio 在 windows 上不是太好安装,可以先到 这个链接 下载 pyaudio 对应版本的 whl 文件,再用 pip 安装,Mac 和 Linux 上需要先安装 port audio,才能安装上 pyaudio

● alibabacloud-nls-java-sdk 是指阿里云官方 java sdk 的 python 实现,它不是通过 pip 安装的(官方没有上传到 pypi ),而是通过 阿里云官方文档的方法 进行安装。

● 其它模块使用 pip 安装即可

● 本文件夹内有一个 安装指南 文件夹,在里面可以找到详细的安装指南,还包括了提前下载的 alibabacloud-nls-python-sdk 和 pyaudio 的 whl 文件。

注意事项

● 在主页面选择一个引擎,点击启用按钮,就可以进行语音识别了!

● 启用后,在实际使用中,只要按下 CapsLock 键,软件就会立刻开始录音

1、使用语音识别时:

● 如果只是单击 CapsLock 后松开,录音数据会立刻被删除;

● 如果按下 CapsLock 键时长超过 0.3 秒,就会开始连网进行语音识别,松开 CapsLock 键时,语音识别结果会被立刻输入。

2、因 Caps Writer 2.0 内置了对阿里云一句话识别 API 的支持。如果你要使用,就需要先在阿里云上实名认证,申请语音识别 API,在设置页面添加一个语音识别引擎。如果不会可以点击帮助按钮进行观看。

3、阿里云注册后可免费试用 3 个月,之后需要付费使用。

展开内容

评分及评论

4.5满分5.0分

点击星星用来评分

评论需审核后才能显示
同类排行