t2t:基于MCP的助手的OpenAI TTS桥接
t2t,由Acoyfellow开发,是一个MCP服务器,将文本响应转换为AI助手的语音音频。它将文本路由到OpenAI的神经文本转语音API,检索合成的音频,并暴露一个可调用的'generate_speech'工具,供MCP主机实时使用。该工具支持六种官方声音、多种音频容器和可调播放速度。旨在为开发者和高级用户添加语音输出到MCP工作流程,配置最小。
查看广告以免费下载
Softonic 评论
t2t,由Acoyfellow开发,是一个MCP服务器,将文本响应转换为AI助手的语音音频。它将文本路由到OpenAI的神经文本转语音API,检索合成的音频,并暴露一个可调用的'generate_speech'工具,供MCP主机实时使用。该工具支持六种官方声音、多种音频容器和可调播放速度。旨在为开发者和高级用户添加语音输出到MCP工作流程,配置最小。
t2t 作为语言模型与音频播放之间的桥梁,让兼容 MCP 的助手按需生成语音响应。它作为基于 Node.js 的服务器运行,并与 Claude Desktop 等 MCP 主机集成,因此主要工作是将模型文本转换为在对话会话中可立即播放的音频。对于开发者来说,这意味着在助手工作流中添加可听反馈,而无需重写主机应用程序。
该服务器使用 OpenAI 的神经文本转语音模型生成 高保真 音频,并提供语音和速度控制。支持的语音配置文件包括 alloy、echo、fable、onyx、nova 和 shimmer。格式和容器选项提高了与播放管道的兼容性,例如:
速度可以设置在 0.25x 到 4.0x 之间,允许根据不同的用户体验需求进行更快或更慢的传递。
安装需要 Node.js(v18 或更高版本)和一个兼容 MCP 的客户端;必须通过环境变量提供 OpenAI API 密钥以供操作。该项目强调通过标准 MCP 文件和环境设置进行简单配置。由于它将文本发送到外部 TTS API,用户应计划在其部署环境中处理网络依赖和 API 凭据管理。
该工具暴露了一个 generate_speech MCP 工具,模型可以动态调用,这降低了对 MCP 熟悉的团队的集成摩擦。其简约设计专注于单一实用功能,而不是完整的编辑器,项目报告在 MCP 会话中优化了低延迟合成。这样的组合使其适合作为更大助手堆栈中的紧凑组件,而不是独立的生产音频工作站。
t2t 是一个实用的选择,适合需要从文本响应到可听输出的紧凑、低维护桥梁的 MCP 开发者。该实现更适合集成到多组件助手系统中,而不是最终用户音频制作。在部署卫生的过程中,定期验证合成响应并管理 API 凭据。使用短的验证运行来确认代表性提示中的声音和时机,然后再进行广泛推广。
免费
v0.3.4
MCP
英语
查看广告以免费下载
您是否尝试过 t2t?成为第一个离开您的意见!
添加评论