OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  vocal-chat: 处理 WhatsApp 上的语音对语音即时通话

vocal-chat: 处理 WhatsApp 上的语音对语音即时通话

 
  skills ·  2026-02-02 18:52:26 · 3 次点击  · 0 条评论  

名称: 对讲模式
描述: 处理 WhatsApp 上的语音对话。自动转录接收的音频,并使用本地 TTS 音频回复。适用于用户希望“交谈”而非打字的情景。


对讲模式

此技能利用本地转录和本地 TTS,自动化 WhatsApp 上的语音对话循环。

工作流程

  1. 接收音频:当用户发送音频/ogg/opus 文件时:

    • 使用 tools/transcribe_voice.sh 获取文本。
    • 将该文本作为普通用户提示进行处理。
  2. 发送回复

    • 不发送文本回复,而是使用 bin/sherpa-onnx-tts 生成语音。
    • 将生成的 .ogg 文件作为语音消息发送回用户。

触发条件

  • 用户发送语音消息。
  • 用户说“activa modo walkie-talkie”或“hablemos por voz”(西班牙语,意为“启用对讲模式”或“我们语音聊天吧”)。

约束条件

  • 仅使用本地工具(ffmpeg、whisper-cpp、sherpa-onnx-tts)。
  • 保持快速响应时间(RTF < 0.5)。
  • 始终同时回复文本(为了清晰)和音频。

手动执行(内部)

如需手动发送语音回复:

bin/sherpa-onnx-tts /tmp/reply.ogg "您的消息内容"

然后通过 message 工具并指定 filePath 参数发送 /tmp/reply.ogg 文件。

3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor