OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  azure-ai-transcription-py:用于 Python 的 Azure AI 转录 SDK

azure-ai-transcription-py:用于 Python 的 Azure AI 转录 SDK

 
  dock ·  2026-02-14 22:03:15 · 3 次点击  · 0 条评论  

名称: azure-ai-transcription-py
描述: |
Azure AI 转录 Python SDK。支持带时间戳和说话人分离的实时与批量语音转文字转录。
触发词:"transcription", "speech to text", "Azure AI Transcription", "TranscriptionClient"。
package: azure-ai-transcription


Azure AI 转录 Python SDK

用于 Azure AI 转录(语音转文字)的客户端库,支持实时和批量转录。

安装

pip install azure-ai-transcription

环境变量

TRANSCRIPTION_ENDPOINT=https://<resource>.cognitiveservices.azure.com
TRANSCRIPTION_KEY=<your-key>

身份验证

使用订阅密钥进行身份验证(此客户端不支持 DefaultAzureCredential):

import os
from azure.ai.transcription import TranscriptionClient

client = TranscriptionClient(
    endpoint=os.environ["TRANSCRIPTION_ENDPOINT"],
    credential=os.environ["TRANSCRIPTION_KEY"]
)

批量转录

job = client.begin_transcription(
    name="meeting-transcription",
    locale="en-US",
    content_urls=["https://<storage>/audio.wav"],
    diarization_enabled=True
)
result = job.result()
print(result.status)

实时转录

stream = client.begin_stream_transcription(locale="en-US")
stream.send_audio_file("audio.wav")
for event in stream:
    print(event.text)

最佳实践

  1. 启用说话人分离:当音频中存在多位说话人时使用。
  2. 使用批量转录:适用于存储在 Blob 存储中的长音频文件。
  3. 捕获时间戳:便于生成字幕。
  4. 指定语言:以提高识别准确率。
  5. 处理流控:在实时转录中管理数据流压力。
  6. 关闭转录会话:完成后及时释放资源。
3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor