whisper-fastapi
# whisper-fastapi ## 一句话解释 使用 FastAPI 封装 OpenAI Whisper(或同类语音识别模型)提供语音转文本(STT)服务接口。 ## 典型使用场景 - 音频转写(会议、访谈、客服录音) - 语音输入到文本的前置服务 - 与前端录音上传配套的
分享技术知识与实践经验
# whisper-fastapi ## 一句话解释 使用 FastAPI 封装 OpenAI Whisper(或同类语音识别模型)提供语音转文本(STT)服务接口。 ## 典型使用场景 - 音频转写(会议、访谈、客服录音) - 语音输入到文本的前置服务 - 与前端录音上传配套的
STT 最常见的含义是 **“语音转文本”** ,这是一个将人类语音转换为计算机可读文本的技术。 为了让你更全面地了解,下表整理了来自多个权威技术平台对 STT 的定义和侧重点: | 来源 | 核心解释与侧重点 | 补充说明 | | :--- | :--- | :--- | | **百度百科**
# Ollama ## 一句话解释 Ollama 是本地大模型运行与管理工具,支持通过简单命令下载、运行与调用模型。 ## 典型用途 - 本地运行 LLM 进行私有化推理 - 开发与测试对话、总结、工具调用等能力 - 与应用服务集成提供推理 API ## 常用命令 - 拉
**N-gram** 是指: > 文本中连续出现的 n 个单位(通常是词或字符)的序列,是自然语言处理(NLP)中的基础统计模型 一句话理解:**把句子拆成"连续的几个词"来分析,n=2 就是两个词一组,n=3 就是三个词一组** --- ## 📊 基本类型 | 类型
**【分类归属】** > **03.工程实现层 → 07-AI与智能化 → `LLM大语言模型.md`** --- ## 一、LLM 是什么(核心定义) **LLM(Large Language Model,大语言模型)** 是一类基于**深度神经网络(通常是 Transformer)*