nb-whisper-large-beta - 挪威国家图书馆开发的多语言语音识别模型NB-Whisper

NB-Whisper Large (beta)：挪威语音识别的新突破

NB-Whisper Large (beta)是由挪威国家图书馆发布的一个用于自动语音识别(ASR)和语音翻译的模型。这个模型是基于OpenAI的Whisper模型进行开发的，旨在为挪威语提供高质量的语音识别服务。

模型概述

NB-Whisper系列模型共有五种不同规模：

tiny (3900万参数)
base (7400万参数)
small (2.44亿参数)
medium (7.69亿参数)
large (15.5亿参数)

这些模型都经过了20,000小时的标记数据训练，能够处理挪威语(包括书面挪威语和新挪威语)和英语。值得注意的是，目前发布的是公开测试版，正式版计划于2023年秋季发布。

模型特点

多语言支持：除了挪威语，该模型还支持英语识别。
灵活应用：可用于语音识别和语音翻译任务。
开源可用：模型采用Creative Commons Attribution 4.0 International (CC BY 4.0)许可证，可供第三方使用。
性能优越：在挪威语识别方面，该模型相较于同等规模的其他挪威语ASR模型，能够提供最先进的结果。

使用方法

使用NB-Whisper Large (beta)模型非常简单。以下是一个基本的Python代码示例：

from transformers import pipeline

asr = pipeline(
    "automatic-speech-recognition",
    "NbAiLab/nb-whisper-large-beta"
)
result = asr(
    "audio.mp3",
    generate_kwargs={'task': 'transcribe', 'language': 'no'}
)
print(result['text'])

此外，用户还可以通过设置参数来获取时间戳信息。