Notice: In order to resolve issues more efficiently, please raise issue following the

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

Websocket 服务中针对不同音频识别结果差异巨大 about funasr HOT 4 OPEN

WeiminLee commented on September 15, 2024

Websocket 服务中针对不同音频识别结果差异巨大

from funasr.

Comments (4)

WeiminLee commented on September 15, 2024

The result for the SSB dataset is unacceptable. I do not change any configuration. Does anyone know the reason? THKS

from funasr.

Akmend commented on September 15, 2024

请问您这个流式返回是怎么实现的，求解。

from funasr.

WeiminLee commented on September 15, 2024

@Akmend Use the code examples showed on thsi project. Keep in mind that the input wav file must be 16K sampling rate

`
import os
import soundfile
from funasr import AutoModel

model_path = r"data/model_hub/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online"
wav_path = r'/home/workspace/lwm/AwesomeCode/FunASR/SSB00050001.wav'

chunk_size = [0, 10, 5] # [0, 10, 5] 600ms, [0, 8, 4] 480ms
encoder_chunk_look_back = 4 # number of chunks to lookback for encoder self-attention
decoder_chunk_look_back = 1 # number of encoder chunks to lookback for decoder cross-attention

model = AutoModel(model=model_path)

wav_file = os.path.join(model.model_path, wav_path)
speech, sample_rate = soundfile.read(wav_file)
chunk_stride = chunk_size[1] * 960 # 600ms

cache = {}
total_chunk_num = int(len((speech) - 1) / chunk_stride + 1)
for i in range(total_chunk_num):
speech_chunk = speech[i * chunk_stride:(i + 1) * chunk_stride]
is_final = i == total_chunk_num - 1
res = model.generate(input=speech_chunk,
cache=cache,
is_final=is_final,
chunk_size=chunk_size,
encoder_chunk_look_back=encoder_chunk_look_back,
decoder_chunk_look_back=decoder_chunk_look_back)
print(res)
`

from funasr.

LauraGPT commented on September 15, 2024

Show me the srv code.

from funasr.

Websocket 服务中针对不同音频识别结果差异巨大 about funasr HOT 4 OPEN

Comments (4)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent