模型:

lengyue233/content-vec-best

数字对象标识符:

10.57967/hf/0479

其他:

hubert

许可:

mit
英文

Content Vec Best

Official Repo: ContentVec 该仓库将fairseq ContentVec模型引入HuggingFace Transformers。

How to use

要使用该模型,您需要定义

class HubertModelWithFinalProj(HubertModel):
    def __init__(self, config):
        super().__init__(config)

        # The final projection layer is only used for backward compatibility.
        # Following https://github.com/auspicious3000/contentvec/issues/6
        # Remove this layer is necessary to achieve the desired outcome.
        self.final_proj = nn.Linear(config.hidden_size, config.classifier_proj_size)

然后使用以下代码加载模型

model = HubertModelWithFinalProj.from_pretrained("lengyue233/content-vec-best")

x = model(audio)["last_hidden_state"]

How to convert

您需要从官方仓库下载ContentVec_legacy模型,然后运行以下代码

python convert.py