咨询热线
HASHKFK
pg电子游戏,pg电子接口,pg电子官网,pg电子试玩,pg电子app,pg电子介绍,pg电子外挂,pg游戏,pg电子游戏平台,pg游戏官网,PG电子,麻将胡了,PG电子试玩,PG模拟器,PG麻将胡了,pg电子平台,百家乐,龙虎,捕鱼,电子捕鱼,麻将胡了2,电子游戏
此外,MusiCoT 可以自然地为 AR 模型提供音乐参考功能,将输入的可变长度的音乐音频作为可选风格参考。一方面可以将参考歌曲变成 CLAP 中的音频嵌入,然后直接提取来替代要推理的思维链过程,这样跳过中间推理直接过渡到音频生成;另一方面引入残差矢量量化(RVQ)对音频向量信息进行量化处理,让音频信息更模糊,从而更容易规避直接抄袭的风险。最后,MusiCoT 相较于其他 CoT 方法实现了可扩展性并且可以不依赖人工标记的数据。
在实际训练中,语义 LM 将展平 CLAP RVQ token 作为了额外的预测目标,如下图所示。与典型的 CoT 训练类似,这些预测的 token 采用了与音频 token 相同的处理方式,即用来计算交叉熵损失。唯一的区别是添加了两个新的特殊 token(cot_bos 和 cot_eos),以预测何时从生成 MusiCoT token 转换为音频 token。