whisper深入-语者分离

您淘淘网 2023-12-28 15:34:03 ©著作权

文章标签 根目录 git 文章分类 Html/CSS 热度指数 0

©著作权归作者所有：来自知识热度网作者您淘淘网的原创作品，请联系作者获取转载授权，否则将追究法律责任

文章目录

学习目标：如何使用whisper
学习内容一：whisper 转文字

1.1 使用whisper.load_model()方法下载，加载
1.2 使用实例对文件进行转录
1.3 实战

学习内容二：语者分离（pyannote.audio）pyannote.audio是huggingface开源音色包

第一步：安装依赖
第二步：创建key
第三步：测试pyannote.audio

学习内容三：整合

学习目标：如何使用whisper

学习内容一：whisper 转文字

1.3 实战

建议load_model添加参数

download_root:下载的根目录，默认使用~/.cache/whisper transcribe方法添加参数
word_timestamps=True

import whisper
import arrow

# 定义模型、音频地址、录音开始时间
def excute(model_name,file_path,start_time):
    model = whisper.load_model(model_name)
    result = model.transcribe(file_path,word_timestamps=True)
    for segment in result["segments"]:
        now = arrow.get(start_time)
        start = now.shift(seconds=segment["start"]).format("YYYY-MM-DD HH:mm:ss")
        end = now.shift(seconds=segment["end"]).format("YYYY-MM-DD HH:mm:ss")
        print("【"+start+"->" +end+"】："+segment["text"])

if __name__ == '__main__':
    excute("large","/root/autodl-tmp/no/test.mp3","2022-10-24 16:23:00")

`学习内容三：整合`

这里要借助一个开源代码，用于整合以上两种产生的结果

报错No module named 'pyannote_whisper' 如果你使用使用AutoDL平台，你可以使用学术代理加速

source /etc/network_turbo

git clone https://github.com/yinruiqing/pyannote-whisper.git
cd pyannote-whisper
pip install -r requirements.txt

import os
import whisper
from pyannote.audio import Pipeline
from pyannote_whisper.utils import diarize_text
import concurrent.futures
import subprocess
import torch
print("正在加载声纹模型")
pipeline = Pipeline.from_pretrained("pyannote/speaker-diarization@2.1",use_auth_token="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")
output_dir = '/root/autodl-tmp/no/out'
print("正在whisper模型")
model = whisper.load_model("large", device="cuda")

# MP3转化为wav
def convert_to_wav(path):
    new_path = ''
    if path[-3:] != 'wav':
        new_path = '.'.join(path.split('.')[:-1]) + '.wav'
        try:
            subprocess.call(['ffmpeg', '-i', path, new_path, '-y', '-an'])
        except:
            return path, 'Error: Could not convert file to .wav'
    else:
        new_path = ''
    return new_path, None


def process_audio(file_path):
    file_path, retmsg = convert_to_wav(file_path)
    print(f"===={file_path}=======")
    asr_result = model.transcribe(file_path, initial_prompt="语音转换")
    pipeline.to(torch.device('cuda'))
    diarization_result = pipeline(file_path, num_speakers=2)
    final_result = diarize_text(asr_result, diarization_result)
    output_file = os.path.join(output_dir, os.path.basename(file_path)[:-4] + '.txt')
    with open(output_file, 'w') as f:
        for seg, spk, sent in final_result:
            line = f'{seg.start:.2f} {seg.end:.2f} {spk} {sent}\n'
            f.write(line)


if not os.path.exists(output_dir):
    os.makedirs(output_dir)

wave_dir = '/root/autodl-tmp/no'

# 获取当前目录下所有wav文件名
wav_files = [os.path.join(wave_dir, file) for file in os.listdir(wave_dir) if file.endswith('.mp3')]

# 处理每个wav文件
# with concurrent.futures.ThreadPoolExecutor(max_workers=1) as executor:
#     executor.map(process_audio, wav_files)
for wav_file in wav_files:
    process_audio(wav_file)
print('处理完成！')

根目录 git


    
        
                        
                
                    
                    赞
                
            



                
                    
                    分享
                
            
           
            微博QQ微信
            


           
              
              
             打赏
            
          

                     
                    
                        
                        举报
                    
                
            
                
                    
                    踩
                
            
          
    
    
                    上一篇：【python基础】-- yarn add 添加依赖的各种类型
                    下一篇：java面试：==和equals有什么区别？




 

 



    
        
            相关文章
        
        

                            
                    
                        
                            皮克斯2 CTO：VISION PRO 的未来和 USD WEB TOOLS
                             我们采访了皮克斯 CTO Steve May，了解了 USD 的最新发展。USD 是一种开放的 3D 内容标准，正在被 Apple、Meta、Nvidia 等公司使用。

译自 Pixar CTO on OpenUSD, Vision Pro
                        
                        
                                                    
                                                                    
                                         ico                                    
                                                                    
                                         Elastic                                    
                                                                    
                                         docker                                    
                                                            
                                                                    

                
                            
                    
                        
                            云计算 - 对象存储服务OSS技术全解3
                             云计算概述

云计算是一种通过网络连接的方式，以服务的形式提供计算资源和存储空间的技术。它能够帮助用户通过互联网使用计算资源，无需购买和维护实际的物理设备。云计算通过
                        
                        
                                                    
                                                                    
                                         ico                                    
                                                                    
                                         Elastic                                    
                                                                    
                                         docker                                    
                                                            
                                                                    

                
                            
                    
                        
                            云计算 - 弹性计算技术全解与实践
                             第一章弹性计算技术概述
弹性计算技术定义
弹性计算技术是一种基于云计算的技术，它旨在实现根据用户需求进行资源的自动调配和弹性扩展。本章将对弹性计算技术进行详细概述。
                        
                        
                                                    
                                                                    
                                         ico                                    
                                                                    
                                         Elastic                                    
                                                                    
                                         docker                                    
                                                            
                                                                    

                
                            
                    
                        
                            深入探索Docker容器启动脚本：解析、优化与调试
                             Docker是一种开源的应用容器引擎，它允许开发者将应用及其依赖打包到一个可移植的容器中，然后发布到任何流行的Linux机器或Windows机器上，也可以实现虚拟化。容器是完全使用沙箱
                        
                        
                                                    
                                                                    
                                         ico                                    
                                                                    
                                         Elastic                                    
                                                                    
                                         docker                                    
                                                            
                                                                    

                
                            
                    
                        
                            临沂城建“做媒”，中国女排与沂蒙大地“双向奔赴”
                             临沂城建“做媒”，中国女排与沂蒙大地“双向奔赴”，来源：体育行业网2023年10月7日，杭州亚运会上，中国女排3比0战胜日本女排夺得冠军，第九次站在亚运会最高领奖台。摧枯拉朽般的胜利，值得所有人的掌声和欢呼，这其中来自沂蒙老区人民的呐喊尤为响亮。同年12月25日下午，国家体育总局排球运动管理中心副主任袁磊宣布，2024年排球超级联赛全明星系列活动将于1月12日-14日在山东临沂奥体公园体育馆举办，李盈盈、王云蕗、仲慧、吴梦洁、袁心玥、王媛媛、高意
                        
                        
                                                    
                                                                    
                                         ico                                    
                                                                    
                                         Elastic                                    
                                                                    
                                         docker                                    
                                                            
                                                                    

                
                            
                    
                        
                            数字化转型浪潮中的挑战与机遇：企业如何应对七大难点_光点科技
                             数字化转型浪潮中的挑战与机遇：企业如何应对七大难点_光点科技，随着技术的日益进步，企业数字化转型已成为推动商业模式创新和运营优化的关键。尽管数字化转型提供了无限的可能性，但过程中的难点同样不容小觑。下面，我们将逐一剖析企业转型中的七大难点，并提供相应的应对策略。
                        
                        
                                                    
                                                                    
                                         ico                                    
                                                                    
                                         Elastic                                    
                                                                    
                                         docker                                    
                                                            
                                                                    

                
                            
                    
                        
                            HBase表的读写性能低下
                             HBase表的读写性能低下，假设我们面临的问题是HBase集群中某个表的读写性能较差，影响了业务的实时查询和数据写入。我们通过以下实际案例来解决这个问题：问题：HBase表的读写性能低下实战解决：案例：我们的HBase表设计采用了默认的随机RowKey，导致数据写入时可能引发热点问题。同时，表结构设计上没有很好地利用列簇。这导致了RegionServer之间负载不均衡，以及磁盘写入性能下降。实施步骤：表设计优化：重新设计R
                        
                        
                                                    
                                                                    
                                         ico                                    
                                                                    
                                         Elastic                                    
                                                                    
                                         docker                                    
                                                            
                                                                    

                
                            
                    
                        
                            HDFS原理详解与实例解析
                             HDFS原理详解与实例解析，HDFS原理详解与实例解析1.HDFS架构设计1.1NameNode与DataNodeHDFS采用主从架构，其中一个NameNode负责管理文件系统的命名空间，而多个DataNode负责实际数据的存储。这一设计使得系统能够有效管理和存储庞大的数据集。实例：NameNode和DataNode的角色类比于一家公司，NameNode就像公司的总部，负责制定规章制度和管理公司的整体运作；而DataNo
                        
                        
                                                    
                                                                    
                                         ico                                    
                                                                    
                                         Elastic                                    
                                                                    
                                         docker                                    
                                                            
                                                                    

                
                            
                    
                        
                            解决HDFS技术问题的案例：数据丢失与恢复
                             解决HDFS技术问题的案例：数据丢失与恢复，摘要：本案例研究描述了一个实际的情景，展示了如何解决HDFS技术问题中的数据丢失和恢复。案例中涉及到一个HDFS集群，在一次节点故障后，部分数据丢失。通过仔细的问题分析、检查手段和代码示例，我们成功恢复了丢失的数据。背景：我们的HDFS集群由10个数据节点组成，用于存储和处理大规模数据集。每个数据节点上都运行着Hadoop进程，负责存储数据和维护数据副本。我们的集群遇到了一个问题，其中一个数据节
                        
                        
                                                    
                                                                    
                                         ico                                    
                                                                    
                                         Elastic                                    
                                                                    
                                         docker                                    
                                                            
                                                                    

                
                            
                    
                        
                            首次邂逅，全城瞩目！临沂奥体发出排超全明星“邀请函”
                             首次邂逅，全城瞩目！临沂奥体发出排超全明星“邀请函”，来源：中国体育周刊2023-2024排球超级联赛全明星周末来临在即,这也是排球超级联赛首次把全明星周末放在北方城市举办,首度邂逅,全城瞩目。从山东儒辰男排主场正式落户临沂那天起,临沂奥体公园就已开始为排超全明星赛事积极准备,如今排超全明星周末在临举办,全民期待的同时,亦是众望所归,而即将迎来体育盛事的临沂奥体公园,也早已做足准备!“好戏”轮番登台,场馆提档升级1月8日,记者来到临沂市奥体公园体育馆
                        
                        
                                                    
                                                                    
                                         ico                                    
                                                                    
                                         Elastic                                    
                                                                    
                                         docker

深度学习	数据分析	神经网络	机器学习
负载均衡	数据仓库	帝国CMS	网站运维

网络安全	考试认证	织梦CMS	海洋CMS
办公效率	代码人生	苹果CMS	电商服务

知识热度网

whisper深入-语者分离

文章目录

学习目标：如何使用whisper

学习内容一：whisper 转文字

1.3 实战

`学习内容三：整合`

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏