一款基于FunASR高准确率开源语音识别模型的智能视频剪辑工具。 开源地址:https://github.com/alibaba-damo-academy/FunClip Star:640 FunClip是一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室开源的FunASRParaformer系列模型进行视频的语音识别,随后用户可以自由选择识别结果中的文本片段或说话人,点击裁剪按钮即可获取对应片段的视频 一键运行 AI启动器简介:上百个开源项目,一键运行!零基础上手Ai 图片...
开源地址:https://github.com/alibaba-damo-academy/FunClip
Star:640
FunClip是一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别,随后用户可以自由选择识别结果中的文本片段或说话人,点击裁剪按钮即可获取对应片段的视频
一键运行AI启动器简介:上百个开源项目,一键运行!零基础上手Ai
图片
(找到FunClip项目)
图片
(一键启动)
图片
(运行界面)
如果你希望使用自动生成字幕的视频裁剪功能,需要安装imagemagick。
功能特性FunClip集成了阿里巴巴开源的工业级模型Paraformer-Large,是当前识别效果最优的开源中文ASR模型之一,Modelscope下载量1300w 次,并且能够一体化的准确预测时间戳。
FunClip集成了SeACo-Paraformer的热词定制化功能,在ASR过程中可以指定一些实体词、人名等作为热词,提升识别效果。
FunClip集成了CAM 说话人识别模型,用户可以将自动识别出的说话人ID作为裁剪目标,将某一说话人的段落裁剪出来。
通过Gradio交互实现上述功能,安装简单使用方便,并且可以在服务端搭建服务通过浏览器使用。
FunClip支持多段自由剪辑,并且会自动返回全视频SRT字幕、目标段落SRT字幕,使用简单方便。
体验视频图片
(欢迎点赞、收藏、在看)
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。