首先“读”视频不是一个新的技术,在外网的视频网站已经是比较成熟了的。
比如 下面是Youtube 和TED 的界面
右边栏显示的是Lady Gaga 这个视频的对应字幕,拖动视频,字幕也会到对应的句子。同样点击字幕,回到对应的视频部分。
TED 也有类似的技术,采用了上下屏的方式。
很多打着 AI 标签的手机录音App 也有类似的语音和字幕的同步。
这种同步,对于观看者来说有一个非常大的好处是,检索信息变得容易了很多。因为视频信息是比较难定位的,而文字会容易很多。
一个简单的案例是,比如我录了一个2小时的课堂录音,下课时候想起来有个知识点不是很清楚,想去回听下录音,记得好像是在课程中间的部分,然后就开始在2小时录音的大致中间部分来回的找那段内容。这时候如果有对应的文本生成,显然会容易很多。
所以这个技术最早是想用到LAB 新的学习平台的录播回看系统里的。这样复习课程内容和笔记都会高效很大。
当然目前来看语音和字幕同步的技术壁垒已经解决,最大的尴尬是类似我这样的普通话,AI 语音识别还是比较困难的。所以还在寻找比较好的,经济可行的中文语音转文字的平台。
但是既然已经能实现语音和字幕的同步了,也不想浪费这样技术。因为它对于我们提高听口能力其实是很好的辅助。大致的实现是这样的
# 视频播放时候,对应的字幕会高亮
# 点击字幕,会播放对应的视频片段
# 字幕默认是在视频下方,但也随意移动到屏幕的任意一个角落
# 另外还有常规的倍数播放
这个功能目前会在明天开始的 “提高下绝对听力能力 第二期” 使用。
第二期的听力能力提高之前大致介绍过了,这里就不再累赘了。
第二期还是设置了一个¥6 的费用,也不算报名或者活动费用。就是稍微设置一个门槛,希望入群的是真的想用这个功能的,这样对于后期完善也会比较有帮助。
如果觉得这个方式适合自己提高听力能力,或者想尝试一下,以下是入体验群的QR code。支付以后,就可以看到。
本文源自微信公众号:LABcircle