音视频知识图谱 2022.05

前些时间,我在知识星球上创建了一个音视频技术社群:关键帧的音视频开发圈,在这里群友们会一起做一些打卡任务。比如:周期性地整理音视频相关的面试题,汇集一份音视频面试题集锦,你可以看看这个合集:音视频面试题集锦。再比如:循序渐进地归纳总结音视频技术知识,绘制一幅音视频知识图谱,你可以看看这个合集:音视频知识图谱。

下面是 2022.05 月知识图谱新增的内容节?。?/p>

1)图谱路径:采集/视频采集/对焦策略

  • 手动对焦
    • 用户点击哪里就对焦哪里。
  • 自动对焦
    • 基于系统能力在识别场景发生变化后,进行一次中心对焦。
    • 如果有识别到画面从无人脸到有人脸时,做一次人脸对焦(这里是只做一次人脸对焦,不能一直跟着人脸对焦,这样可以防止用户不想对焦人脸的场景:在有人脸时,点击了其他地方进行手动对焦)。
    • 人脸对焦时,一般对焦两眼中间的点位效果比较好。如果能获取到比较精细的人脸识别点位信息,常取 43 号点位。
  • 手动对焦后,在满足这些条件时会切换到自动对焦
    • 前后摄像头切换。
    • 场景发生较大切换。比如,相机位移或晃动较大,外部光线敏感度变化较大等。
    • 画面中从无人脸变为有人脸。

2)图谱路径:采集/视频采集/指标优化/相机打开平均时长+相机秒开率

  • 优先使用 CPU 资源:优化相机打开速度,可以从业务层进行处理,优先将 CPU 资源让给相机,相机打开后回调给业务相机首帧已出的事件,这样业务收到该事件后再进行其它初始化

3)图谱路径:采集/视频采集/指标优化/预览平均采集帧率+图像处理帧率+渲染帧率

  • 线程模型优化
    • 采集和视频特效放在同一个线程,随着特效功能越来越强,计算越来越重,会影响到最终的输出帧率。
    • 多线程模型:采集线程、CPU 处理线程(跑一些 AI 模型)、GPU 处理线程(跑一些图像处理)
  • 采集与前处理数据交互优化
    • 采集到前处理的数据进行下采样,这样可以提升前处理??榈拇硭俣?。
    • 视频数据对齐分辨率,防止多次采样消耗性能。
    • 视频数据对齐下采样的方式(RGB、YUV),防止多次数据格式转换消耗性能。
  • 减少 CPU 与 GPU 的数据拷贝
    • GPU 和 CPU 要尽量少做数据拷贝,性能比较差??梢允褂孟低衬芰词迪?GPU 和 CPU 的内存共享来做相关的优化。
    • Android HardwareBuffer 方案
    • iOS CVPixelBuffer 方案
  • 优化图像处理性能
    • 做图像的裁剪、缩放、旋转、尺寸变化时要注意优化性能??梢允褂?libyuv 来做常规的图像处理,一些 libyuv 版本甚至做过汇编级别的优化来提升图像处理的性能。

4)图谱路径:音频算法/音频通话质量指标/音质

  • 平均意见得分(MOS,Mean Opinion Score),主观评价方法。测试人只听测试语音进行打分。
    • 优。4.0-5.0。很好,听得清楚;延迟小,交流流畅。
    • 良。3.5~4.0。稍差,听得清楚;延迟小,交流欠流畅,有点杂音。
    • 中。3.0~3.5?;箍梢?,听不太清;有一定延迟,可以交流。
    • 差。1.5~3.0。勉强,听不太清;延迟较大,交流需要重复多遍。
    • 劣。0~1.5。极差,听不懂;延迟大,交流不通畅。
  • 失真平均意见得分(DMOS,Degradation Mean Opinion Score),主观评价方法。测试人知道原始语音。先听原始语音,再听测试语音,对差异进行打分。
  • 相对平均意见得分(CMOS,Comparison Mean Opinion Score),主观评价方法。测试人不知道原始语音。随机听原始语音、测试语音,对当前听的语音相对上一次听的语音的好坏进行打分。
  • ABX Test,主观评价方法。测试人已知 A 和 B,通过测试 X 来选择标记它是 A 还是 B。
  • 短时客观可懂度(STOI,Short-Time Objective Intelligibility),客观有参考评价方法。对纯净语音和待评价的语音进行比较从而得到评分,取值范围为 0-1。取值越高语音质量越好。
  • 语音质量的感知评估(PESQ,Perceptual Evaluation of Speech Quality),客观有参考评价方法。将一个带噪的衰减信号和一个原始的参考信号经过一系列比较处理得到 PESQ 分数,最终映射到 MOS 分数来反映语音质量。
    • 电平调整
    • IRS 滤波
    • 时间对准和补偿
    • 听觉变换
    • 提取信号时频特征评分
  • 感知客观语音质量评估(POLQA,Perceptual Objective Listening Quality Analysis),客观有参考评价方法。对 PESQ 的升级改进版。
    • 增加对宽带(Wideband)和超宽(SuperWideband)语音质量评估的能力,支持宽带(48khz)。
    • 支持最新的语音编码和 VoIP 传输技术,针对现有的 opus、silk 编码器进行过特殊优化。
    • 支持多语言环境,各国语言都支持。ITU 组织提供标准测试语料,可进行针对性测试。
  • 基于传输网络参数的无参考语音质量评估(E-Model),客观无参考评价方法。
  • 无参考语音通信网络的语音质量(NISQA),基于深度学习的客观无参考评价方法。
  • MOSNet,基于深度学习的客观无参考评价方法。
  • QualityNet,基于深度学习的客观无参考评价方法。

如果你也对音视频技术感兴趣,比如,符合下面的情况:

  • 在校大学生 → 学习音视频开发
  • iOS/Android 客户端开发 → 转入音视频领域
  • 直播/短视频业务开发 → 深入音视频底层 SDK 开发
  • 音视频 SDK 开发 → 提升技能,解决优化瓶颈

可以长按识别或扫描下面二维码,了解一下这个社群,根据自己的情况按需加入:

我们创建了一个社群,vx 搜索『gjzkeyframe』 关注『关键帧Keyframe』咨询,或知识星球搜『关键帧的音视频开发圈』即可加入。


下面是 2022.05 月的知识图谱新增内容快照(图片被平台压缩不够清晰,可以加文章后面微信索要清晰原图):


2022.05 知识图谱新增内容 .png
?著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,029评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,238评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,576评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,214评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,324评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,392评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,416评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,196评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,631评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,919评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,090评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,767评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,410评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,090评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,328评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,952评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,979评论 2 351

推荐阅读更多精彩内容