小波分解与重构,3层能得到8个频段,为什没近似信号3个,细节信号3个,只有6个啊,如何得到8个频段

查看: 2550|回复: 15
小波包分解各个频段的能量求法?我的一些想法
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
才可以下载或查看,没有帐号?
做课题需要用到小波的东西,基础理论的东西看了些,坦白说没怎么弄懂多少。因为只需要小波包分解后各个频段的能量所以直接看了些小波包的东西然后来做。求信号分解后各个频段的能量是基础所以想问下各位高手给指点下看我的方法对不对。废话多了谢谢。
一。刚开始是用wpcoef提取各个节点的小波包系数然后认为能量是各个小波包系数的平方和。用wenergy函数验证过,所计算的各个频段的能量百分比和wenwrgy的一样。但是心里没底,因为自己没什么理论依据。请明白的指点。
二。现在初步想用wprcoef重构每个频段的节点小波包系数,重构的信号和原信号长度一样,然后计算每个采样点的幅值平房和作为能量。这种物理意义明白,但是主要的问题是看了很多书还有matlab的help对wprcoef的说明,对这个函数是不是重构小波包的每个频段的信息还有点疑问。
拿一些信号做过试验发现这两种结果是一样的,而且用plot画出两种方法得到的数据图图形的形状是一样的,当然用wpcoef得到的数据长度是1/2^j.
我现在所想的是,这两种方法可能都对了。或者这两种方法都错了。
我的疑问是,wprcoef重构每个节点的小波包系数得到的是不是原信号属于该频段的信号成分,对于这个疑问我拿noisdopp信号做过试验,小波包分解3层后,对每个节点进行重构,然后把这些信号相加,得到的就是noisdopp信号。但是这样的话我的第二个疑问就来了,那wcoef得到的节点小波包系数是什么含义呢?为什么图像的形状和用cprcoef重构的信号一样呢?
希望有高手能出来指教,期盼高手谢谢
不太懂,随便说说,讨论讨论,学习学习。
个人认为wprcoef是节点小波包系数重构出来的信号;wcoef应该是节点小波包系数。
个人认为从小波包分解过程看,除最后的直流分量代表最低频外,其他系数不一定有明确的物理意义
回复 板凳 炎海飞雪 的帖子
不是太明白,能否具体解释一下。我想小波包分解后,频域被细分了,相应的小波包系数应该能大致表征各频带内信号成分的大小吧。
回复 楼主 fulty 的帖子
能把程序分享一下吗,你的意思我明白,但具体求能量,不知如何做。
直接用分解系数(wpcoef)算能量 和 重构每个子带信号(wprcoef)后算能量是一样的,理论依据帕塞瓦尔(Parseval)定理。
回复 沙发 zhchtju 的帖子
嗯,你说的很对,谢谢
非常感谢,我去看看这个定理,对于信号这一块只是外行,以后有问题还请多指教。
我想问一下的是小波包系数有没有什么具体的物理意义呢?
回复 6楼 zhlong 的帖子
非常感谢,我去看看这个定理,对于信号这一块只是外行,以后有问题还请多指教。
我想问一下的是小波包系数有没有什么具体的物理意义呢?
回复 板凳 炎海飞雪 的帖子
但是某个频段的小波包系数和重构这个频段的小波包系数的话图形形状基本是一样的,不知道有什么联系没有?
回复 5楼 qzb000728 的帖子
用相关的函数进行分解后直接平方求和就好了啊,而且一般是向量的话直接可以求内积就是了。找本MATLAB 的书就会有啊。
%利用shannon小波对每一个传感器获得的信号进行3层小波包分解,得到2的3次方个不同频带的信号
wpt=wpdec(x,3,'db1','shannon');
%重构每个频带的信号(每一列为每个频段重构后的信号)
for i=7:14
& & signal(i,:)=wprcoef(wpt,i);
%计算能量(energy)7-14列为有效数据。
for i=7:14
& & energy(i)=signal(i,:)*signal(i,:)';
回复 10楼 fulty 的帖子
“某个频段的小波包系数和重构这个频段的小波包系数的图形形状基本是一样的”,这个不太容易实现吧。
小波包系数和相应重构信号的物理意义差别很大,不太会一样吧?(虽然能量上可能存在对应的关系)
楼主,我现在也是需要用小波包分析求信号各个频段能量比,采样率1M,对信号进行5层小波包分解,用wenergy()算的能量比,可是我得出的能量比与信号的频谱高频部分有些对不上,比如信号频谱在150kHz附近有较宽尖峰,可是得出的能量比在150k附近的频率段反而很小,到200k多才很大。很迷惑。。。想请楼主帮帮忙
跟上楼的同志问题一样
楼主,我用db20对正弦信号分解,原信号L=1024个采样点,5层小波包分解,用wpcoef得到的第5层结点的小波系数个数应该为L/(2^N)=32个,可是Matlab仿真出来的结果是69个,下面的是我的代码,请教下是什么问题
fs = 6400;
ts = 0.16;
N = fs*
Layer = 5;
t = (0:N-1)/
x = sin(2*pi*50*t);
plot(t,x);
T = wpdec(x,5,'db20');
cfs = wpcoef(T,[5 7]);
plot(cfs);复制代码
Powered by扫二维码下载作业帮
2亿+学生的选择
下载作业帮安装包
扫二维码下载作业帮
2亿+学生的选择
请问一个声波信号经过4尺度小波分解,需要求每个频段的主频的问题,您好,我需要对一个声波信号用db4小波进行4尺度的分解,然后对各频段进行FFT变化,求主频.现在做出来的结果是主频大小是d3>d4>d2,不知道为什么d2变成最小了,多尺度小波分析不是将低频段继续分解吗?
wghdbniod00FFE
扫二维码下载作业帮
2亿+学生的选择
从原理上讲,应该d2>d3>d4,通常d2、d3和d4带通滤波的频率范围可能有部分重叠,因为考虑到小波基的频率响应,可实现的小波滤波器都没有理想的“砖墙(brick-wall)”频率响应,如在截断频带的衰减一般都是有限的,这就引起了混迭效应(aliasing).也就是说,当小波变换子带用2因子下采样时,Nyquist准则就可能得不到满足.所以可能在各阶小波细节频率范围的边缘值可能有重叠.那么出现极其极端的情况d4>d3或d3>d2,但这种情况极其罕见通常不会出现.你的情况是d4>d2,这是不可能的.出现这种问题的原因可能是你在做fft时频率的计算有问题,你在做4阶的DWT分解后要进行重构,然后再将重构后的各阶细节做fft.这样每一阶的细节数据的个数是相等的,算起频率来就不会出错了.还有就是你的主频是不是非常清楚明显,判别主频的方法是否准确,有可能出现伪频误判的情况.
其他类似问题
扫描下载二维码君,已阅读到文档的结尾了呢~~
小波变换在声发射信号处理中的应用,小波变换原理与应用,小波变换的应用,声发射,声发射传感器,声发射检测系统,声发射检测,耳声发射,声发射检测仪,耳声发射检查
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
小波变换在声发射信号处理中的应用
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!&&|&&
LOFTER精选
网易考拉推荐
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
历史上的今天
loftPermalink:'',
id:'fks_',
blogTitle:'小波分析及小波包分析',
blogAbstract:'在利用matlab做小波分析时,小波分解函数和系数提取函数的结果都是分解系数。我们知道,复杂的周期信号可以分解为一组正弦函数之和,及傅里叶级数,而傅里叶变换对应于傅里叶级数的系数;同样,信号也可以表示为一组小波基函数之和,小波变换系数对应于这组小波基函数的系数。&&&多尺度分解是按照多分辨分析理论,分解尺度越大,分解系数的长度越小(是上一个尺度的二分之一)。我们会发现分解得到的小波低频系数的变化规律和原始信号相似,但要注意低频系数的数值和长度与原始信号以及后面重构得到的各层信号是不一样的。&&&小波分解:具体实现过程可以分别设计高通滤波器和低通滤波器,得到高频系数和低频系数,并且每分解一次数据的长度减半。小波重构,为分分解的逆过程,先进行',
blogTag:'',
blogUrl:'blog/static/',
isPublished:1,
istop:false,
modifyTime:0,
publishTime:4,
permalink:'blog/static/',
commentCount:0,
mainCommentCount:0,
recommendCount:0,
bsrk:-100,
publisherId:0,
recomBlogHome:false,
currentRecomBlog:false,
attachmentsFileIds:[],
groupInfo:{},
friendstatus:'none',
followstatus:'unFollow',
pubSucc:'',
visitorProvince:'',
visitorCity:'',
visitorNewUser:false,
postAddInfo:{},
mset:'000',
remindgoodnightblog:false,
isBlackVisitor:false,
isShowYodaoAd:false,
hostIntro:'',
hmcon:'0',
selfRecomBlogCount:'0',
lofter_single:''
{list a as x}
{if x.moveFrom=='wap'}
{elseif x.moveFrom=='iphone'}
{elseif x.moveFrom=='android'}
{elseif x.moveFrom=='mobile'}
${a.selfIntro|escape}{if great260}${suplement}{/if}
{list a as x}
推荐过这篇日志的人:
{list a as x}
{if !!b&&b.length>0}
他们还推荐了:
{list b as y}
转载记录:
{list d as x}
{list a as x}
{list a as x}
{list a as x}
{list a as x}
{if x_index>4}{break}{/if}
${fn2(x.publishTime,'yyyy-MM-dd HH:mm:ss')}
{list a as x}
{if !!(blogDetail.preBlogPermalink)}
{if !!(blogDetail.nextBlogPermalink)}
{list a as x}
{if defined('newslist')&&newslist.length>0}
{list newslist as x}
{if x_index>7}{break}{/if}
{list a as x}
{var first_option =}
{list x.voteDetailList as voteToOption}
{if voteToOption==1}
{if first_option==false},{/if}&&“${b[voteToOption_index]}”&&
{if (x.role!="-1") },“我是${c[x.role]}”&&{/if}
&&&&&&&&${fn1(x.voteTime)}
{if x.userName==''}{/if}
网易公司版权所有&&
{list x.l as y}
{if defined('wl')}
{list wl as x}{/list}&p&&b&说明:以下是非专业人士的整理,我按自己的理解对算法工程师进行了分类,不定时更新。&/b&&/p&&br&&p&&b&算法工程师相关的专业回答可见&/b&&a href=&/lives/381504& class=&internal&&SimonS 的知乎 Live - 如何成为当下合格的算法工程师&/a& &a class=&member_mention& href=&///people/710eba6a35a79b962ffd& data-hash=&710eba6a35a79b962ffd& data-hovercard=&p$b$710eba6a35a79b962ffd&&@SimonS&/a& &/p&&br&&p&&b&一、算法工程师简介&/b&&/p&&p&&b&(通常是月薪15k以上,年薪18万以上,只是一个概数,具体薪资可以到招聘网站如拉钩,猎聘网上看看)&/b&&/p&&p&算法工程师目前是一个高端也是相对紧缺的职位;&/p&&br&&p&&b&算法工程师包括&/b&&/p&&p&音/视频算法工程师(通常统称为语音/视频/图形开发工程师)、图像处理算法工程师、计算机视觉算法工程师、通信基带算法工程师、信号算法工程师、射频/通信算法工程师、自然语言算法工程师、数据挖掘算法工程师、搜索算法工程师、控制算法工程师(云台算法工程师,飞控算法工程师,机器人控制算法)、导航算法工程师( &a class=&member_mention& href=&///people/3cbbdd7c8fc& data-hash=&3cbbdd7c8fc& data-hovercard=&p$b$3cbbdd7c8fc&&@之介&/a& 感谢补充)、其他【其他一切需要复杂算法的行业】 &/p&&br&&p&&b&专业要求:&/b&计算机、电子、通信、数学等相关专业;&/p&&p&&b&学历要求:&/b&本科及其以上的学历,大多数是硕士学历及其以上;&/p&&p&&b&语言要求:&/b&英语要求是熟练,基本上能阅读国外专业书刊,做这一行经常要读论文;&/p&&p&必须掌握计算机相关知识,熟练使用仿真工具MATLAB等,必须会一门编程语言。&/p&&p&&b&算法工程师的技能树(不同方向差异较大,此处仅供参考)&/b&&/p&&p&1 机器学习&/p&&p&2 大数据处理:熟悉至少一个分布式计算框架Hadoop/Spark/Storm/ map-reduce/MPI&/p&&p&3 数据挖掘&/p&&p&4 扎实的数学功底&/p&&p&5 至少熟悉C/C++或者Java,熟悉至少一门编程语言例如java/python/R&/p&&p&加分项:具有较为丰富的项目实践经验(不是水论文的哪种)&/p&&br&&p&&b&二、算法工程师大致分类与技术要求&/b&&/p&&p&&b&(一)图像算法/计算机视觉工程师类&/b&&/p&&p&&b&包括&/b&&/p&&p&图像算法工程师,图像处理工程师,音/视频处理算法工程师,计算机视觉工程师&/p&&p&&b&要求&/b&&/p&&p&l
专业:计算机、数学、统计学相关专业;&/p&&p&l
技术领域:机器学习,模式识别&/p&&p&&b&l
技术要求:&/b&&/p&&p&(1)
精通DirectX HLSL和OpenGL GLSL等shader语言,熟悉常见图像处理算法GPU实现及优化;&/p&&p&(2)
语言:精通C/C++;&/p&&p&(3)
工具:Matlab数学软件,CUDA运算平台,VTK图像图形开源软件【医学领域:ITK,医学图像处理软件包】&/p&&p&(4)
熟悉OpenCV/OpenGL/Caffe等常用开源库;&/p&&p&(5)
有人脸识别,行人检测,视频分析,三维建模,动态跟踪,车识别,目标检测跟踪识别经历的人优先考虑;&/p&&p&(6)
熟悉基于GPU的算法设计与优化和并行优化经验者优先;&/p&&p&(7)
【音/视频领域】熟悉H.264等视频编解码标准和FFMPEG,熟悉rtmp等流媒体传输协议,熟悉视频和音频解码算法,研究各种多媒体文件格式,GPU加速;&/p&&br&&p&应用领域:&/p&&p&(1)
互联网:如美颜app&/p&&p&(2)
医学领域:如临床医学图像&/p&&p&(3)
汽车领域&/p&&p&(4)
人工智能&/p&&br&&p&相关术语:&/p&&p&(1)
OCR:OCR (Optical Character Recognition,&b&光学字符识别&/b&)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程&/p&&p&(2)
Matlab:商业数学软件;&/p&&p&(3)
CUDA: (Compute Unified Device Architecture),是显卡厂商NVIDIA推出的&b&运算平台&/b&(由ISA和GPU构成)。 CUDA(TM)是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题&/p&&p&(4)
OpenCL: OpenCL是一个为异构平台编写程序的框架,此异构平台可由CPU,GPU或其他类型的处理器组成。&/p&&p&(5)
OpenCV:开源计算机视觉库;OpenGL:开源图形库;Caffe:是一个清晰,可读性高,快速的深度学习框架。&/p&&p&(6)
CNN:(深度学习)卷积神经网络(Convolutional Neural Network)CNN主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。&/p&&p&(7)
开源库:指的是计算机行业中对所有人开发的代码库,所有人均可以使用并改进代码算法。&/p&&br&&p&&b&(二)机器学习工程师&/b&&/p&&p&&b&包括&/b&&/p&&p&机器学习工程师&/p&&p&&b&要求&/b&&/p&&p&l
专业:计算机、数学、统计学相关专业;&/p&&p&l
技术领域:人工智能,机器学习&/p&&p&l
技术要求:&/p&&p&(1)
熟悉Hadoop/Hive以及Map-Reduce计算模式,熟悉Spark、Shark等尤佳;&/p&&p&(2)
大数据挖掘;&/p&&p&(3)
高性能、高并发的机器学习、数据挖掘方法及架构的研发;&/p&&br&&p&应用领域:&/p&&br&&p&(1)人工智能,比如各类仿真、拟人应用,如机器人&/p&&p&(2)医疗用于各类拟合预测&/p&&p&(3)金融高频交易&/p&&p&(4)互联网数据挖掘、关联推荐&/p&&p&(5)无人汽车,无人机&/p&&br&&br&&p&相关术语:&/p&&p&(1)
Map-Reduce:MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念&Map(映射)&和&Reduce(归约)&,是它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。&/p&&br&&p&&b&(三)自然语言处理工程师&/b&&/p&&p&&b&包括&/b&&/p&&p&自然语言处理工程师&/p&&p&&b&要求&/b&&/p&&p&l
专业:计算机相关专业;&/p&&p&l
技术领域:文本数据库&/p&&p&l
技术要求:&/p&&p&(1)
熟悉中文分词标注、文本分类、语言模型、实体识别、知识图谱抽取和推理、问答系统设计、深度问答等NLP 相关算法;&/p&&p&(2)
应用NLP、机器学习等技术解决海量UGC的文本相关性;&/p&&p&(3)
分词、词性分析、实体识别、新词发现、语义关联等NLP基础性研究与开发;&/p&&p&(4)
人工智能,分布式处理Hadoop;&/p&&p&(5)
数据结构和算法;&/p&&br&&p&应用领域:&/p&&br&&p&口语输入、书面语输入
、语言分析和理解、语言生成、口语输出技术、话语分析与对话、文献自动处理、多语问题的计算机处理、多模态的计算机处理、信息传输与信息存储 、自然语言处理中的数学方法、语言资源、自然语言处理系统的评测。&/p&&br&&br&&p&相关术语:&/p&&p&(2)
NLP:人工智能的自然语言处理,NLP (Natural Language Processing) 是人工智能(AI)的一个子领域。NLP涉及领域很多,最令我感兴趣的是“&b&中文自动分词”(Chinese word segmentation):结婚的和尚未结婚的【计算机中却有可能理解为结婚的“和尚“】&/b&&/p&&br&&br&&p&&b&(四)射频/通信/信号算法工程师类&/b&&/p&&p&&b&包括&/b&&/p&&p&3G/4G无线通信算法工程师, 通信基带算法工程师,DSP开发工程师(数字信号处理),射频通信工程师,信号算法工程师&/p&&p&&b&要求&/b&&/p&&p&l
专业:计算机、通信相关专业;&/p&&p&l
技术领域:2G、3G、4G,BlueTooth(蓝牙),WLAN,无线移动通信, 网络通信基带信号处理&/p&&p&l
技术要求:&/p&&p&(1)
了解2G,3G,4G,BlueTooth,WLAN等无线通信相关知识,熟悉现有的通信系统和标准协议,熟悉常用的无线测试设备;&/p&&p&(2)
信号处理技术,通信算法;&/p&&p&(3)
熟悉同步、均衡、信道译码等算法的基本原理;&/p&&p&(4)
【射频部分】熟悉射频前端芯片,扎实的射频微波理论和测试经验,熟练使用射频电路仿真工具(如ADS或MW或Ansoft);熟练使用cadence、altium designer PCB&b&电路设计&/b&软件;&/p&&p&(5)
有扎实的数学基础,如复变函数、随机过程、数值计算、矩阵论、离散数学&/p&&br&&p&应用领域:&/p&&p&通信&/p&&p&VR【用于快速传输视频图像,例如乐客灵境VR公司招募的通信工程师(数据编码、流数据)】&/p&&p&物联网,车联网&/p&&p&导航,军事,卫星,雷达&/p&&br&&p&相关术语:&/p&&p&(1)
基带信号:指的是没有经过调制(进行频谱搬移和变换)的原始电信号。&/p&&p&(2)
基带通信(又称基带传输):指传输基带信号。进行基带传输的系统称为基带传输系统。传输介质的整个信道被一个基带信号占用.基带传输不需要调制解调器,&b&设备化费小,具有速率高和误码率低等优点,.适合短距离的数据传输&/b&,传输距离在100米内,在音频市话、计算机网络通信中被广泛采用。如从计算机到监视器、打印机等外设的信号就是基带传输的。大多数的&b&局域网&/b&使用基带传输,如以太网、令牌环网。&/p&&p&(3)
射频:射频(RF)是Radio Frequency的缩写,表示可以辐射到空间的&b&电磁频率(电磁波),频率范围从300KHz~300GHz之间(因为其较高的频率使其具有远距离传输能力)&/b&。射频简称RF射频就是射频电流,它是一种高频交流变化电磁波的简称。每秒变化小于1000次的交流电称为低频电流,大于10000次的称为高频电流,而射频就是这样一种高频电流。高频(大于10K);射频(300K-300G)是高频的较高频段;微波频段(300M-300G)又是射频的较高频段。&b&【有线电视就是用射频传输方式】&/b&&/p&&p&(4)
DSP:数字信号处理,也指数字信号处理芯片&/p&&br&&p&&b&(五)数据挖掘算法工程师类&/b&&/p&&p&&b&包括&/b&&/p&&p&推荐算法工程师,数据挖掘算法工程师&/p&&p&&b&要求&/b&&/p&&p&l
专业:计算机、通信、应用数学、金融数学、模式识别、人工智能;&/p&&p&l
技术领域:机器学习,数据挖掘&/p&&p&l
技术要求:&/p&&p&(1)
熟悉常用机器学习和数据挖掘算法,包括但不限于决策树、Kmeans、SVM、线性回归、逻辑回归以及神经网络等算法;&/p&&p&(2)
熟练使用SQL、Matlab、Python等工具优先;&/p&&p&(3)
对Hadoop、Spark、Storm等大规模数据存储与运算平台有实践经验【均为分布式计算框架】&/p&&p&(4)
数学基础要好,如高数,统计学,数据结构&/p&&p&l
加分项:数据挖掘建模大赛;&/p&&br&&p&应用领域&/p&&p&(1)
个性化推荐&/p&&p&(2)
广告投放&/p&&p&(3)
大数据分析&/p&&br&&p&相关术语&/p&&p&Map-Reduce:MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念&Map(映射)&和&Reduce(归约)&,是它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。&/p&&br&&p&&b&(六)搜索算法工程师&/b&&/p&&p&&b&要求&/b&&/p&&p&l
技术领域:自然语言&/p&&p&l
技术要求:&/p&&p&(1)
数据结构,海量数据处理、高性能计算、大规模分布式系统开发&/p&&p&(2)
hadoop、lucene&/p&&p&(3)
精通Lucene/Solr/Elastic Search等技术,并有二次开发经验&/p&&p&(4)
精通Lucene/Solr/Elastic Search等技术,并有二次开发经验;&/p&&p&(5)
精通倒排索引、全文检索、分词、排序等相关技术;&/p&&p&(6)
熟悉Java,熟悉Spring、MyBatis、Netty等主流框架;&/p&&p&(7)
优秀的数据库设计和优化能力,精通MySQL数据库应用 ;&/p&&p&(8)
了解推荐引擎和数据挖掘和机器学习的理论知识,有大型搜索应用的开发经验者优先。&/p&&br&&p&&b&(七)控制算法工程师类&/b&&/p&&p&包括了云台控制算法,飞控控制算法,机器人控制算法&/p&&p&&b&要求&/b&&/p&&p&l
专业:计算机,电子信息工程,航天航空,自动化&/p&&p&l
技术要求:&/p&&p&(1)
精通自动控制原理(如PID)、现代控制理论,精通组合导航原理,姿态融合算法,电机驱动,电机驱动&/p&&p&(2)
卡尔曼滤波,熟悉状态空间分析法对控制系统进行数学模型建模、分析调试;&/p&&p&l
加分项:有电子设计大赛,机器人比赛,robocon等比赛经验,有硬件设计的基础;&/p&&br&&p&应用领域&/p&&p&(1)医疗/工业机械设备&/p&&p&(2)工业机器人&/p&&p&(3)机器人&/p&&p&(4)无人机飞控、云台控制等&/p&&br&&br&&p&&b&(八)导航算法工程师&/b&&/p&&p&&b&要求&/b&&/p&&p&l 专业:计算机,电子信息工程,航天航空,自动化&/p&&p&l 技术要求(以公司职位JD为例)&/p&&p&&b&公司一
&/b&(1)精通惯性导航、激光导航、雷达导航等工作原理;
(2)精通组合导航算法设计、精通卡尔曼滤波算法、精通路径规划算法;
(3)具备导航方案设计和实现的工程经验;
(4)熟悉C/C++语言、熟悉至少一种嵌入式系统开发、熟悉Matlab工具;&/p&&p&&b&公司二&/b&
(1)熟悉基于视觉信息的SLAM、定位、导航算法,有1年以上相关的科研或项目经历;
(2)熟悉惯性导航算法,熟悉IMU与视觉信息的融合;&/p&&br&&p&应用领域&/p&&p&无人机、机器人等。&/p&
说明:以下是非专业人士的整理,我按自己的理解对算法工程师进行了分类,不定时更新。 算法工程师相关的专业回答可见
一、算法工程师简介(通常是月薪15k以上,年薪18万以上,只是一个概数,具体…
目前票数第一的说了一堆比特率采样率音频格式什么的,但是基本没有回答提主的问题吧?&br&---------------------------------------------------------------------------------------------------------&br&&b&PART1 开章点题:无损音乐和普通音乐有什么区别?&br&&/b&&br&在这里我猜测题主说的『普通音乐』是有损音频好了,那么区别就是:有损音频相较于无损音频来说,损失了一部分信息。&br&所以这个问题的本质是,&u&&i&有损音频,损失了什么信息?为什么要损失这部分信息?&br&&/i&&/u&我先把答案放在前面:&b&&i&&u&有损音频主要是损失了音频中的高频分量。&br&&br&&/u&&/i&&/b&&b&PART2 频率、高频、低频以及耳朵&br&&br&&/b&在这里我就不解释频率的物理意义了,让我们从生活中直观的体会下什么是频率,什么是高频,什么是低频&br&比如你去K歌的时候,唱《青藏高原》,感觉是?大部分人会用这么一句话形容『声音太高,上不去』&br&你再去唱《滚滚长江东逝水》,感觉是?唱不出原唱的厚重感吧,有人也会说『声音下不去』&br&这就是频率的直观感受了。&br&&br&为什么一般人唱不好这两首歌啊?因为我们的嗓子能发出的声音频率有限,同样的,&b&我们的耳朵能听到的声音,也是有限的&/b&,在课本上大家都有学过,人耳的听觉范围是20-20kHZ,大家对这个数据可能没有什么直观的感受,不妨试试下面的测试。&br&&a href=&///?target=http%3A//www./& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Ultrasonic Ringtones&i class=&icon-external&&&/i&&/a&(多谢 &a class=&member_mention& href=&///people/aaaf47da7d6f6b1ca89e0e65a48eb2d6& data-hash=&aaaf47da7d6f6b1ca89e0e65a48eb2d6& data-hovercard=&p$b$aaaf47da7d6f6b1ca89e0e65a48eb2d6&&@顾海鑫&/a& 提供,之前B站那个高频部分可能被切掉了囧,不过这也说明了不管在啥地方压缩都会切高频的……)&br&这种『明明有声音,音量也足够大,就是有人能听到有人听不到』的感觉还是很奇妙的。&b&&br&&br&PART3 再看无损与有损音频的区别&br&&br&&/b&现在我们知道了:&br&1、有损音频为了保证较高的压缩率,肯定少了一部分信息&br&2、人的耳朵对高频声音不敏感,到一定频率后就完全听不到了。&br&&br&那如果要你设计一种有损压缩的算法,你会怎么设计?&br&我们看看最常见的mp3格式是怎么做的&br&&br&先看一个无损音频的频谱图&br&&img data-rawheight=&778& data-rawwidth=&1280& src=&/493d35a69bf23a844015f_b.jpg& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&/493d35a69bf23a844015f_r.jpg&&再看看我自己转的320k mp3的频谱图&br&&img data-rawheight=&778& data-rawwidth=&1280& src=&/6ee55e7e6d7af96d3115_b.jpg& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&/6ee55e7e6d7af96d3115_r.jpg&&怎么样,是不是有『照头一刀』的感觉?&br&到这里,我们至少可以证明了,对于MP3来说,他的『有损』大部分损失在了高频部分。&br&其他格式的有损音频大体类似,只是压缩算法可能更加高明,不会像MP3一样一刀切,不信谁可以试试转成itunes m4a,再看看频谱。&br&&br&因此在这里可以回答题主的第一个问题&br&无损音乐和普通音乐有何区别?答:&b&有损音频主要是损失了音频中的高频分量。但是由于人耳的特性,听起来未必能听出来区别。&/b&&br&&br&本来也很想答一下题主的第二个问题的,『目前国内线上音乐哪家能真正做到无损?&b&』&br&&/b&打开虾米发现听高音质的需要付费,谁捐点吧哈哈&b&。&/b&
目前票数第一的说了一堆比特率采样率音频格式什么的,但是基本没有回答提主的问题吧? --------------------------------------------------------------------------------------------------------- PART1 开章点题:无损音乐和普通音乐有什么区别?
&a class=&video-box& href=&///?target=http%3A///v_show/id_XMTQwMjg5NzM4OA%3D%3D.html& target=&_blank& data-video-id=&& data-video-playable=&false& data-name=&线性工作流—在线播放—优酷网,视频高清在线观看& data-poster=&/2ED76A0A4BEF& data-lens-id=&&&
&img class=&thumbnail& src=&/2ED76A0A4BEF&&&span class=&content&&
&span class=&title&&线性工作流—在线播放—优酷网,视频高清在线观看&span class=&z-ico-extern-gray&&&/span&&span class=&z-ico-extern-blue&&&/span&&/span&
&span class=&url&&&span class=&z-ico-video&&&/span&/v_show/id_XMTQwMjg5NzM4OA==.html&/span&
&/a&&p&以上视频是我一年前对Gamma的理解,最近有了更多体会,故把答案推翻重写,和大家分享一下。&/p&&br&&p&我打算抛开计算机图像、显示器发展史等因素,从逻辑上推出一个“广义的Gamma”,这样其实是触及了问题的本质。把人对画面的认知,和Gamma出现的必然性都推理出来。&/p&&br&&p&先上结论:&/p&&br&&p&“广义Gamma”的产生,原因有二:&/p&&br&&ol&&li&人眼对自然亮度感知是非线性的。(韦伯定律)
&/li&&li&我们用来记录/展示画面的媒介上,灰阶预算是有限的。(无论&b&纸张&/b&还是屏幕)
&/li&&/ol&&br&&p&为了在灰阶预算有限的前提下,协调&b&自然亮度&/b&和&b&主观灰阶感受&/b&这二者的映射关系,Gamma就产生了。&/p&&br&&br&&p&&b&第一节:韦伯定律&/b&&/p&&p&&b&(注:存疑,解释请看第五节第一段,但不影响本文阅读,您可以按顺序先看下去)&/b&&/p&&br&&blockquote&韦伯定律,即感觉的差别阈限随原来刺激量的变化而变化,而且表现为一定的规律性,用公式来表示,就是△Φ/Φ=C,其中Φ为原刺激量,△Φ为此时的差别阈限,C为常数,又称为韦伯率。
&/blockquote&&br&&p&解释成人人都懂的大白话就是:&b&人对自然界刺激的感知,是非线性的,外界以一定的比例加强刺激,对人来说,这个刺激是均匀增长的。&/b&&/p&&br&&p&为什么会有韦伯定律?人不是物理测量仪器,我们用感知是不可能测出某事物具体的物理量的,但是我们可以&b&通过比较,来感知世界&/b&。&/p&&br&&p&以光为例,若在一小黑屋中,点亮了一支蜡烛A,这支蜡烛对屋内的贡献是显著的,在视觉上也感受到极大的明度提升。但是若是屋内已经点亮了1000支蜡烛,此时再点亮一支蜡烛B的话,从物理能量贡献上,这支新蜡烛B与蜡烛A的物理贡献是一样大的,但是在人的视觉中,B引起的“明度”&b&变化&/b&,远远不如A。&/p&&br&&p&为什么?很好理解啊:对于某事物,同样的变化量△a,总量少的时候,变化显著,容易被人感知,事物总量大了,再变化同样的△a,就不那么容易被察觉了。&/p&&br&&p&正因为我们在很多时候不需要知道事物客观的物理量,而是要描述它们的增减关系,所以必须是靠比较来描述,才比较合理,以等比数列增加的物理量,对人的感知来说,是均匀的,比如:&/p&&br&&ol&&li&音乐的音阶,是符合十二平均律的,音调的频率以等比数列增加,人听起来是均匀升调。两个八度之间频率翻一倍。
&/li&&li&声音的强度是按照“分贝”来描述,倍数增加的音量听起来是均匀增加的。
&/li&&li&拍照片,描述明亮程度用的是“档”,曝光物理上大一倍,认为是亮了一个级别。
&/li&&li&里氏地震级数,每增加一级,释放的物理能量大32倍。&/li&&/ol&&br&&p&类似这样的例子太多太多了。&/p&&br&&p&另外有一个家喻户晓的笑话,实际上直戳这类描述体系的反直觉之处,绝大多数人根本没意识到,我们以为是均匀增加的量,其实不是线性增加的。&/p&&br&&p&笑话是这样讲的:据说人所能感受到的疼痛分为了10级,1级是被蚊子叮了,10级呢,是孕妇分娩。有人就问了,那什么是11级疼痛呢?答“11级疼痛就是孕妇分娩的时候被蚊子叮了”。哈哈一笑之余,有人质疑过这个说法吗?&/p&&br&&p&现在你懂了韦伯定律,就知道所谓“分娩的时候被蚊子叮”不可能是11级疼痛,由于分娩已经是10级剧痛,此时被蚊子叮所带来的感受变化量微乎其微,疼痛程度仍然是10级。那么什么是11级疼痛呢?一定是“N个孕妇分娩的痛苦以科技手段让同一个人同时承受”,才是11级。&/p&&br&&br&&p&&b&第二节:中灰&/b&&/p&&br&&p&对于中灰的定义,我不敢妄下,我只说我个人的解释:&/p&&br&&p&&b&“中灰就是人眼能分辨的所有灰阶的中间点。”&/b&&/p&&br&&p&怎么理解?我一直以&b&《粉刷匠的故事》&/b&,来解释中灰的意义:&/p&&br&&p&假如你是一位粉刷匠,你拥有充足的白油漆和充足的黑油漆,那么现在要求你完成一个任务:&/p&&br&&p&&b&把黑白油漆混合成各种不同灰度的油漆,并且把它们排成一排,直到形成黑到白的均匀过渡。&/b&&/p&&br&&p&在理想的情况下,会发生什么样的情况?你会不断地调出灰色的油漆,并且把它和已有的油漆相比较,如果它是一个新灰色,你就会把它插入队列,如果是重复的灰色(肉眼难以分辨,达到了你灰阶分辨能力的极限),你就会把它丢掉。&/p&&br&&p&最终,功夫不负有心人,你面前的灰阶将会形成从黑到白的均匀过渡,此时的灰油漆种类将会是几百个甚至更多,那么最中间那一个,就是中灰的油漆:&/p&&img src=&/v2-f954df2ddaad6fd9b3af6_b.jpg& data-rawwidth=&1200& data-rawheight=&359& class=&origin_image zh-lightbox-thumb& width=&1200& data-original=&/v2-f954df2ddaad6fd9b3af6_r.jpg&&&p&这里粉刷匠为了管理这些好不容易调出来的灰油漆,把它们赋予了合理的编号,根据油漆在队列中的位置,粉刷匠定义纯黑油漆编号为0.0,纯白油漆编号为1.0,那么中灰油漆的编号自然落在了0.5上。与此同时我们还可以得到的推论就是:不管油漆的总数有多少,编号0.0-0.5之间的油漆种类数目,和编号0.5-1.0之间的数目是一样的,因为从定义上,中灰就是队伍的最中间那个颜色。我们继续定义比中灰暗叫暗区,比中灰亮叫亮区,那么(在低动态范围下,)&b&人眼可分辨的暗区灰阶的数目和亮区灰阶的数目是一样多&/b&的。这样的一个连续的灰阶体系可谓完美,用来描述画面再好不过了。&/p&&br&&br&&p&&b&第三节:物理反射率检测&/b&&/p&&br&&p&面对这样一个完美的从黑到白过渡的油漆颜料体系,我们如果去检测一下中灰油漆的反射率,再把它和纯白油漆的反射率相比较。若我们定义白油漆的反射率是100%,黑油漆的反射率是0%,你会发现,中灰油漆的反射率不是直觉中的50%,而是一个在20%上下徘徊的数值。&/p&&br&&p&生活中早有这种类似的东西,比如摄影师的灰卡,反射率是白卡的18%:&/p&&img src=&/v2-bddd9a00d32dfe5df5d30bec_b.jpg& data-rawwidth=&800& data-rawheight=&452& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/v2-bddd9a00d32dfe5df5d30bec_r.jpg&&&p&(据简单的搜索,灰卡的反射率是白卡的18%还涉及其他原因,18%实际上是17.68的近似值,而17.68是312.5的平方根,具体请阅读&a href=&///?target=http%3A///link%3Furl%3Db7Iol1s_LLAins7hbkJMMu6ztJRntNgevow_f-4CT6yL4DN9HS5Fxj148GZdZAIMmmTdIUOdg6Lfwk-yIAFryrgUmC0_iZcKZzrJShydeky& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&相机拍摄使用灰卡的方法&i class=&icon-external&&&/i&&/a&)&/p&&br&&p&在本文中,我举灰卡的例子不是想告诉你们中灰色的物理反射率已有定论,事实上它没有也不可能有,在不同显示媒介和不同的光照的情况下,心目中中灰所对应的反射率是不太一样的。我举这个例子只是想拿一个大家看得见摸得着,并且符合国际标准的参照物,来说明:&b&人心目中看起来中灰的色块,其物理亮度值大约在白色块的20%左右&/b&。&/p&&br&&p&根据韦伯定律,这件事是好理解的,下图是非常粗略的示意图:&/p&&img src=&/v2-723aa4f5f5e3c6eada193b_b.jpg& data-rawwidth=&865& data-rawheight=&777& class=&origin_image zh-lightbox-thumb& width=&865& data-original=&/v2-723aa4f5f5e3c6eada193b_r.jpg&&&p&此图原点是黑色,1,1点是白色,你可以这么理解此图:当整体环境较暗,微小的亮度增长也会在人的心目中是显著的明度提升,当物理亮度达到白色的20%左右的时候,人的心目中已经感受到中灰色的概念。而剩下的一半高光区的灰阶,需要用白色80%的物理能量才能照亮成白色。&/p&&br&&p&这一节你只需要记住一个结论,虽然不太精确,但是绝对不会错得太离谱,这是我个人辅助理解Gamma校正的法宝:&/p&&br&&p&&b&视觉感受的中灰色是白色反射率的20%左右。(注:白色为低动态颜色1.0)&/b&&/p&&br&&p&&b&再换成更不精确但更好用的话就是:自然界的0.2,在心目中的地位是0.5。&/b&&/p&&br&&br&&p&&b&第四节:“灰阶预算很紧张!”&/b&&/p&&br&&p&我管这个故事叫&b&《灰色蜡笔的故事》&/b&&/p&&br&&p&粉刷匠改行了,他要去做蜡笔,这个蜡笔的要求很特殊,是灰阶蜡笔。蜡笔不像油漆可以调出连续的颜色,而是只能调出离散的,有代表性的几个灰阶。&/p&&br&&p&现在如果生产一套畅销蜡笔,但是灰阶预算超紧张,只允许你放进去3支不同灰阶的蜡笔,你会选择哪几个有代表性的灰色进行生产呢?&/p&&br&&p&我想最合理选择的就是黑、白、中灰了吧,用它们可以尽可能多的描述画面的灰阶过渡,而这三支笔,借用之前的编号体系,他们的灰阶编号分别为:0.0、0.5、1.0。反射率分别&b&约&/b&为:0%、20%、100%&/p&&img src=&/v2-dfbd8bf598a590acd0a0a046_b.jpg& data-rawwidth=&1024& data-rawheight=&623& class=&origin_image zh-lightbox-thumb& width=&1024& data-original=&/v2-dfbd8bf598a590acd0a0a046_r.jpg&&&br&&br&&p&现在放宽要求,这套蜡笔可以是4色一盒,那么编号0.0、0.33、0.66、1.0的四支蜡笔入选。反射率分别&b&约&/b&为:0%、9%、40%、100%&/p&&img src=&/v2-c2d44d25dae83f7afa263f_b.jpg& data-rawwidth=&1000& data-rawheight=&179& class=&origin_image zh-lightbox-thumb& width=&1000& data-original=&/v2-c2d44d25dae83f7afa263f_r.jpg&&&br&&br&&p&如果是5色一盒呢?则编号0.0、0.25、0.5、0.75、1.0的蜡笔入选。反射率分别&b&约&/b&为:0%、5%、20%、53%、100%&/p&&img src=&/v2-ed210c12cb289ff1b3f1ab_b.jpg& data-rawwidth=&1000& data-rawheight=&179& class=&origin_image zh-lightbox-thumb& width=&1000& data-original=&/v2-ed210c12cb289ff1b3f1ab_r.jpg&&&br&&br&&p&有人要问了,老韩你先等会儿吧,不同灰度蜡笔的物理反射率你是怎么知道的?&/p&&br&&p&查这张曲线图啊,从纵坐标挑选蜡笔的颜色,横坐标上就是它相对于白色的反射率了,中灰是20%左右的情况下,其他的数据位置也都是可以推算的:&/p&&img src=&/v2-e3f307e8cefc4c1117c6afe78250bfa6_b.jpg& data-rawwidth=&865& data-rawheight=&777& class=&origin_image zh-lightbox-thumb& width=&865& data-original=&/v2-e3f307e8cefc4c1117c6afe78250bfa6_r.jpg&&&br&&p&那么这张曲线图是不是准确,可就非常关键了。曲线图是靠什么定义的呢?我们来到下一节:&/p&&br&&p&&b&第五节:广义Gamma&/b&&/p&&br&&p&兄弟们,我不卖关子了,上文这个0-1区间的曲线,就是所谓的Gamma曲线。我们若定义黑是0,白是1,那么在0-1区间,我们是可以用一个&b&幂函数&/b&来描述客观自然数值和主观心理感知的对应关系的(等比数列通项公式就是幂函数):&/p&&p&(&b&注:&/b&知友指出韦伯定律是对数函数,无法直接转化到幂函数,知友 &a class=&member_mention& href=&///people/dc33abe7e08dafdba57ba48& data-hash=&dc33abe7e08dafdba57ba48& data-hovercard=&p$b$dc33abe7e08dafdba57ba48&&@TA123&/a& 提出,这里大概应该用 Stevens' power law,来取代韦伯-费希纳定律的解释,&a href=&///?target=https%3A//en.wikipedia.org/wiki/Stevens%2527_power_law& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Stevens' power law&i class=&icon-external&&&/i&&/a& 描述的也是物理刺激强度与感受强度的关系,而其形式是一个幂函数,这个描述方法经常被认为取代了韦伯-费希纳定律,因为它描述了更广泛的感觉。我觉得这个解释很可能是正确的。至于对数和幂函数有没有内在联系,能否转化,希望数学好的知友能够给出一些帮助。)&/p&&img src=&/bccdc4bbc54_b.png& data-rawwidth=&396& data-rawheight=&67& class=&content_image& width=&396&&&br&&p&Gamma取值不同的时候,幂函数图像是如下规律:&/p&&img src=&/dca2cdf8e6029f4ddb5d7_b.png& data-rawwidth=&1177& data-rawheight=&839& class=&origin_image zh-lightbox-thumb& width=&1177& data-original=&/dca2cdf8e6029f4ddb5d7_r.png&&&br&&p&Gamma=1,斜45°直线,不校正,输出=输入;&/p&&br&&p&Gamma大于1,曲线下压,输出值小于输入值;&/p&&br&&p&Gamma小于1,曲线上拱,输出值大于输入值。&/p&&br&&p&生产蜡笔的时候,我们输入一个主观概念:“我想要一支编号0.5的蜡笔”,输出了一支蜡笔,其反射率是20%左右。那这个Gamma是大于1的下压Gamma,它把0.5映射成了0.2。&/p&&br&&p&欣赏蜡笔画的时候,输入眼睛的亮度正比于颜料在画纸上实际的物理反射率,“输出值”就是我们心目中主观感受的灰阶。此时的Gamma上拱,小于1,可以把自然界的0.2的反射率,映射成心目中的0.5灰阶。&/p&&br&&p&看懂了吗?广义Gamma实际上描述的就是自然现实的物理量和主观视觉灰阶的映射关系。这个关系是非线性映射。&/p&&br&&p&从这个观点看的话,广义Gamma无处不在,而且极具启发性:&/p&&br&&p&我们最熟悉的铅笔素描,使用黑色铅笔涂抹暗部,白色是由白纸留白形成,那么其画面上的中灰部,铅笔覆盖率是多少?答案是80%,留下20%的纸面,这20%的反光,在我们心目中看起来是中灰色的概念。&/p&&br&&p&此时灰阶和谁形成了Gamma关系?“心目中的灰阶”对应“铅笔涂抹的工作量”。也就是说,人们只凭目测,天生就可以把自然界的画面,映射成正确的颜料覆盖率,在这个过程中,全凭视觉的主观判断。视觉感受主导了一切。说白了,&b&媒介上的灰阶分布,人是通过目测来调的&/b&。&/p&&br&&br&&p&&b&第六节:数字摄影和屏幕&/b&&/p&&br&&p&第四节中,3色一套、5色一套的蜡笔我们如果想得明白,那么推广到我们生产一盒256色的灰阶蜡笔,它们的反射率和蜡笔编号的映射关系,我们也是能想明白的:&/p&&br&&p&蜡笔反射率=蜡笔编号^Gamma&/p&&br&&p&256色的蜡笔想得明白的话,这256个灰阶和电脑屏幕的像素有区别吗?没有任何区别。纸张是画面媒介,屏幕也是画面媒介,区别只是反射率变成了像素的光强。&/p&&br&&p&屏幕光强=灰阶编号^Gamma&/p&&br&&p&为了把事儿说明白,我们先把8位每通道图像的数值,换算到0-1区间。8位图上0是黑,255是白,中灰色是128。换算以后,黑是0,白是1,中灰是0.5。&/p&&br&&p&要注意,8位每通道图像,灰阶预算极其有限,仅有256个,如同一盒256色的灰阶蜡笔。&/p&&br&&p&当我们在用数字相机拍照的时候,相当于对自然界采样,并把数据编码到图像文件中。&/p&&br&&p&假设光照适宜的场景中有一个中灰色的物体,反射率是白纸的0.2,我们采样到它的时候,应当把0.2的物理能量用0.454的Gamma放大到0.5的灰阶地位记录下来,这样一来,暗部区域就分配到128个灰阶了。我们充分地利用了存储空间。&/p&&br&&p&如果在拍照的时候不进行Gamma校正,那么中灰物体会被映射为0.2记录下来,那么此时,暗部仅分配到50个灰阶,暗部采样严重不足,高光采样冗余。&/p&&br&&p&来到屏幕上,也就是文件解码端,此时屏幕从计算机中读到一个0-1的渐变,也就是从黑到白的均匀过渡,图片如下:&/p&&img src=&/v2-60f7a1a582713affb6c8_b.jpg& data-rawwidth=&1200& data-rawheight=&397& class=&origin_image zh-lightbox-thumb& width=&1200& data-original=&/v2-60f7a1a582713affb6c8_r.jpg&&&p&其中左端的色彩值是0,中间的色彩值是128(0.5),右边是1.0的纯白。解码后,屏幕要以什么样的亮度显示这些像素呢?最左边像素关灯不显示,是黑色,中间以白色21.8%的亮度显示,右边像素全开,显示100%白色。这样的一个图片,在我们心目中看起来是均匀的灰度渐变。&/p&&br&&p&此时屏幕的解码Gamma是2.2,这个Gamma,会把0.5映射成0.218。&/p&&br&&p&从这个角度来看。其实眼睛跟“照相机”真的挺像,我们看见自然界0.2的东西,就把它映射成0.5的地位,记到脑子里了。&/p&&br&&br&&p&&b&总结&/b&&/p&&br&&p&总结段要说三个问题:&/p&&br&&ol&&li&2.2怎么来的
&/li&&li&为什么一直强调低动态图像
&/li&&li&如果灰阶预算不紧张,会怎么样
&/li&&/ol&&br&&p&&b&Gamma=2.2怎么来的?&/b&是实践中目测调整出来并最终确定的,其实说良心话,只要是0.5中灰对应白色的20%左右,画面看起来都是靠谱的,所以当年的Gamma特别多种多样,在2.2上下浮动(1.8-2.5),1996年微软和惠普在特定的光照条件下测试人观看显示器的感受,他们认为,把8位图像中128号灰(0.5灰)这个抽象的、代表心目中中灰色的数值,对应以白像素21.8%的亮度显示出来,由黑到白的渐变过渡看起来会比较均匀。最终对应的Gamma就是2.2。那么他们定了这个标准,后世的硬件也就都往上面靠了,包括拍照的时候,编码Gamma也就取了1/2.2=0.454。这样能保证整个编码解码系统总Gamma是1,高保真,自然界中的色值能在屏幕上相对完好的再现。&/p&&br&&p&&b&凡是说Gamma 2.2来自于老式CRT显示器物理特性的解释,都是误解。&/b&这个误解一般会这么讲解Gamma的来龙去脉:当年老式的CRT显示器内置Gamma 2.35左右,解码的时候会把输入信号压暗,所以我们呢,为了保证总Gamma接近1,就要预先在编码的时候把输入文件的信号提亮,而且这样一来呢,刚好顺应了人眼对暗部感兴趣的特点,把暗部的信息多多记录了下来,充分利用了文件的空间,真是美妙的巧合啊。讲起来顺畅,听起来也很美妙,我也曾经这么给别人讲,但是我发现我没法说服我自己,人类就被一个老式硬件的物理特性决定了后世的工业标准?这逻辑不对。这也是我反对某高票答案,自己过来写答案的原因。&/p&&br&&p&为啥错,比如当年要是没有先发明CRT显示器呢?假设我们先发明了一个物理Gamma为1的显示器。当输入8位图像0.5的数值的时候,它还是要乖乖的把这个0.5映射成白像素的20%输出出来。否则看起来就不是中灰,8位每通道的显示器Gamma必须在2.2左右,跟显示器发展史没关系,完全是视觉效果决定的。一切都因为韦伯定律。&/p&&br&&br&&p&&b&为什么一直强调低动态图像?&/b&这个其实涉及到“自然景象再现成画面”这样一个复杂的事情,自然界是高动态的,亮度可以非常亮,也可以有一些明亮的光源,所以我在描述中灰的物理量的时候,我不可能描述成场景中最亮的物体亮度的20%,这个&b&最亮&/b&的概念会非常不好确定。同一个明亮的场景中,中灰纸张应该是白纸反射率的20%而不是灯泡能量的20%。我如果把高亮物体牵涉仅来,事情就乱了。但是我可以用绘画举例子,画布的动态范围是有限的,最亮不过是画布上的留白,屏幕的动态范围也是有限的,最亮不过是白像素。所以在低动态范围的语境下,我可以安全的定义,中灰蜡笔的反射率是白色蜡笔的20%左右,中灰像素的亮度是白像素亮度的20%左右,而不是现实场景中最亮物体的20%。这一点是很关键的。&/p&&br&&br&&p&另外,&b&一切的前提必须是:灰阶预算很紧张&/b&,只有灰阶有限,我们才需要考虑中灰映射给谁的问题,&b&如果灰阶足足的够用&/b&,硬盘不要钱了,网线足够粗,我们主流不再使用8位每通道图片记录亮度信息的话,&b&Gamma是没必要的&/b&,我们直接把自然界的0.2记录在文件上,显示器读取到0.2,也直接显示就好了——32位每通道的hdr格式就是这样的。&b&32位格式中,中灰就被记作0.218&/b&,所以在32位环境中拉一个0-1的渐变是这样的,很明显暗部被压缩了,高光区很多:&/p&&img src=&/v2-91105fbe240de3cc9d3ab271a1a779b3_b.jpg& data-rawwidth=&1000& data-rawheight=&208& class=&origin_image zh-lightbox-thumb& width=&1000& data-original=&/v2-91105fbe240de3cc9d3ab271a1a779b3_r.jpg&&&p&这张图怎么理解?它还是0-1的均匀渐变,中间那个颜色还是0.5,只不过32位图中的数值就是自然界的物理量,所以这个色带对应的其实是现实中的反射率。左边五分之一20%处是中灰色,中间的像素表现的是反射率为白色50%的物体看起来的灰度,这个灰度是0.5^0.454=73%灰。也就是8位下的186灰。具象的说,如果我有一支蜡笔反射率是50%,看起来就是中间这个灰度。&/p&&br&&p&总之一句话:&b&灰阶有限的前提下,因为人眼对自然的非线性感知特性,我们才需要Gamma校正。&/b&&/p&&br&&p&具体到生活中的现象就是:因为我们硬盘太贵,网线太细,所以地球人目前主流使用8位每通道的sRGB色彩描述体系,它灰阶有限,中灰的地位必须在所有灰阶的中间,记录值为128,而不能是其物理值0.218,把物理量0.218换算成0.5灰阶编号的过程,就是编码端的Gamma校正,Gamma值为1/2.2=0.454。屏幕读取到128显示成21.8%的亮度的过程,就是解码端的Gamma校正,Gamma值为2.2。整个系统Gamma为1。若是有朝一日,32位每通道文件成为主流格式,Gamma校正就会消失。自然数据不经校正直接记录为文件数据,再不经校正直接显示。&/p&&br&&p&所以 &a class=&member_mention& href=&///people/3b714ef124f& data-hash=&3b714ef124f& data-hovercard=&p$b$3b714ef124f&&@渣渣&/a&和 &a class=&member_mention& href=&///people/4eb476f8bf4fbdccb351ce& data-hash=&4eb476f8bf4fbdccb351ce& data-hovercard=&p$b$4eb476f8bf4fbdccb351ce&&@疾风齿轮&/a&二位大大的解释是非常简洁有力的标准答案,我也是妥妥的给点赞,我作为一个喜欢刨根问底的硬件外行,CG爱好者,从另一个视角进行逻辑解读,分享一下个人对Gamma问题认知的过程,以飨读者。&/p&&br&&p&感谢 &a class=&member_mention& href=&///people/65b4e6c17fa87e& data-hash=&65b4e6c17fa87e& data-hovercard=&p$b$65b4e6c17fa87e&&@烈之斩&/a&&a class=&member_mention& href=&///people/4e0b9e9e2e3c37f62eb2fc& data-hash=&4e0b9e9e2e3c37f62eb2fc& data-hovercard=&p$b$4e0b9e9e2e3c37f62eb2fc&&@Ida Lin&/a&&a class=&member_mention& href=&///people/e827a61931b21fdcd4491& data-hash=&e827a61931b21fdcd4491& data-hovercard=&p$b$e827a61931b21fdcd4491&&@benman&/a&&a class=&member_mention& href=&///people/d3ddeeca01dcb30cf3bf43deb4562ffa& data-hash=&d3ddeeca01dcb30cf3bf43deb4562ffa& data-hovercard=&p$b$d3ddeeca01dcb30cf3bf43deb4562ffa&&@戴巍&/a& &a class=&member_mention& href=&///people/dc33abe7e08dafdba57ba48& data-hash=&dc33abe7e08dafdba57ba48& data-hovercard=&p$b$dc33abe7e08dafdba57ba48&&@TA123&/a& 等朋友关于这个话题的讨论,全文推翻重写,所以还是想反馈一下给各位。&/p&
以上视频是我一年前对Gamma的理解,最近有了更多体会,故把答案推翻重写,和大家分享一下。 我打算抛开计算机图像、显示器发展史等因素,从逻辑上推出一个“广义的Gamma”,这样其实是触及了问题的本质。把人对画面的认知,和Gamma出现的必然性都推理出来。…
很难比下面这个例子讲的更通俗了……&br&&img src=&/ea5805dfa621fc481ba7af9f800e2f52_b.jpg& data-rawwidth=&960& data-rawheight=&720& class=&origin_image zh-lightbox-thumb& width=&960& data-original=&/ea5805dfa621fc481ba7af9f800e2f52_r.jpg&&&br&&img src=&/7e9f7ca52a6ec75e4de3_b.jpg& data-rawwidth=&960& data-rawheight=&720& class=&origin_image zh-lightbox-thumb& width=&960& data-original=&/7e9f7ca52a6ec75e4de3_r.jpg&&&img src=&/3e78b2ddf5d2aecdc29f16_b.jpg& data-rawwidth=&960& data-rawheight=&720& class=&origin_image zh-lightbox-thumb& width=&960& data-original=&/3e78b2ddf5d2aecdc29f16_r.jpg&&&img src=&/ed0a3c4c7be4c0ac1e6f54_b.jpg& data-rawwidth=&960& data-rawheight=&720& class=&origin_image zh-lightbox-thumb& width=&960& data-original=&/ed0a3c4c7be4c0ac1e6f54_r.jpg&&&br&&img src=&/f33aa6c8daeb23a4b108a150c5852469_b.jpg& data-rawwidth=&960& data-rawheight=&720& class=&origin_image zh-lightbox-thumb& width=&960& data-original=&/f33aa6c8daeb23a4b108a150c5852469_r.jpg&&&br&引自:&br&&a href=&///?target=http%3A///view/187eecec856af5b.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&卡尔曼滤波器分类及基本公式&i class=&icon-external&&&/i&&/a&&br&&a href=&///?target=http%3A//blog.csdn.net/lanbing510/article/details/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&对Kalman(卡尔曼)滤波器的理解&i class=&icon-external&&&/i&&/a&&br&&br&了解到这里基本就可以套公式应用了。&br&如果想了解卡尔曼滤波的证明过程,可以参考这一篇&a href=&///?target=http%3A///kalman_filter.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/kalman_f&/span&&span class=&invisible&&ilter.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&卡尔曼有好多种变形,每本书的符号系统还不一样,看起来证明的样子五花八门。这一篇应该是最简洁的,虽然有些小错,看仔细点就好了。&br&希望对你有帮助~&br&相关问题:&a href=&/question/& class=&internal&&卡尔曼滤波算法的发展历史如何?&/a&
很难比下面这个例子讲的更通俗了…… 引自:
了解到这里基本就可以套公式应用了。 如果想了解卡尔曼滤波的证明过程,可以参考这一篇 卡尔曼有好多种变形,每本书的符号系统还…
—————————————————————————————————&br&不少同学希望谈谈学习方法,我本身也是学渣(考研数学80/150),没有资格谈啊。不过我最近修了&br&RICE大学在edx上的相关课程“&a href=&///?target=https%3A//courses.edx.org/courses/RiceX/ELEC301x/T1_2014/info& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&ELEC301x Discrete Time Signals and Systems&i class=&icon-external&&&/i&&/a&”,真的非常不错。初步总结, 有三大优点:&br&1.注重实践,有大量的matlab相关的案例内容;&br&&b&2.重离散、轻连续,这样创新的思路抛弃了直接研究连续带来的大量的理论负担,同时也非常实用;当然,如果要做研究,后面还是要重新认真学习连续的,这可能需要借助mit的课程了。&/b&&br&3.作业题有深度、有启发,是很好的训练。&br&&br&推荐下学习教材(鉴于大家批评我说这些书不好买,这里给出购买链接),&br&1.新手入门:&br&前驱知识,微积分、线性代数及格&br&优秀教材:&br&(1)&a href=&///?target=http%3A///Understanding-Digital-Signal-Processing-3rd/dp//ref%3Dsr_1_1%3Fs%3Dbooks%26ie%3DUTF8%26qid%3D%26sr%3D1-1%26keywords%3Dunderstanding%2Bdigital%2Bsignal%2Bprocessing& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Understanding Digital Signal Processing (3rd Edition): Richard G. Lyons: 5: : Books&i class=&icon-external&&&/i&&/a&&br&评价相当之高,注重理解,对数学要求不高&br&购买链接:&a href=&///?target=http%3A///.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&《国外高校电子信息类优秀教材经:数字信号处理(英文影印版)》([美]莱昂斯)【摘要 书评 试读】&i class=&icon-external&&&/i&&/a&&br&(2)&a href=&///?target=http%3A///Digital-Signal-Processing-Using-MATLAB/dp//ref%3Dsr_1_1%3Fs%3Dbooks%26ie%3DUTF8%26qid%3D%26sr%3D1-1%26keywords%3Ddigital%2Bsignal%2Bprocessing%2Busing%2Bmatlab& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Digital Signal Processing Using MATLAB: Vinay K. Ingle, John G. Proakis: 5: : Books&i class=&icon-external&&&/i&&/a&&br&大量引入matlab,注重动手实践增加认知,好像也是首个创新的直接讲解离散的教材。&br&公开课:&br&RiceX:&a href=&///?target=https%3A//courses.edx.org/courses/RiceX/ELEC301x/T1_2014/info& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&ELEC301x Discrete Time Signals and Systems&i class=&icon-external&&&/i&&/a&&br&也是直接进入离散主题、注重理解、注重matlab操作的好课程。&br&购买链接:&a href=&///?target=http%3A///%25E6%%25E5%25AD%%25BF%25A1%25E5%258F%25B7%25E5%25A4%%-%25E5%25BA%%MATLAB-Vinay-K-ingle/dp/B002WWUYZU/ref%3Dsr_1_5%3Fs%3Dbooks%26ie%3DUTF8%26qid%3D%26sr%3D1-5& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&《数字信号处理:应用MATLAB》 Vinay K.ingle, John G.Proakis【摘要 书评 试读】图书&i class=&icon-external&&&/i&&/a&&br&2.进阶:&br&我还在学,学完推荐&br&&br&谈谈学习成本:&br&经济成本:我推荐的书国内亚马逊都有正版,加起来二百出头,公开课需要v~P·N工具,一年二百左右。新东方一个破辅导班3000+,一部红米手机799.&br&时间成本:no pain, no gain。&br&&br&最后恬不知耻的秀秀rice给我的课程成绩,大家一定会做的更好。&br&下载链接&br&&a href=&///?target=https%3A///s/jf6vuc40oxcor2u/ELEC301x%2520Discrete%2520Time%2520Signals%2520and%2520Systems.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Dropbox - ELEC301x Discrete Time Signals and Systems.pdf&i class=&icon-external&&&/i&&/a&&br&&br&截图:&br&&img src=&/be944b5af97d_b.jpg& data-rawwidth=&819& data-rawheight=&534& class=&origin_image zh-lightbox-thumb& width=&819& data-original=&/be944b5af97d_r.jpg&&&br&&br&&br&————---------————我正在和论文搏斗 先给个简单答案吧——————————&br&对工科生来讲,傅里叶变换可以从三个层次来看:&br&傅里叶变换(Fourier Transform,FT)-& 离散傅里叶变换(Discrete Fourier Transform, DFT)-& 快速傅里叶变换(Fast Fourier Transform)&br&FT是理论基础,以FT为理论基础,可以完成从频率估计到求解微分方程各式各样的问题;&br&DFT是指信号被采样之后你会得到&b&离散&/b&(如你需要处理的音频信号被采样)而非&b&连续&/b&的信号,这个时候就需要DFT来告诉你怎样处理并告知你一些离散情况下的特殊问题;&br&FFT是一种计算DFT的算法,计算复杂度很低也就是执行起来很快的意思。&br&举个例子吧:有人通过在小黑屋按钢琴的一个键不松会产生一个单音信号给你传递情报,&br&&img src=&///equation?tex=y%28t%29%3D%5Csin%282%5Cpi+ft%2B%5Ctheta%29& alt=&y(t)=\sin(2\pi ft+\theta)& eeimg=&1&&&br&信号的频率&img src=&///equation?tex=f& alt=&f& eeimg=&1&&取决于他所按的键。你看不见他,却希望获知信号的频率。怎么办?&br&1.FT的理论就会告诉你可以通过傅里叶变化获知这个频率。&br&但是这个信号飘荡在空中,你需要先通过采样得到一个离散信号&br&&img src=&///equation?tex=y%5Bi%5D%3D%5Csin%282%5Cpi+%5Cfrac%7Bf%7D%7Bf_%7Bs%7D%7Di%2B%5Ctheta%29+%5C++%5C+%5C+%5C+%5C+%28i%3D1%2C2%2C...N%29& alt=&y[i]=\sin(2\pi \frac{f}{f_{s}}i+\theta) \
\ \ \ \ (i=1,2,...N)& eeimg=&1&&&br&(&img src=&///equation?tex=f_%7Bs%7D& alt=&f_{s}& eeimg=&1&&是采样频率,香农和奈奎斯特告诉我们,需要&img src=&///equation?tex=f_%7Bs%7D%3E2f& alt=&f_{s}&2f& eeimg=&1&&)。&br&2.得到离散信号后如何计算&img src=&///equation?tex=f& alt=&f& eeimg=&1&&,DFT就会告诉你怎么办;&br&3.你嫌DFT太慢了怎么办,FFT就粉墨登场了。&br&&br&从你计算机的专业背景和希望做音频降噪的需求来看。你需要掌握的是DFT和FFT我建议&br&1. 找本高等数学的书,花半个小时看看什么是FT;&br&2. 强烈推荐《Understanding Digital Signal Processing》,一本只需高中数学,且英文比中文都易懂的书,在&a href=&///?target=http%3A//& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&上有很高的评价(&a href=&///?target=http%3A///Understanding-Digital-Signal-Processing-Edition/dp//ref%3Dsr_1_1%3Fie%3DUTF8%26qid%3D%26sr%3D8-1%26keywords%3Dunderstanding%2Bdigital%2Bsignal%2Bprocessing& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Understanding Digital Signal Processing (3rd Edition): Richard G. Lyons: 5: : Books&i class=&icon-external&&&/i&&/a&),国内有卖,建议认真看第1、2、3章。你会对离散傅里叶变换有很深入的了解;&br&3. 实践出真知,看完什么理论,立马用matlab试试看,会理解的很透彻;&br&4. project可以沿着matlab-&VC-&DSP-&FPGA的道路前进。&br&&br&至于你说的语音降噪问题,需要首先用DFT分析信号与噪声的频率特性,&b&降噪&/b&需要设计滤波器完成。变化与滤波是信号处理的两大主题,看看《Understanding Digital Signal Processing》的后面几章就明白了。&br&&br&语音降噪问题已经发展成为一个成熟的子学科,要做进一步研究就需要你自己努力了。
————————————————————————————————— 不少同学希望谈谈学习方法,我本身也是学渣(考研数学80/150),没有资格谈啊。不过我最近修了 RICE大学在edx上的相关课程“”,…
曾经有一个手机系统叫WP,WP手机由于系统设置,添加黑名单号码必须在对话框手动确认一次。&br&有个程序员开发了一款屏蔽垃圾电话的软件,向手机导入2000+个黑名单电话号码。由于WP系统的原因,需要用户手动点击2000+次。&br&软件开发者给出的建议是,使用投影模式在PC上,然后使用鼠标连点器完成这一操作。并且给出了一段话:&br&&b&“不要问为什么这么麻烦,要问你自己为什么买WP手机!”&/b&&br&&br&OV的手机产品,由于高价低配,利润都给了门店租金,营销人员收入,明星代言费等。广受数码爱好者诟病。我看到这个帖子的时候也有这一种惊叹,&b&“买OV的消费者,不应该是一点也不懂手机吗??为什么他们还了解安卓版本??渴求升级??”&/b&。&br&其实上面这句话也适用于今天。&br&&b&“不要问为什么升级不了系统,要问你自己为什么买OV手机!”&/b&&br&&br&&br&&b&============================更新===========================&/b&&br&&b&没想到这么多点赞啊,关于WP系统的事情,早期“支付婊事件”时期,WP系统确实问题多多,饱受诟病。当年哪些截图现在依然可以找到&/b&&br&&br&&br&&img src=&/v2-5a00c6ac1e34707bcdbed_b.jpg& data-rawwidth=&423& data-rawheight=&750& class=&origin_image zh-lightbox-thumb& width=&423& data-original=&/v2-5a00c6ac1e34707bcdbed_r.jpg&&&img src=&/v2-965f31f33eb627f5b5f055eeae41d237_b.jpg& data-rawwidth=&451& data-rawheight=&750& class=&origin_image zh-lightbox-thumb& width=&451& data-original=&/v2-965f31f33eb627f5b5f055eeae41d237_r.jpg&&&img src=&/v2-8d4a049a6c65277dfd3fbb8_b.jpg& data-rawwidth=&451& data-rawheight=&750& class=&origin_image zh-lightbox-thumb& width=&451& data-original=&/v2-8d4a049a6c65277dfd3fbb8_r.jpg&&&img src=&/v2-5b6f2d0d20d0ff5e9ff8_b.jpg& data-rawwidth=&451& data-rawheight=&750& class=&origin_image zh-lightbox-thumb& width=&451& data-original=&/v2-5b6f2d0d20d0ff5e9ff8_r.jpg&&&img src=&/v2-7fb7d481a62d734b6096dad45fd9e0c8_b.jpg& data-rawwidth=&422& data-rawheight=&750& class=&origin_image zh-lightbox-thumb& width=&422& data-original=&/v2-7fb7d481a62d734b6096dad45fd9e0c8_r.jpg&&&img src=&/v2-b8f2e9e9fdd5d3f734e2d9f_b.jpg& data-rawwidth=&423& data-rawheight=&750& class=&origin_image zh-lightbox-thumb& width=&423& data-original=&/v2-b8f2e9e9fdd5d3f734e2d9f_r.jpg&&&img src=&/v2-614de69efcdb2a60ad59a1a2eae0cd0c_b.jpg& data-rawwidth=&360& data-rawheight=&640& class=&content_image& width=&360&&
曾经有一个手机系统叫WP,WP手机由于系统设置,添加黑名单号码必须在对话框手动确认一次。 有个程序员开发了一款屏蔽垃圾电话的软件,向手机导入2000+个黑名单电话号码。由于WP系统的原因,需要用户手动点击2000+次。 软件开发者给出的建议是,使用投影模式…
谢&a href=&/people/moheng-esther& class=&internal&&刘柯&/a&邀&br&&br&可以从光和机械波的两个主要区别来分析这个问题:能量区别和频率区别&br&&b&1.光与声(机械波)的频率和能量&/b&&br&大家可能都非常容易理解,一个光子的能量跟一个机械波的能量不在一个数量级。实际上,讨论单个光子的能量也没有多大的意义,因为人是在地球的自然环境之中生存的,人最需要感知的是自然界的光照(源自太阳)和自然界的声音(60db左右)。我们可以先考察一下阳光的能量随频率(波长)的分布:&br&&img src=&/a28c63c1f87afea4d6da3_b.jpg& data-rawwidth=&1280& data-rawheight=&960& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&/a28c63c1f87afea4d6da3_r.jpg&&可以看到,无论是在被大气层吸收前,还是在被大气层吸收之后,&b&太阳光谱中能量最高的部分,恰好就是我们视觉感知的光谱部分(波长380-750nm),我们据此可以定义这个频率段为最优频率段&/b&。波长的不同给我们的感官区别在于颜色的不同。&br&&img src=&/3ae1a4fc491ebda5008545_b.jpg& data-rawwidth=&1024& data-rawheight=&195& class=&origin_image zh-lightbox-thumb& width=&1024& data-original=&/3ae1a4fc491ebda5008545_r.jpg&&&br&这当然绝非偶然,而是由数十亿年的地球生物与环境的演化导致的。&br&太阳光在地面的能量密度大概在1.3KW每平方米,但是我们的人眼一般并不是直视太阳,而且并不感知全部的光谱。&br&&img src=&/500ea19408bcdf47588a7_b.jpg& data-rawwidth=&535& data-rawheight=&476& class=&origin_image zh-lightbox-thumb& width=&535& data-original=&/500ea19408bcdf47588a7_r.jpg&&单位面积吸收的可见光的能量强度衡量单位之一是照度(Illuminance),居家环境的照度大概为300勒克斯。对于自然光来说,每W每平米的能量密度对应大概600勒克斯的光通量。据此,我们可以大概的估算,自然环境中(人眼接受的)光照的吸收能量密度为2瓦每平米。&br&&img src=&/9d6b2d3f_b.jpg& data-rawwidth=&690& data-rawheight=&475& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&/9d6b2d3f_r.jpg&&考虑到人眼的机构特性,瞳孔面积会随着光照的强度自动的变化。瞳孔(Pupil 考虑为圆形)半径通常在1到3.5mm之间变化,自然光下瞳孔半径较小,为简化计算取值为1mm。那么,摄入人眼的光照功率为2×10^(-6)*1^2*3.14. 约为6×10^(-6)W,为只眼睛在自然光下接受的光照功率。这属于日常生活中比较强的光照情况。&br&&br&对于人耳来说,其感知振动的机构主要为骨膜,但是声音传导的介质除了空气外,还有头骨、皮肤等&br&&img src=&/43d6a99784_b.jpg& data-rawwidth=&600& data-rawheight=&366& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&/43d6a99784_r.jpg&&&br&&br&人耳对不同的频率,感知灵敏度不同。&br&&img src=&/70de765ccfde6f_b.jpg& data-rawwidth=&486& data-rawheight=&250& class=&origin_image zh-lightbox-thumb& width=&486& data-original=&/70de765ccfde6f_r.jpg&&听觉的频率范围主要在20到20KHz,波长大概在17mm到17m之间。&b&人耳感知的能量范围在10^(-12) ~&/b&&b& 10瓦每平米。总体上能量密度比光照的能量密度高多了&/b&。&br&我们或许不能像在光照的情况中定义最优频率段一样定义声音的最优频率段,但是考虑的生物界,特别是主要生活在空气环境中的生物的听觉频率范围都跟人类的大同小异,可以置信的认为,&b&人耳的听觉频率段也是自然界声音中的最优频率段,是信息最丰富的部分。&/b&&br&&img src=&/ea710e0107dbbc79bc11ae39c451bccd_b.jpg& data-rawwidth=&959& data-rawheight=&768& class=&origin_image zh-lightbox-thumb& width=&959& data-original=&/ea710e0107dbbc79bc11ae39c451bccd_r.jpg&&&ul&&li&&b&可见光的频率范围(自然光最优频段)为4~8×10^(14)Hz,由于频率高,波长短,其穿透性能差,不能绕过自然界中常见的障碍物传播。而声波(自然界声波最优频段)的频率低,波长长,能绕过大部分常见的障碍物。&/b&&br&&/li&&li&&b&由于光的频率高,作为载波,它能承担更多的信息,具有更高的空间分辨率和时间分辨率。而声音在这两个方面则是落后很多。&/b&&/li&&/ul&&b&2.光感与声感&/b&&br&&b&由于光照的功率太小,而且具有极高的空间分辨率和时间分辨率,要充分的感知其中的信息,人需要很多细胞高密度的分布在小的区域内,并且以快速光化学反应的方式转换光信号成神经信号。&/b&&br&&img src=&/fdd6ea3ff5db_b.jpg& data-rawwidth=&600& data-rawheight=&366& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&/fdd6ea3ff5db_r.jpg&&在人眼的视网膜上,主要有两种感光细胞:视杆细胞(Rod)和视椎(Cone)细胞 [1]。视杆细胞有大概一亿两千万个,在视网膜上广泛分布,但是他们不能感知色彩,只感知光感,在光线不足的情况下,主要是视杆细胞作用,因此我们在晚上看不见色彩。视锥细胞则仅有7~8百万个,主要分布在视网膜最为敏感的黄斑区(fovea)。并且对色彩敏感。按照对不同色彩(红绿蓝)的敏感性,可以进一步的划分三种视锥细胞:短波(S)、中波(M)、长波(L)视锥细胞。&br&&img src=&/fa4aea25be28_b.jpg& data-rawwidth=&600& data-rawheight=&376& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&/fa4aea25be28_r.jpg&&分别对蓝色、绿色和红色最为敏感。要注意各种视锥细胞也能感知其他色彩,只是对应的放电强度不如最为敏感的颜色。人能产生颜色的感觉,来自三种视锥细胞对不同波长光线的神经信号差异,&b&人能感知的所有颜色可用这三组信号的强弱表示&/b&。也就是说&b&RGB色彩的混合,是人脑在视觉信息处理的时候人工混合的。&/b&&br&&br&三原色是人的色觉系统决定的,甚至不适用于其它动物(猫、狗等就有不同于人类的感光细胞)。&b&我们用三原色可以混合出其它颜色,是因为我们的视觉系统无法区分其他的颜色的神经信号和三种神经信号混合的信号。&/b&而物理上根本不存在颜色,不同颜色的光本质是不同波长的电磁波,颜色是视觉系统进化来的功能,以便于在大自然中识别不同的事物。&br&&br&&b&这种细胞结构、功能、和分布为我们的视觉的高空间分辨率分辨率提供了基础。&/b&&br&&br&在时间分辨率上,靠的是极快的光化学反应。以视竿细胞为例:&br&&img src=&/29b71a84ee55f11ac7c9ea478bb29071_b.jpg& data-rawwidth=&425& data-rawheight=&514& class=&origin_image zh-lightbox-thumb& width=&425& data-original=&/29b71a84ee55f11ac7c9ea478bb29071_r.jpg&&其中关键的一步,是11-顺式视黄醛(11-cis-retinal)在光照下异构为全反式视黄醛(all-trans-retinal),使视紫红质(rhodopsin)构象发生变化,启动了对大脑的神经脉冲,从而形成视觉。&br&&img src=&/2b520994eda0dbeb921ee1_b.jpg& data-rawwidth=&710& data-rawheight=&395& class=&origin_image zh-lightbox-thumb& width=&710& data-original=&/2b520994eda0dbeb921ee1_r.jpg&&&b&反应速度在10^(-12)秒(皮秒)量级,为视觉极高的时间分辨率提供了基础&/b&。&br&&br&&b&在听觉上,由于声音的频率低,我们因此并不需要太高的空间分辨率和时间分辨率。我们对声音空间的感知是通过两只耳朵的声音时间差来计算的。在时间分辨率上,机构也是非常粗糙。&/b&&br&&img src=&/cc0defdf5b78d44dd2a3ea80b661d927_b.jpg& data-rawwidth=&983& data-rawheight=&552& class=&origin_image zh-lightbox-thumb& width=&983& data-original=&/cc0defdf5b78d44dd2a3ea80b661d927_r.jpg&&感知听觉的最小机构是听毛细胞,他会随着声音(机械波)振动,转化为神经电位。能翻墙的各位可以看youtube视频:随音乐起舞的听毛细胞:&br&&a href=&///?target=https%3A///watch%3Fv%3DXo9bwQuYrRo& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://www.&/span&&span class=&visible&&/watch?&/span&&span class=&invisible&&v=Xo9bwQuYrRo&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&&br&&b&总结:&/b&&br&&ol&&li&&b&我们感知的听觉和视觉范围都是经过数亿年演化来的,这两个频率范围是分别是自然界中光和声的信息最丰富的频率范围。&/b&&/li&&li&&b&由于光和声音的能量密度不同,导致他们能触发的反应机制不同。触发光化学反应仅仅需要很少的能量,而触动细胞振动(听毛细胞)则需要较大的能量&br&&/b&&/li&&li&&b&光的频率高,空间分辨率极高,这需要视网膜上的神经细胞高密度的存在;声音的空间分辨率低,则不需要那么多细胞集中分布&/b&&/li&&li&&b&光的时间分辨率极高,只有光化学反应能够支持;声音的时间分辨率低,细胞随之振动就足够&/b&&/li&&li&&b&光的频率差异导致色觉,声的频率差异导致音高感知的差异。但是他们对一个人的重要性不同。色觉对每个人的视觉理解很重要,因此每个人都有很高的色觉辨识能力,而音高对除了音乐家之外的大部分人的生存则没有太大的影响,因此大部分人的音高辨识能力都非常可怜。&/b&&/li&&li&&b&视觉和听觉的机构,似乎都是本着“够用”、“好用”的原则,使用最少的资源来达成最大的目的&/b&&/li&&/ol&--------&br&[1] Standring, Susan. &Gray’s anatomy.& &i&The anatomical basis of clinical practice &/i&39 (2008).
谢邀 可以从光和机械波的两个主要区别来分析这个问题:能量区别和频率区别 1.光与声(机械波)的频率和能量 大家可能都非常容易理解,一个光子的能量跟一个机械波的能量不在一个数量级。实际上,讨论单个光子的能量也没有多大的意义,因为人是在地球的…
MP3编码的问题在互联网上问的太多了,正好我在字幕组压片,对这方面比较了解。下面我用实验来讲解一下三种MP3编码格式。&br&&br&CBR、VBR、ABR是MP3使用的三种编码方式,简单地说,&b&MP3的大小=&/b&&b&平均比特率&/b&&b&(码率)&/b&&b&x时长&/b&。时长相等的情况下,就要看平均比特率的影响。&br&&br&整个实验的音频文件可以在这里下载:&br&&a href=&///?target=http%3A///share/link%3Fshareid%3Duk%3D& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/share/lin&/span&&span class=&invisible&&k?shareid=127922&uk=&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&&br&下面实验开始:&br&&b&第一步,建立文件&/b&&br&1. 我选取花泽香菜的《恋爱循环》无损WAV的前1分钟作为&b&有声音源&/b&(香菜萌音经典曲哦~~)。&br&&br&2. 拔掉麦克风的情况下,在Windows 7的CMD里运行命令&br&“SoundRecorder.exe /duration 0:01:00 /file d:\无声.wav”&br&生成一段1分钟整的&b&无声音源&/b&。&br&&br&3. 它们的大小均为10M,可能会有几个bit的差异,但是不影响。这个可以直接在前面给出的下载地址下载查看。&img src=&/cc8ea9befbe7eab_b.jpg& data-rawwidth=&481& data-rawheight=&76& class=&origin_image zh-lightbox-thumb& width=&481& data-original=&/cc8ea9befbe7eab_r.jpg&&用GoldWave查看两者的波形图如下:&br&恋爱循环:&img src=&/cd62d5d87f5f609b168a_b.jpg& data-rawwidth=&824& data-rawheight=&584& class=&origin_image zh-lightbox-thumb& width=&824& data-original=&/cd62d5d87f5f609b168a_r.jpg&&&br&无声:&img src=&/c89c0e93cf1de73e426e_b.jpg& data-rawwidth=&824& data-rawheight=&584& class=&origin_image zh-lightbox-thumb& width=&824& data-original=&/c89c0e93cf1de73e426e_r.jpg&&&br&&br&&br&&b&第二步,用CBR 320kbps分别压缩音源。&/b&&br&1. 我使用字幕组压片常用的MeGUI搭配其中的Lame mp3编码核心进行压缩。参数设定CBR 320kbps,输出格式.mp3。&br&&br&2. 分别压缩两个WAV音源,得到如下的结果:&img src=&/a79a0d25c37_b.jpg& data-rawwidth=&464& data-rawheight=&65& class=&origin_image zh-lightbox-thumb& width=&464& data-original=&/a79a0d25c37_r.jpg&&&b&两者大小完全相同,1字节都不差。&/b&&br&&br&3. 理论依据:&br&参看维基娘: &a href=&///?target=http%3A//zh.wikipedia.org/wiki/CBR& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&zh.wikipedia.org/wiki/C&/span&&span class=&invisible&&BR&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&以及不可考的可靠讲解:&br&&b&CBR(Constant Bitrate),常数比特率。&/b&指文件从头到尾都是一种位速率。相对于VBR和ABR来讲,它压缩出来的文件体积很大,但音质却不会有明显的提高。&br&&br&简单地说,就是&b&全程固定比特率的压缩方式,不管你的分段数据量,我都用一个码率全程编码。&/b&根据公式&b&MP3的大小=&/b&&b&平均比特率&/b&&b&(码率)&/b&&b&x时长&/b&,两者时长相同码率相同,大小必然相同。&br&&br&&br&&b&第三步,用ABR 320kbps分别压缩音源。&/b&&br&1. 同样使用MeGUI和Lame mp3。参数设定ABR 320kbps,输出格式.mp3。&br&&br&2. 分别压缩两个WAV音源,得到如下的结果:&img src=&/aa9aba4c9fff4f8f784139_b.jpg& data-rawwidth=&458& data-rawheight=&62& class=&origin_image zh-lightbox-thumb& width=&458& data-original=&/aa9aba4c9fff4f8f784139_r.jpg&&可以看出来&b&两者大小不同,并且相差非常大!&/b&(233KB大小好喜感≧▽≦)&br&比较平均码率,恋爱循环285kbps,无声31kbps。&br&&br&3. 理论依据:&br&参看维基娘:&a href=&///?target=http%3A//zh.wikipedia.org/wiki/ABR& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&zh.wikipedia.org/wiki/A&/span&&span class=&invisible&&BR&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&以及不可考的可靠讲解:&br&&b&ABR(Average Bitrate)平均比特率。&/b&是VBR的一种插值参数。Lame针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR也被称为“Safe VBR”,它是在指定的平均Bitrate内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量。举例来说,当指定用192kbps ABR对一段wav文件进行编码时,Lame会将该文件的85%用192kbps固定编码,然后对剩余15%进行动态优化:复杂部分用高于192kbps来编码、简单部分用低于192kbps来编码。与192kbps CBR相比,192kbps ABR在文件大小上相差不多,音质却提高不少。ABR编码在速度上是VBR编码的2到3倍,在128-256kbps范围内质量要好于CBR。可以做为VBR和CBR的一种折衷选择。&br&&br&简单地说,ABR我设定了320kbps的参数,但是并不会真的以320kbps压缩,而是在音频的不同部分动态调整比特率(码率)。&b&低频和不敏感频率使用相对低的码率,高频和大动态表现时使用高码率。&/b&这样无声的音频从头到尾都是无声,于是码率一直处于最低。根据公式&b&MP3的大小&/b&&b&=&/b&&b&平均比特率&/b&&b&(码率)&/b&&b&x时长&/b&,两者时长相同,比特率无声非常低,文件大小相差很大。&br&&br&&br&&b&第四步,用VBR q=0分别压缩音源。&/b&&br&1. 同样使用MeGUI和Lame mp3。参数不能指定码率,只能指定质量q,就用q=0参数统一变量,输出格式.mp3。&br&&br&2. 分别压缩两个WAV音源,得到如下的结果:&img src=&/1c4cab4dff4ca9b525409_b.jpg& data-rawwidth=&420& data-rawheight=&71& class=&content_image& width=&420&&可以看出&b&两者大小依然不同,还是相差非常大!&/b&(又是233,这也是必然吧~)&br&比较平均码率,恋爱循环254kbps,无声31kbps。&br&&br&3. 理论依据:&br&参看维基娘:&a href=&///?target=http%3A//zh.wikipedia.org/wiki/VBR& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&zh.wikipedia.org/wiki/V&/span&&span class=&invisible&&BR&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&以及不可考的可靠讲解:&br&&b&VBR(Variable Bitrate)动态比特率&/b&。也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确定使用什么比特率。这是Xing发展的算法,他们将一首歌的复杂部分用高Bitrate编码,简单部分用低Bitrate编码。主意虽然不错,可惜Xing编码器的VBR算法很差,音质与CBR相去甚远。幸运的是,Lame完美地优化了VBR算法,使之成为MP3的最佳编码模式。这是以质量为前提兼顾文件大小的方式,推荐编码模式。&br&&br&简单地说,&b&VBR完全没有码率限制,&/b&仅仅是控制音频质量,你要多高质量,我就按照那个质量编码,编码出来每一段的数据量有多少就给那一段分配多少的比特率。&b&ABR可以说是CBR和VBR的折中方案。&/b&同样无声基本没有数据量,也就非常小了。根据公式&b&MP3的大小&/b&&b&=&/b&&b&平均比特率&/b&&b&(码率)&/b&&b&x时长&/b&,两者时长相同,比特率无声非常低,文件大小相差很大。&br&P.S. 再重复一遍,相关实验数据文件可以在上面给出的链接下载。&br&&br&&br&&br&&br&&b&总结:&/b&&br&一段有声音的 MP3 文件和一段长度相等完全无声的 MP3 大小,&b&可能相等也可能不等&/b&。 根据公式&b&MP3的大小&/b&&b&=平均比特率&/b&&b&(码率)&/b&&b&x时长,&/b&时长相同的情况下,比特率受到&b&编码参数的设定&/b&、&b&编码方式的选择(数据内容)&/b&以及&b&编码器本身的算法&/b&等不同}

我要回帖

更多关于 小波分解原理 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信