利用对声速和声衰减测量研究物质特性已应用于很广的范围。测出在空气中,实际的吸收系数比19世纪G.G.斯托克斯和G.R.基尔霍夫根据粘性和热传导推出的经典理论值大得多,在液体中甚至大几千倍、几万倍。这个事实导致了人们对弛豫过程的研究,这在对液体以及它们结构的研究中起了很大作用(见声吸收)。对于固体同样工作已形成从低频到起声频固体内耗的研究,并对诸如固体结构和晶体缺陷等方面的研究都有很大贡献。
表面波、声全息、声成像、非线性声学、热脉冲、声发射、超声显微镜、次声等以物质特性研究为基础的研究领域都有很大发展。
瑞利时代就已经知道的表面波,现已用到微波系统小型化发展中。在压电材料(如石英)上镀收发电极,或在绝缘材料(如玻璃)上镀压电薄膜都可以作成表面波器件。声表面波的速度只有电磁波的十万分之几,相同频率下波长短得多,所以表面波器件的特点是小,在信号存储上和信号滤波上都优于电学元件,可在电路小型化中起很大作用。
声全息和声成像是无损检测方法的重要发展。将声信号变成电信号,而电信号可经过电子计算机的存储和处理,用声全息或声成像给出的较多的信息充分反应被检对象的情况,这就大大优于一般的超声检测方法。固体位错上的声发射则是另一个无损检测方法的基础。
声波在固体和液体中的非线性特性可通过媒质中声速的微小变化来研究,应用声波的非线性特性可以实现和研究声与声的相互作用,它还用于高分辨率的参量声呐(见非线性声学)中。 用热脉冲产生的超声频率可达到1012Hz以上,为凝聚态物理开辟了新的研究领域。
次声学主要是研究大气中周期为一秒至几小时的压力起伏。火山爆发、地震、风暴、台风等自然现象都是次声源。研究次声可以更深入地了解上述这些自然现象。次声在国防研究上也有重要应用,可以用来侦察和辨认大型爆破、火箭发射等。大气对次声的吸收很小,比较大的火山爆发,氢弹试验等产生的次声绕地球几周仍可被收到,可用次声测得这些事件。固体地球内声波的研究已发展为地震学。
研究液氦中的声传播也很有意义。早在40年代,Л·Д·朗道就预计液氦温度低于λ 点时可能有周期性的温度波动,后来将这种温度波称为第二声,而压力波为第一声。对第一声和第二声的研究又得到另外两种声:第三声超流态氦薄膜上超流体的纵波,第四声多孔材料孔中液氦中超流体内的压缩波。深入研究这些现象都已经成为研究液氦的物理特性尤其是量子性质的重要手段(见量子声学)。
声波可以透过所有物体:不论透明或不透明的,导电或非导电的,包括了其他辐射(如电磁波等)所不能透过的物质。因此,从大气、地球内部、海洋等宏大物体直到人体组织、晶体点阵等微小部分都是声学的实验室。近年来在地震观测中,测定了固体地球的简正振动,找出了地球内部运动的准确模型,月球上放置的地声接收器对月球内部监测的结果,也同样令人满意。进一步监测地球内部的运动,最终必将实现对地震的准确预报,从而避免大量伤亡和经济损失。
主要研究语言的分析、合成和机器识别问题。录放声设备和电子计算机的发展在这些工作中起了很大促进作用。已作到语言可以根据打字文稿按声学规律合成声音,有限词汇的口语可以用机器自动识别,口语也可以转化为电码或由电码再转换为声音(声码器)并保存原来口语的特性。现在语言通信的设备还比较复杂,系统的质量和局限还有待于改进。这种改进不仅是技术上的,更重要的是对语言的产生和感知的基本理解。这只有深入进行语言和听觉的基础研究才能得到解决,而不是近期所能完成的(见语言声学)。
听觉过程涉及生理声学和心理声学。能定量地表示声音在人耳产生的主观量(音调和响度),并求得与物理量(频率和强度)的函数关系,这是心理物理研究的重大成果。还建立了测听技术和耳鼓声阻抗测量技术,这是研究中耳和内耳病变的有效工具。在听觉研究中,所用的设备很简单,但所得结果却惊人的丰富。1961年物理学家
G.von贝凯西曾由于在听觉方面的研究工作获得诺贝尔医学或生理学奖,这是物理学家在边缘学科中的工作受到了承认的例子。主要由于对神经系统和大脑的确切活动和作用机理不明,还未形成完整的听觉理论,但这方面已引起了很多声学工作者的重视,从20世纪50年代以来已取得很大成绩。通过大量的生理、心理物理实验可得出若干结论,并提出一些设想:声音到达人耳后,耳把它转换为机械振动,经中耳放大后再到达内耳,使蜗管中的基底膜发生共振。传感单元是基底膜上的内外两排毛细胞。外毛细胞基本是一排化学放大器,把振动传到内毛细胞,激发其弯曲振动,振动达到某阈值以上时,与内毛细胞接触的神经末梢就发出电脉冲,把信号通过神经系统送入大脑。与内毛细胞联结的神经核主要对基底膜振动速度响应,而外毛细胞响应于基底膜的位移。神经信号为几十毫伏的电脉冲,脉冲延续时间约几十毫秒。信号就通过神经脉冲送入大脑,图4是设想的流程图,从大脑再把信号分配到大脑皮层的各个中心,进行储存、分析、积分或抛弃。这是初步的理解,要建立起完整的听觉理论,解释所有听觉现象,还需要做大量的工作,这涉及到对大脑功能的研究。
在语言和听觉范围内,基础研究导致很多重要医疗设备的生产:整个装到耳听道内的助听器;保护听力的耳塞,为声带损伤病人用的人工喉,语言合成器,为全聋病人用的触觉感知器和人工耳蜗等等。
一般来说,固体传播比水传播的速度快,水传播比空气传播的速度快。
声学在医疗方面的应用包括超声辅助诊断和超声治疗。
超声辅助诊断,最常见的就是B型超声成像,简称B超。通常这种超声诊断应用于腹部非侵入成像。其他常见类型的超声成像-辅助诊断是M超,即心动超声。与X线和CT相比,超声成像的优势在于对人体没有任何辐射伤害。声波是一种机械波,在穿过体内组织的同时也有部分声波反射,通过接受并且处理这些信息丰富的反射声波,我们可以利用这些信息形成体内实时的灰阶图像。在软组织成像中,效果比X光成像要好,但是由于骨头对超声有强烈的反射和吸收作用,因此经颅B-超成像还处于起步阶段,国外已有报道使用相控换能器进行B-超经颅成像。它的价钱便宜,成像速度快,准确性高,无副作用,都是至今超声在腹部常规检查中不可替代原因。临床使用的超声辅助诊断技术还包括利用多普勒效应查体内运动(包括胎儿运动及血管内血液的流速等),
超声治疗,利用超声波是机械波的特性,利用机械波周期震荡的特点,有着不同的临床应用。神经外科在脑的深部用聚焦的超声波造成破坏,治疗脑肿瘤、帕金森综合症、脑血栓等,这样的治疗手段,不仅减少对脑部的损伤(可以进行非开颅手术治疗),而且不影响大脑的其他部分的功能。普通外科中,利用聚焦超声治疗腹部肝脏肿瘤,妇科肿瘤,前列腺癌,膀胱癌,都有显著的疗效。牙科用超声钻钻牙而丝毫不影响软组织,可以大大减少病人的不适。
声学在医学中还有很多可以应用的方面,但发展都很不够或根本未发展,特别是在治疗方面,主要原因是不能确定适当的剂量。中国科学院声学研究所牛凤岐教授,天津医科大学的菅喜岐教授,重庆医科大学的王智彪教授,对聚焦超声的理论、仿真和临床应有有着深入的研究,剂量问题也是他们的研究重点之一。
当代重大环境问题之一是噪声污染,社会上对环境污染的意见(包括控告)有一半是噪声问题。除了长期在较强的噪声(90dB以上)中工作要造成耳聋外,不太强的噪声对人也会形成干扰。例如噪声级到70dB,对面谈话就有困难,50dB环境下睡眠、休息已受到严重影响。近年来,对声源发声机理的研究受到注意,也取得了不少成绩。例如,撞击声、气流声、机械振动声等的理论研究都取得重要成果,根据噪声发生的机理可求得控制噪声的有效方法。
振动对人危害也很大,虽然影响的人数比噪声少一些。常日手持凿岩机的矿山工人受振动危害严重时可得到白指病,甚至手指会逐节掉下。全身振动则可达到感觉不适、工作效率降低及至肌体损伤的程度,也应加以保护。对振动的保护一般采取质量弹簧系统或阻尼材料(见隔振、减振)。控制振动也是降低噪声的基本办法。
噪声控制中常遇到的声源功率范围非常大,这也增加了噪声控制工作的复杂性。例如一个大型火箭发动机的噪声功率可开动一架大型客机,而大型客机的噪声功率可开动一辆卡车。工业交通事业的进一步发展,其关键之一是降低噪声。噪声污染是工业化的后果,而降低噪声又是改善环境、提高人的工作效率、延长机器寿命的重要措施。 声学(代码:070203W)属于理学大类,物理学类。
学位:授予理学学士学位 本专业主要培养具有坚实系统的应用声学与信息科学基础,并掌握相应的电子技术、计算机技术及声学测量技术,能够适应高科技发展以及经济、教育等多方面的需要,从事科研、开发和教学的高层次人才。
通过学习,将具备了以下几方面的能力:
1、具备扎实的数理基础,宽阔的科学视野和一定的科研能力、创新能力;
2、掌握计算机软、硬件基础知识,较系统地掌握本学科的基本理论、基本知识、基本技能和基本方法;
4、具有较强的分折问题和解决问题的能力和综合实践能力;
5、了解国内外该学科发展的动态和趋势。
南京大学(10284)、北京大学(10001)、北京理工大学(10007)、北京师范大学(10027)、大连理工大学(10141)、西北工业大学(10699)、同济大学(10247)、中国科学技术大学(10358)、清华大学(10003)、复旦大学(10246)、南开大学(10055)、浙江大学(10335)、中国人民大学(10002)、国防科学技术大学(90002)、湖南师范大学(13250)、华东师范大学(10269)、华中科技大学(10487)、厦门大学(10384)、重庆大学(10611)、上海师范大学(10270)、中央民族大学(10052)等。
本文原创,首发于八零音乐论坛
发烧,从测量你的环境声学开始(二) 设备校准 中,讲了如何用简便的方法校准手里的器材。
在最后的这个帖子中,讲一下我的实际测量结果,和大概的分析。
基准【拉上窗帘,无室内环境处理,无EQ】
EQ【在基准的基础上,在低音炮上做了PEQ,我的低音炮支持三组PEQ】
拉开窗帘【在EQ基础上,拉开了窗帘,完整的露出玻璃,玻璃面积大约8平方米】
简易处理【在EQ基础上,改变室内物品摆位,额外挂上了一个布帘(如第一张图)】
首先,测试麦克风要放在皇帝位上。指向天空。
然后下图是我实际的测量位, 周围乱放的靠枕和布都是后面做声学调整的时候摆放的,对应下文【简易处理】的那次测试。
阳台门,材质为整块玻璃,始终关闭,外有窗帘。
功放音量调到70%的位置,尽量使皇帝位(麦克风位)的声压接近75分贝——这是个人经验,也是实测几家电影院的数值。
使用REW软件,点击第一个按钮Measure ,进行一次测试。 操作手法 上一个帖子已经有了图解,在此不重复发了。
测试的时候,人不要站在音响前面,不要说话哼歌跺脚咳嗽什么的,建议用无线鼠标, 离开听音区域,遥控开始测试,我是模拟两人听音的情况,我坐在第二人位置。
如果低音炮比较低端,建议起始频率从10Hz开始 不要从0或者1Hz开始,低端炮可能缺失保护电路 超低频可能会烧喇叭。
首先是 原始曲线与初步EQ后的曲线对比:
红线是原始曲线,绿线是EQ后的曲线, 可以看到,红色原始曲线从15Hz到70Hz的重低音范围,显著高于 120Hz之后的主箱频率,整体平滑后,可见整体高了月10分贝,而此时低音炮音量只开了一半,可见一个500瓦的15寸大炮还是很给力的。
在初步调了炮EQ之后 可以看到,低频的电瓶在40-80区间内,有大幅度的起伏,这是驻波引起的,这个频段的声音相当难处理,由于炮太大,自重大约50公斤,也懒得搬来搬去找合适的炮位,所以这个暂时没办法,只能以后再精细调整EQ了。
下图为做1/2的平滑后,看整体声压(除了特别注明,其余的频响曲线均为1/12的平滑)
下图为 EQ后,拉上窗帘 与 拉开窗帘露出玻璃的曲线。 绿线是刚才那个EQ后的曲线,蓝线是在绿线基础上,拉开了窗帘露出玻璃。(均为1/6 平滑)
可以看到,30Hz以下 由于玻璃发生了薄板共振,10-20Hz的声音反而被吸收掉了,而30Hz以上,由于反射增强,原来的37Hz,60Hz,85Hz 三个驻波峰值 尤其是60Hz这个最大的驻波 被显著加强了。
从230Hz到1.8K的频段,窗帘的吸音效果一般,有些频率吸了一点点,有些没吸,从1.8K到12K, 绿线比蓝线普遍低了大约1.5-2.5分贝 ,说明这个窗帘的吸音主要在1.8K-12K范围。 由于窗帘的位置在侧面,面积整体占的不大,所以效果虽然有一些,却起不到太大的作用。 但有总比没有好。
下图是进行简单声学处理之后(紫色曲线), 包括,用软包挡住墙角和部分墙面,拉了个布帘,改变前置的角度,让前置左右声道正对向皇帝位,而不是正对后墙。 改变炮位。几种处理:
可见,紫色的低频驻波更大了,显然炮位挪的不对.........OTZ .......... 然后 200Hz左右有个更深的深谷 说明挪动前置主箱之后,正好把驻波的波谷挪到了更靠近麦克风的位置,但是 后面2K-5K的区间,整体曲线显著下降,说明拉的那个帘子和几个软包起了作用 吸收了一部分低频。
然后,来看室内混响的RT60时间
就是声音在发出后 经过多长时间 能衰减60个分贝(基本就是衰减到不可闻),这个跟吸音系数有关 ,一般房间对高频吸收多,低频吸收少,所以高频很快就没声了,低频要很慢才消失。
如图, 拉开窗帘与原始的比,极低频因为被薄板共振吸收了一部分,所以衰减的比拉上窗帘快一些,大约提前0.088秒衰减完毕。 而由于玻璃反射高频,所以,高频要慢了0.07秒才衰减完。
低频RT60做到0.8秒以内,高频在0.5秒以内 ,个人认为看电影就基本合格了。 看来我的环境还是要再做一些吸音处理。
然后看一下瀑布图,分析一下衰减的情况 以及驻波。
跟上面一样,绿色是原始,紫色是简单声学处理。
可以看到,紫色的高频衰减的更快一些。
图上两色叠加,在某个频段,你看到的是绿色 说明在这个频段上 绿色覆盖了紫色,说明绿色的声压高 衰减慢。
整体来说 叠加图上除了低频有一部分是紫色, 这是因为调了炮位 反而不如原始炮位好, 其他大多数地方 都能看到绿色比较多,说明 整体上,做了简单室内声学处理之后,整体声音在室内吸收的更好,衰减的更快。
这个结果和刚才的RT60混响时间是可以互相印证的。
我把紫色的图 调整了角度, 大家可以看看 驻波的衰减曲线(红线)和正常的衰减曲线(浅绿线)的差别:
驻波在很长一段时间 是有很小衰减,在后续 也是慢慢衰减,而正常衰减的声音,则是一直降低的:
由这个方法 就能判断出皇帝位的驻波情况。从而在EQ上削峰填谷。
水平有限,只能做这么多比较常规的分析。 至于如相位对声场的影响,群延迟等更深层次的内容,我还没有太深入的研究。
文章主要是给大家做个参考, 比如 室内的频响起伏原来如此之大,峰谷之间差了10分贝以上的都有,而稍稍调节室内的环境,改改摆位,都能造成小到1-2分贝,大到4,5分贝的差异, 别忘了 差3分贝 等于输入功率差了一半, 这么巨大的差异,应当充分的重视, 尽量布置一个声学环境良好的房间,会大幅提升听音效果,这个才真的是 【一耳朵区别】。
本人原创,转载请注明作者。
1,如有可能还是应当使用声压计校准麦克风增益。
2,用EQ调炮,尽量削峰,不要填谷,如果炮的RMS功率不到400瓦,建议 不要大幅削峰,否则会拖累整体声压的。
3,自己听感是最终判断依据,不要为了调而调。 有人就喜欢混响长,轰隆隆久久不散的低频。
4,家庭影院,低音和人声是精髓所在。 低音靠炮,砸钱买个好炮即可; 而人声通常是一条单独声轨输送到中置箱子里,因此中置箱子的素质至关重要,
有种玩法甚至是单独使用双10寸大中置箱子配单路400瓦功放。 因为要想人声好,单元尺寸和功率非常重要, 一般建议 中置声道在功放的EQ中提升几个分贝的声压。
5,炮口径为王,功率要大,且必须要有截止频率调节,相位调节, 最好有12V触发和PEQ功能。
加载中,请稍候......
碰巧最近查过与此相关的问题,我觉得应该能一定程度上解释题主的疑惑。 要解释这个问题,我要隆重推出一个心理学领域很重要的定理:
(weber-fechner law): 在同类刺激之下,最小可觉差的大小是随着标准刺激强弱而成一定比例关系的最小可觉差…(11页) 问题描述与模型实现讲的很清晰。 至于背后的数学原理…
这里有两个问题。 首先是语音转文字技术 这项技术现在已经很成熟了,国外如iSpeech,Sphinx, Google Voice,国内如科大讯飞,云知声,都有现成的API可以使用。 再来就是时间尺度的对齐,在我看来这更像是一个UI的问题,画波形、调用语音识别API、将文字和…
本报济南11月4日讯(记者 马绍栋)歌尔声学日前公告,从10月30日起,由公司董事长兼任的总经理(CEO)一职改为聘请姜龙担任。2005年起即加入公司的姜龙实为董事长及实际控制人姜滨之弟,直接与间接持有约9500万股公司股份。从姜龙国外学习与工作的背景推测,歌尔声学国际化战略正不断升级。
姜龙为美国马里兰大学战略管理专业博士、中国人民大学企业管理专业硕士、清华大学材料科学与工程专业学士,此前任歌尔声学副董事长和执行副总经理。2005年,姜龙加入歌尔声学,历任公司副总经理、高级副总经理,分管公司市场、销售及运营等工作。在过去近十年的任职期间,姜龙凭借其海外的市场经验和全球化的文化视角,成功地帮助歌尔声学引进了苹果、谷歌、微软、亚马逊等重要大客户,令歌尔声学的合作伙伴跃升为世界顶级公司,在公司推行的大客户战略中起到了至关重要的作用。
此外,姜龙也是歌尔声学实际控制人姜滨之弟,直接持有上市公司6327.6万股股份,并通过控股股东潍坊歌尔集团有限公司间接持有上市公司 3185.6万股股份。
公司表示,聘任姜龙为CEO是公司推进国际化战略与优化公司治理结构的需要。近年来,公司国际化发展的成果显著,目前歌尔声学销售额的80%来自海外,客户涵盖了包括苹果、三星、索尼、微软等为代表的国际著名品牌。
伴随海外业务的扩张,歌尔声学在美、亚、欧三大洲均建立了产品销售和研发中心;在美国、韩国、瑞典、芬兰、日本等地皆有其设立的海外子公司。未来十年,面对全球庞大的市场机会,借助新任CEO姜龙丰富的海外工作和生活经历、国际化管理经验以及对海外文化的深刻理解,歌尔声学未来将持续升级国际化、品牌化的发展战略,旨在将其打造成声学领域的具有全球竞争力的高科技企业。日前,歌尔声学对世界著名音响品牌Dynaudio公司的收购更是表明歌尔声学战略转型的方向和决心。
DNN训练使用的CE准则是基于每一帧进行分类的优化,最小化帧错误率,但是实际上语音识别是一个序列分类的问题,更关心的是序列的准确性。所以引入SDT(sequence-discriminative training),训练准则更符合实际,有利于提升识别率。常用的准则包括MMI/BMMI、MPE、MBR等。
表示状态序列。物理意义可以理解为:分子表示准确结果对应路径的总得分(声学和语言),分母表示所有路径对应的得分总和(为了计算上的可操作性,实际用lattice简化表示)。模型参数的梯度可以表示如下:
表示softmax层的输入(没有做softmax运算),跟CE准则的不同体现在
,所以上式第一项可以简化为:
第二项可以进一步求导:
综合前面的第一项和第二项,可得:
表示DNN的第r个输出,
按照文章的推导应该得到这个结果,但是实际上分母还包含
,是不是做了近似认为分母是常量,这一步有疑问????
综合上面两部分,可以得到最终的公式:
相比于MMI,BMMI在分母上面增加了一个权重系数
之间准确率的度量,可以是word/phoneme/state级别的准确率。
越接近(错误的word越少),
这个权重越小,相反,权重会越大,增加了数据的困惑度。
通过可以推导出误差信号:
MBR(minimum Bayes risk)的目标函数是最小化各种粒度指标的错误,比如MPE是最小化phone级别的错误,sMBR最小化状态的错误。目标函数如下:
表示两个序列之间的差异,MPE就是正确的phone的个数,sMBR是指正确的state的个数。求导可得:
对于MPE,参考文献[4]:
首先将JMBR(θ;om,sm)分子分母求和部分分为两块,r∈sw和r?sw
,那么导数满足以下关系:
上面的等式可以简化为以下形式:
第二项表示lattice中所有路径的平均准确率
第三项表示lattice中所有经过r的路径的平均准确率,是
的均值,可以将三个三项合并起来进行还原就很容易里面均值的含义。
第二部分和MMI的一致
区分性训练时生成高质量的lattice很重要,需要使用最好的模型来生成对应的lattice,并且作为seed model。
如果lattice产生的不合理的话,会导致计算出来的梯度异常,比如分子的标注路径没有在分母中的lattice出现,这种情况对于silience帧尤其常见,因为silience经常出现在分子的lattice,但是很容易被分母的lattice忽略。有一些方法可以解决这种问题:
sMBR效果相比其他会好一点,MMI比较容易理解和实现。
NCE可以用于加速训练