رسالة جامعية

Wavelet-based spatial audio framework : from ambisonics to wavelets: a novel approach to spatial audio

التفاصيل البيبلوغرافية
العنوان: Wavelet-based spatial audio framework : from ambisonics to wavelets: a novel approach to spatial audio
المؤلفون: Scaini, Davide
المساهمون: University/Department: Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
مرشدي الرسالة: Arteaga Barriel, Daniel, Baeza-Yates, Ricardo
المصدر: TDX (Tesis Doctorals en Xarxa)
بيانات النشر: Universitat Pompeu Fabra, 2019.
سنة النشر: 2019
وصف مادي: 180 p.
مصطلحات موضوعية: Wavelets, Ambisonics, Lifting scheme, Wavelet optimization, Ambisonics decoding, Spatial audio, Spherical audio format, Spatial downsampling, Decoding to speakers, Ondetes, Optimització de ondetes, Decodificació d'ambisonics, Àudio espacial, Format d'àudio esfèric, Mostreig espacial, Descodificació a altaveus
الوصف: Ambisonics is a complete theory for spatial audio whose building blocks are the spherical harmonics. Some of the drawbacks of low order Ambisonics, like poor source directivity and small sweet-spot, are directly related to the properties of spherical harmonics. In this thesis we illustrate a novel spatial audio framework similar in spirit to Ambisonics that replaces the spherical harmonics by an alternative set of functions with compact support: the spherical wavelets. We develop a complete audio chain from encoding to decoding, using discrete spherical wavelets built on a multiresolution mesh. We show how the wavelet family and the decoding matrices to loudspeakers can be generated via numerical optimization. In particular, we present a decoding algorithm optimizing acoustic and psychoacoustic parameters that can generate decoding matrices to irregular layouts for both Ambisonics and the new wavelet format. This audio workflow is directly compared with Ambisonics.
الوصف (مترجم): Ambisonics és una teoria completa d’àudio espacial construïda a partir dels harmònics esfèrics. Alguns dels inconvenients d'Ambisonics de baix ordre, com ara una localització pobra i una àrea petita d’escolta òptima, estan directament relacionats amb les propietats dels harmònics esfèrics. En aquesta tesi presentem un nou formalisme d’àudio espacial basat en Ambisonics substituint però els harmònics esfèrics per les ondetes esfèriques. Desenvolupem una cadena d’àudio completa, des de la codificació fins a la descodificació, a través de l'ús de ondetes discretes construïdes en una malla de multirresolució. Mostrem com es pot generar la família de ondetes i les matrius de descodificació a altaveus mitjançant una optimització numèrica. Presentem un algorisme de descodificació que pot generar matrius de descodificació a conjunts irregulars d'altaveus tant per a Ambisonics com per al nou format basat en ondetes. Finalment, comparem aquest nou formalisme d’àudio amb Ambisonics.
Programa de doctorat en Tecnologies de la Informació i les Comunicacions
نوع الوثيقة: Dissertation/Thesis
وصف الملف: application/pdf
اللغة: English
URL الوصول: http://hdl.handle.net/10803/668214
حقوق: ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
رقم الأكسشن: edstdx.10803.668214
قاعدة البيانات: TDX