Multimedia Applications of the Wavelet Transform

Multimedia Applications of the Wavelet Transform Inauguraldissertation zur Erlangung des akademischen Grades eines Doktors der Naturwissenschaften der Universität Mannheim vorgelegt von Dipl. Math. oec.
Multimedia Applications of the Wavelet Transform Inauguraldissertation zur Erlangung des akademischen Grades eines Doktors der Naturwissenschaften der Universität Mannheim vorgelegt von Dipl. Math. oec. Claudia Kerstin Schremmer aus Detmold Mannheim, 2001 Dekan: Referent: Korreferent: Professor Dr. Herbert Popp, Universität Mannheim Professor Dr. Wolfgang Effelsberg, Universität Mannheim Professor Dr. Gabriele Steidl, Universität Mannheim Tag der mündlichen Prüfung: 08. Februar 2002 If we knew what we were doing, it would not be called research, would it? Albert Einstein Abstract This dissertation investigates novel applications of the wavelet transform in the analysis and compression of audio, still images, and video. In a second focal point, we evaluate the didactic potential of multimedia enhanced teaching material for higher education. Most recently, some theoretical surveys have been published on the potential for a wavelet based restoration of noisy audio signals. Based on these, we have developed a wavelet based denoising program for audio signals that allows flexible parameter settings. It is suited for the demonstration of the potential of wavelet based denoising algorithms as well as for use in teaching. The multiscale property of the wavelet transform can successfully be exploited for the detection of semantic structures in still images. For example, a comparison of the coefficients in the transformed domain allows the analysis and extraction of a predominant structure. This idea forms the basis of our semiautomatic edge detection algorithm that was developed during the present work. A number of empirical evaluations of potential parameter settings for the convolution based wavelet transform and the resulting recommendations follow. In the context of the teleteaching project Virtuelle Hochschule Oberrhein, i.e., Virtual University of the Upper Rhine Valley (VIROR), which aims to establish a semi virtual university, many lectures and seminars were transmitted between remote locations. We thus encountered the problem of scalability of a video stream for different access bandwidths in the Internet. A substantial contribution of this dissertation is the introduction of the wavelet transform into hierarchical video coding and the recommendation of parameter settings based on empirical surveys. Furthermore, a prototype implementation of a hierarchical client server video program proves the principal feasibility of a wavelet based, nearly arbitrarily scalable application. Mathematical transformations of digital signals constitute a commonly underestimated problem for students in their first semesters of study. Motivated by the VIROR project, we spent a considerable amount of time and effort on the exploration of approaches to enhance mathematical topics with multimedia; both the technical design and the didactic integration into the curriculum are discussed. In a large field trial on traditional teaching versus multimedia enhanced teaching, in which the students were assigned to different learning settings, not only the motivation, but the objective knowledge gained by the students was measured. This allows us to objectively rate positive the efficiency of the teaching modules developed in the scope of this dissertation. II ABSTRACT Kurzfassung Die vorliegende Dissertation untersucht neue Einsatzmöglichkeiten der Wavelet Transformation für die Analyse und Kompression der multimedialen Anwendungen Audio, Standbild und Video. In einem weiteren Schwerpunkt evaluieren wir das didaktische Potential multimedial angereicherten Lehrmaterials für die universitäre Lehre. In jüngster Zeit sind einige theoretische Arbeiten über Wavelet basierte Restaurationsverfahren von verrauschten Audiosignalen veröffentlicht worden. Hierauf aufbauend haben wir ein Wavelet basiertes Entrauschungsprogramm für Audiosignale entwickelt. Es erlaubt eine sehr flexible Auswahl von Parametern, und eignet sich daher sowohl zur Demonstration der Mächtigkeit Wavelet basierter Entrauschungsansätze, als auch zum Einsatz in der Lehre. Die Multiskaleneigenschaft der Wavelet Transformation kann bei der Standbildanalyse erfolgreich genutzt werden, um semantische Strukturen eines Bildes zu erkennen. So erlaubt ein Vergleich der Koeffizienten im transformierten Raum die Analyse und Extraktion einer vorherrschenden Struktur. Diese Idee liegt unserem im Zuge der vorliegenden Arbeit entstandenen halbautomatischen Kantensegmentierungsalgorithmus zugrunde. Eine Reihe empirischer Evaluationen über mögliche Parametereinstellungen der Faltungs basierten Wavelet Transformation mit daraus resultierenden Empfehlungen schließen sich an. Im Zusammenhang mit dem Teleteaching Projekt Virtuelle Hochschule Oberrhein (VIROR), das den Aufbau einer semi virtuellen Universität verfolgt, werden viele Vorlesungen und Seminare zwischen entfernten Orten übertragen. Dabei stießen wir auf das Problem der Skalierbarkeit von Videoströmen für unterschiedliche Zugangsbandbreiten im Internet. Ein wichtiger Beitrag dieser Dissertation ist, die Möglichkeiten der Wavelet Transformation für die hierarchische Videokodierung aufzuzeigen und durch empirische Studien belegte Parameterempfehlungen auszusprechen. Eine prototypische Implementierung einer hierarchischen Client Server Videoanwendung beweist zudem die prinzipielle Realisierbarkeit einer Wavelet basierten, fast beliebig skalierbaren Anwendung. Mathematische Transformationen digitaler Signale stellen für Studierende der Anfangssemester eine häufig unterschätzte Schwierigkeit dar. Angeregt durch das VIROR Projekt setzen wir uns in einem weiteren Teil dieser Dissertation mit den Möglichkeiten einer multimedialen Aufbereitung mathematischer Sachverhalte auseinander; sowohl die technische Gestaltung als auch eine didaktische Integration in den Unterrichtsbetrieb werden erörtert. In einem groß angelegten Feldversuch Traditionelle Lehre versus Multimedia gestützte Lehre wurden nicht nur die Motivation, sondern auch der objektive Lernerfolg von Studierenden gemessen, die unterschiedlichen Lernszenarien zugeordnet waren. Dies erlaubt eine objektive positive Bewertung der Effizienz der im Rahmen dieser Dissertation entstandenen Lehrmodule. IV KURZFASSUNG A few words......of acknowledgment usually are placed at this location. And I also wish to express my gratitude to all those who contributed to the formation of this dissertation. The presented work took shape during my employment as a research assistant in the teleteaching project VIROR and at the Department Praktische Informatik IV, where Prof. Dr. Wolfgang Effelsberg accepted me into his research group on multimedia techniques and computer networks. In this team, I encountered a delightful job surrounding where cooperation, commitment, and freedom of thought were lived and breathed. Prof. Effelsberg not only was my intellectual mentor for this work, he also actively used the teaching modules which were developed during my job title in his lectures. The feedback of the students facilitated their steady improvement. By the way, Prof. Effelsberg was my test subject for both the digital teaching video and the lecture which was stacked up against it for the evaluation introduced in Part III of this work. I am heartily obliged to him for my initiation into the world of science, for tips and clues which have influenced the theme of this work, and for his unfailing support. Prof. Dr. Gabriele Steidl deserves many thanks for having overtaken the co advising. I am beholden to my colleagues Stefan Richter, Jürgen Vogel, Martin Mauve, Nicolai Scheele, Jörg Widmer, Volker Hilt, Dirk Farin, and Christian Liebig, as well as to the alumni Werner Geyer and Oliver Schuster for their offers of help in the controversy with my ideas. Be it through precise thematic advice and discussions or through small joint projects which led to common contributions to scientific conferences. Most notably, I want to show my gratitude to Christoph Kuhmünch, Gerald Kühne, and Thomas Haenselmann, who exchanged many ideas with me in form and content and thus facilitated their final transcription. Christoph Kuhmünch and Gert jan Los sacrificed a share of their week ends to cross read my manuscript, to find redundancies and to debug unclear passages. Our system administrator Walter Müller managed the almost flawlessly smooth functioning of the computer systems and our more than unusual secretary Betty Haire Weyerer thoroughly and critically read through my publications in the English language, including the present one, and corrected my Genglish, i.e., German English expressions. I particularly enjoyed the coaching of Studienarbeiten, i.e., students implementation work, and diploma theses. Among them, I want to name my very first student, Corinna Dietrich, with whom I grew at the task; Holger Wons, Susanne Krabbe, and Christoph Esser signed as contract students at our department after finishing their task it seems that they had enjoyed it; Sonja Meyer, Timo Müller, Andreas Prassas, Julia Schneider, and Tillmann Schulz helped me to explore different aspects of signal processing, even if not all of their work was related to the presented topic. I owe appreciation to my diploma students Florian Bömers, Uwe Bosecker, Holger Füßler, and Alexander Holzinger for their thorough exploration of and work on facets of the wavelet theory which fit well into the overall picture VI A FEW WORDS... of the presented work. They all contributed to my dissertation with their questions and encouragement, with their implementations and suggestions. The project VIROR permitted me to get in contact with the department Erziehungswissenschaft II of the University of Mannheim. I appreciated this interdisciplinary cooperation especially on a personal level, and it most probably is this climate on a personal niveau which allowed us to cooperate so well scientifically. Here I want to especially thank Holger Horz, and I wish him all the best for his own dissertation project. In some periods of the formation process of this work, I needed encouraging words more than technical input. Therefore, I want to express my gratitude to my parents, my sister, and my friends for their trust in my abilities and their appeals to my self assertiveness. My mother, who always reminded me that there is more to life than work, and my father, who exemplified how to question the circumstances and to believe that rules need not always be unchangeable. That the presented work was started, let alone pushed through and completed, is due to Peter Kappelmann, who gives me so much more than a simple life companionship. He makes my life colorful and exciting. This work is dedicated to him. Claudia Schremmer Ein paar Worte......des Dankes stehen üblicherweise an dieser Stelle. Und auch ich möchte all denen, die mir in irgendeiner Weise bei der Erstellung dieser Arbeit behilflich waren, meine Verbundenheit ausdrücken. Die vorliegende Arbeit entstand während meiner Tätigkeit als wissenschaftliche Mitarbeiterin in Teleteaching Projekt VIROR und am Lehrstuhl für Praktische Informatik IV der Universität Mannheim, an den mich Herr Prof. Dr. Wolfgang Effelsberg in seine Forschungsgruppe zu Multimediatechnik und Rechnernetzen aufgenommen hat. Dort habe ich ein sehr angenehmes Arbeitsumfeld gefunden, in dem Kooperation, Engagement und geistige Freiheit vorgelebt werden. Er war nicht nur mein geistiger Mentor dieser Arbeit, er hat auch die Lehrmodule, die während meiner Arbeit entstanden, aktiv in der Lehre eingesetzt und es mir dadurch ermöglicht, Rückmeldungen der Studierenden zu berücksichtigen. Ganz nebenbei war Herr Prof. Effelsberg auch meine Versuchsperson sowohl für das digitale Lehrvideo als auch für die vergleichende Vorlesung der Evaluation, die in Teil III dieser Arbeit vorgestellt wird. Ich bedanke mich sehr herzlich bei ihm für die Einführung in die Welt der Wissenschaft, für Hinweise und Denkanstöße, die die Thematik dieser Arbeit beeinflussten, und für das Wissen um jeglichen Rückhalt. Frau Prof. Dr. Gabriele Steidl danke ich herzlich für die Übernahme des Korreferats. Meinen Kollegen Stefan Richter, Jürgen Vogel, Martin Mauve, Nicolai Scheele, Jörg Widmer, Volker Hilt, Dirk Farin und Christian Liebig sowie auch den Ehemaligen Werner Geyer und Oliver Schuster danke ich für ihr Entgegenkommen, mir die Auseinandersetzung mit meinen Ideen zu ermöglichen. Vor allem möchte ich mich bedanken bei Christoph Kuhmünch, Gerald Kühne und Thomas Haenselmann, mit denen ich viele inhaltliche Ideen ausgetauscht habe, und die mir das Niederschreiben derselben erleichtert haben. Sei es durch konkrete thematische Ratschläge und Diskussionen oder durch kleine gemeinsame Projekte, die zu gemeinsamen Beiträgen an wissenschaftlichen Konferenzen führten. Christoph Kuhmünch und Gert jan Los haben ein gut Teil ihrer Wochenenden geopfert, um mein Manuskript gegenzulesen, Redundanzen zu finden und Unklarheiten zu beseitigen. Unserem Systemadministrator Walter Müller, der sich für das fast immer reibungslose Funktionieren der Systeme verantwortlich zeichnet, und unserer mehr als ungewöhnlichen Sekretärin Betty Haire Weyerer, die mir alle meine englisch sprachigen Publikationen, inklusive der vorliegenden Arbeit, kritisch durchgesehen hat, gehört an dieser Stelle mein Dank. Selbst wenn die Aussage meiner Sätze nicht geändert wurde, waren die Artikel nach ihrer Durchsicht einfach besser lesbar. Besonderen Spaß hat mir die Betreuung von Studienarbeiten und Diplomarbeiten gemacht. Dazu zählen: meine erste Studienarbeiterin Corinna Dietrich, mit der zusammen ich an dieser Betreuungsaufgabe gewachsen bin; Holger Wons, Susanne Krabbe und Christoph Esser, die jeweils nach dem Ende ihrer Studienarbeit an unserem Lehrstuhl als HiWi gearbeitet haben es scheint ih- VIII EIN PAAR WORTE... nen Spaß gemacht zu haben; Sonja Meyer, Timo Müller, Andreas Prassas, Julia Schneider und Tillmann Schulz, die mir geholfen haben, unterschiedliche Aspekte der Signalverarbeitung zu explorieren, selbst wenn nicht alle Arbeiten mit der hier vorgestellten Thematik verbunden waren. Meinen Diplomarbeitern Florian Bömers, Uwe Bosecker, Holger Füßler und Alexander Holzinger gehört ein herzliches Dankeschön für ihre gründliche Einarbeitung in und Aufarbeitung von Teilaspekten der Wavelet Theorie, die zusammen sich in das Gesamtbild der vorliegenden Arbeit fügen. Sie alle haben mit ihren Fragen und Anregungen, mit ihren Programmiertätigkeiten und Vorschlägen zum Gelingen dieser Arbeit beigetragen. Durch das Projekt VIROR habe ich Kontakt knüpfen dürfen zum Lehrstuhl für Erziehungswissenschaft II der Universität Mannheim. Diese interdisziplinäre Zusammenarbeit hat vor allem auf dem persönlichen Niveau sehr viel Spaß gemacht, und vermutlich war es auch das persönlich gute Klima, das uns hat wissenschaftlich so gut kooperieren lassen. An dieser Stelle spreche ich Holger Horz meinen ausdrücklichen Dank aus und wünsche ihm alles Gute bei seinem eigenen Dissertationsprojekt. An einigen Punkten in der Entstehungsgeschichte dieser Arbeit habe ich aufmunternde Worte mehr gebraucht als fachlichen Input. Darum möchte ich an dieser Stelle meinen Eltern, meiner Schwester und meinen Freunden Dank sagen für das Zutrauen in meine Fähigkeiten und den Appell an mein Durchsetzungsvermögen. Meine Mutter, die mich stets daran erinnert hat, daß es mehr gibt als Arbeit, mein Vater, der mir als Freigeist vorgelebt hat, Dinge zu hinterfragen und nicht an ein unveränderbares Regelwerk zu glauben. Daß die vorliegende Arbeit aber überhaupt begonnen, geschweige denn durch und zu Ende geführt wurde, liegt an Peter Kappelmann, der mir so viel mehr gibt als eine einfache Lebensgemeinschaft. Er macht mein Leben bunt und aufregend. Ihm ist diese Arbeit gewidmet. Claudia Schremmer Table of Contents List of Figures xix List of Tables xxii Notation xxiii 0 Introduction 1 I Wavelet Theory and Practice 5 1 Wavelets Introduction Historic Outline TheWaveletTransform Definition and Basic Properties SampleWavelets IntegralWaveletTransform Wavelet Bases Time FrequencyResolution Heisenberg suncertaintyprinciple Properties of the Short time Fourier Transform Properties of the Wavelet Transform X TABLE OF CONTENTS 1.5 SamplingGridoftheWaveletTransform Multiscale Analysis Approximation Detail SummaryandInterpretation FastWaveletTransform Transformation Based on the Haar Wavelet Filter Banks Introduction Ideal Filters Ideal Low pass Filter Ideal High pass Filter Two Channel Filter Bank Design of Analysis and Synthesis Filters Quadrature Mirror Filter (QMF) Conjugate Quadrature Filter(CQF) Practical Considerations for the Use of Wavelets Introduction Wavelets in Multiple Dimensions Nonseparability Separability Signal Boundary CircularConvolution PaddingPolicies IterationBehavior Painting the Time scale Domain Normalization... 48 TABLE OF CONTENTS XI GrowingSpatialRagewithPadding Representation of Synthesis in progress Lifting II Application of Wavelets in Multimedia 57 4 Multimedia Fundamentals Introduction Data Compression Nyquist Sampling Rate Digital Audio Denoising Introduction StandardDenoisingTechniques NoiseDetection NoiseRemoval NoiseReductionwithWavelets WaveletTransformofaNoisyAudioSignal Orthogonal Wavelet Transform and Thresholding Nonorthogonal Wavelet Transform and Thresholding DeterminationoftheThreshold Implementation of a Wavelet based Audio Denoiser Framework NoiseReduction EmpiricalEvaluation Still Images Introduction Wavelet based Semiautomatic Segmentation XII TABLE OF CONTENTS Fundamentals A Wavelet based Algorithm Implementation ExperimentalResults EmpiricalParameterEvaluationforImageCoding GeneralSetup Boundary Policies Choice of Orthogonal Daubechies Wavelet Filter Bank Decomposition Strategies Conclusion FiguresandTablesofReference Regions of interest Coding in JPEG JPEG2000 The Standard Regions of interest Qualitative Remarks Hierarchical Video Coding Introduction VideoScalingTechniques TemporalScaling SpatialScaling Quality Metrics for Video VisionModels Video Metrics EmpiricalEvaluationofHierarchicalVideoCodingSchemes Implementation ExperimentalSetup Results TABLE OF CONTENTS XIII Conclusion LayeredWaveletCodingPolicies LayeringPolicies TestSetup Results Conclusion Hierarchical Video Coding with Motion JPEG Implementation ExperimentalSetup Results Conclusion III Interactive Learning Tools for Signal Processing Algorithms Didactic Concept Introduction TheLearningCycleinDistanceEducation Conceptualization Construction Dialog Java Applets Illustrating Mathematical Transformations Introduction Still Image Segmentation TechnicalBasis LearningGoal Implementation One dimensionaldiscretecosinetransform TechnicalBasis XIV TABLE OF CONTENTS LearningGoal Implementation Two dimensional Discrete Cosine Transform TechnicalBasis LearningGoal Implementation Wavelet Transform: Multiscale Analysis and Convolution TechnicalBasis LearningGoal Implementation Wavelet Transform and JPEG2000 on Still Images TechnicalBasis LearningGoal Implementation Feedback Empirical Evaluation of Interactive Media in Teaching Introduction TestSetup Learning Setting Hypotheses Results DescriptiveStatistics AnalysisofVariance Conclusion and Outlook 179 TABLE OF CONTENTS XV IV Appendix 181 A Original Documents of the Evaluation 183 A.1 Computer based Learning Setting A.1.1 Setting: Exploration A.1.2 Setting: Script A.1.3 Setting: Version A.1.4 Setting: c t Article A.2 KnowledgeTests A.2.1 PreliminaryTest A.2.2 Follow uptest A.2.3 SampleSolutions A.3 QuotationsoftheStudents XVI TABLE OF CONTENTS List of Figures 1.1 Samplewavelets The Mexican hat wavelet and two of its dilates and translates, including the normalizationfactor Time frequency resolution of the short time Fourier transform and the wavelet transform Sampling grids of the short time Fourier and the dyadic wavelet transforms Multiscale an
